久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當前的位置: 首頁 > 新聞 > 其他

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

來源:量子位   編輯:非小米 時間:2024-04-30 16:18人閱讀

一夜之間,大模型話題王,再次易主。

一個神秘模型突然殺入眾人視野,能力超越一眾開源模型,甚至包括GPT-4。幾乎所有人都在談論它,服務器都被擠爆了。

它就是“gpt2-chatbot”。

(注意啊,是gpt2不是GPT-2)

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

它有多強?

IMO國際數(shù)學奧林匹克競賽的題目,一次答對。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

一次在PyOpenGL中生成旋轉(zhuǎn)3D立方體。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

直接輸出如下結(jié)果:

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

在GPT-4標志性能力“畫獨角獸”上,還能輕松秒殺LLaMA-3-70B(左)。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

推理方面更是表現(xiàn)出了驚艷效果,常見邏輯陷阱可以輕松繞過,而且回答時還帶有合適的語氣。

提問:1公斤羽毛和1公斤鉛塊,哪個更重?

回答:一公斤羽毛和一公斤鉛的重量是一樣的——它們都是一公斤。兩者之間的關(guān)鍵區(qū)別在于它們的體積和密度:一公斤的羽毛會占據(jù)更多的空間,看起來更大,而一公斤的鉛會緊湊而小。這通常會導致一個經(jīng)典的問題,但就重量而言,一公斤就是一公斤!

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

如此好的表現(xiàn),但是又沒明說身份……

這不是更讓大伙興奮了!

難道是傳說中的GPT-4.5?

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

要知道,名震江湖的AlphaGo就曾使用“Master”化名在網(wǎng)上大殺四方,轟動圍棋界。這回的gpt2-chatbot,也有這感覺了。

而且名字上也很值得深究,gpt2更像是gpt2.0,似乎是ChatGPT層級的版本迭代。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

奧特曼看熱鬧不嫌事大,還發(fā)帖說:我確實對gpt2情有獨鐘。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

現(xiàn)在,隨著沖去試玩的人還在不斷增加,試玩限制也在加大。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

具體咋樣?我們已經(jīng)上手實測。

中文能力也很到位

如果想親手測試這只神秘AI,目前唯一已知方式是在LMSYS大模型競技場。

首先打開競技場網(wǎng)頁,進入Direct Chat,就可以在模型選項里找到gpt2-chatbot。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

要注意每人每天有8條消息的限制,全局也有每小時3000條消息的限制,所以測試機會非常有限。

如果看到下面的錯誤提示,就只能去競技場排位模式看運氣能不能匹配到它了。

只要抓到它一次,就可以繼續(xù)多輪對話。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

在短暫的測試中,我們發(fā)現(xiàn)gpt2-chatbot中文能力也很到位。

只要問題是中文的,無需特別強調(diào)就可以默認用中文回答,至少可以排除是Llama 3微調(diào)了。

針對一個充滿誤導的經(jīng)典問題,可以看出gpt2-chatbot的回答條理分明,仿佛自帶CoT思維鏈提示(“讓我們一步一步地想”),識別出了所有陷阱。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

并且準確提供了非常細節(jié)的知識,如北京到青島距離、男子女子跳遠世界紀錄、農(nóng)夫山泉在國內(nèi)的價格等。

而大多數(shù)其他AI模型,最多只能模糊的判斷出15米超出人類能力,或按美元算礦泉水價格。

那么這只超強神秘AI到底是何方神圣,我們也用破解GPTs的祖?zhèn)魇炙嚒翱絾枴绷艘话选?/p>

OpenAI開發(fā)的GPT系列聊天機器人,那么系統(tǒng)提示詞的開頭不出意外應該是“You are ChatGPT……”,但為了防止它看到“ChatGPT”一詞后產(chǎn)生幻覺,我們在問題中把ChatGPT去掉。

清除所有上下文信息,再讓它復述“前面的單詞”,就會出現(xiàn)系統(tǒng)提示詞了。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

果然,它自曝是由OpenAI訓練的大模型,基于GPT-4架構(gòu),還可以接受圖像輸入。最關(guān)鍵一點在最后一部分“人格:v2”。

并且gpt2-chatbot對這一問題的回答,在不同時間不同地點嘗試都是一致的。

另外如果嘗試讓它重復Claude系列以“The assistant is”開頭的系統(tǒng)提示詞,它也不會上當,會在開頭后面重復一遍完整的問題。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎
△這樣答也不算錯

雖然就算這樣也不能排除是幻覺的可能性,或非GPT模型使用了ChatGPT生成的數(shù)據(jù)微調(diào),但至少是穩(wěn)定的。

神秘AI身份的幾種主流猜測

有網(wǎng)友組織了更詳細的測試,有如下發(fā)現(xiàn):

它使用OpenAI的tokenizer,對OpenAI使用的特殊token有反應,且對Claude/Llama/Gemini使用的特殊token沒有影響。

當咨詢緊急情況/法律相關(guān)問題時,它會給出OpenAI的聯(lián)系方式。

針對OpenAI模型的提示詞注入攻擊有效,且它從未聲稱自己來自O(shè)penAI之外的組織。

……

基于以上種種信息,不少人猜測它就是匿名發(fā)布的GPT-4.5,或GPT-4原始版本經(jīng)過不同的對齊訓練。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

不過也有跡象表明,它可能是LMSYS組織基于2019年的GPT-2架構(gòu)訓練的模型。

理由為最近發(fā)表的一篇論文聲稱,GPT-2在某些情況下比多個現(xiàn)代模型能力更強。并且這篇論文的作者之一與LMSYS的贊助商MBZUAI(阿聯(lián)酋人工智能大學)相關(guān)。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

假設(shè)它確實是古老的GPT-2架構(gòu)(只有1.5B參數(shù)),也有人懷疑可能是結(jié)合了OpenAI守口如瓶的Q*技術(shù)。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

最后一種猜測(狗頭)便是失蹤的OpenAI首席科學家Ilya Sutskever藏在里面了。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

最后,面對神秘新模型攪起來的種種風波,奧特曼本人還被發(fā)現(xiàn)來攪渾水,修改了他的推文細節(jié)。

這樣一下子,是OpenAI匿名發(fā)布新模型炒作的可能性更大了一些。

神秘大模型一夜刷屏!能力太強被疑GPT-4.5:奧特曼直打啞謎

試玩地址:https://chat.lmsys.org/

參考鏈接:[1]https://twitter.com/i/trending/1785009023609397580[2]https://rentry.org/gpt2

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

標簽: 大模型 ChatGPT

相關(guān)文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
亚洲欧美日韩精品在线| 欧美精品日韩三级| 欧美三级不卡| 亚洲视频视频在线| 宅男噜噜噜66一区二区| 欧美视频国产精品| 亚洲欧美激情一区| 亚洲你懂的在线视频| 国产一区二区三区四区hd| 久久久www成人免费精品| 久久精品人人做人人爽电影蜜月| 激情欧美亚洲| 亚洲国产一区在线观看| 欧美日韩一区在线播放| 午夜欧美视频| 久久亚洲视频| 亚洲视频在线观看免费| 亚洲综合好骚| 亚洲国产婷婷| 一区二区三区免费观看| 韩国三级电影久久久久久| 欧美激情第六页| 国产精品卡一卡二| 欧美日本国产视频| 午夜在线一区| 老鸭窝毛片一区二区三区| 亚洲网站视频| 久久久国产精品亚洲一区| 一本高清dvd不卡在线观看| 亚洲永久免费av| 亚洲第一精品夜夜躁人人爽| 一区二区三区免费网站| 亚洲国产精品激情在线观看 | 欧美视频在线观看一区| 欧美一区二区三区久久精品| 麻豆久久婷婷| 性感少妇一区| 欧美激情在线狂野欧美精品| 久久精品久久99精品久久| 欧美精品免费在线观看| 久久婷婷国产综合尤物精品 | 亚洲视频电影图片偷拍一区| 激情婷婷欧美| 亚洲香蕉在线观看| 亚洲美洲欧洲综合国产一区| 欧美在线视频二区| 亚洲一线二线三线久久久| 久热精品视频在线| 久久久久久尹人网香蕉| 国产精品成人在线观看| 亚洲国产日韩在线一区模特| 狠狠爱www人成狠狠爱综合网| 中国女人久久久| 99成人在线| 欧美黄色网络| 欧美激情视频一区二区三区免费| 国语精品中文字幕| 先锋影音国产精品| 午夜精彩视频在线观看不卡 | 国产精品永久免费在线| 亚洲欧美成人网| 欧美久久99| 亚洲国产毛片完整版 | 欧美阿v一级看视频| 麻豆av福利av久久av| 国产一区久久久| 午夜精品国产更新| 欧美在线观看网站| 国产午夜精品理论片a级大结局 | 久久国产欧美| 久久亚洲二区| 伊人久久综合| 久久婷婷国产综合国色天香| 免费一级欧美片在线观看| 一区二区三区在线高清| 久久资源在线| 亚洲国产高清一区二区三区| 亚洲日韩欧美一区二区在线| 欧美激情欧美激情在线五月| 日韩视频不卡| 午夜久久一区| 红桃视频欧美| 欧美高清一区| aa亚洲婷婷| 欧美影院成人| 亚洲承认在线| 欧美日韩免费高清| 亚洲欧美激情视频| 久久综合激情| 日韩一级黄色av| 国产精品三级视频| 久久夜色精品国产| 亚洲级视频在线观看免费1级| 在线亚洲精品福利网址导航| 国产精品视频观看| 久久久久久国产精品mv| 国产精品高清一区二区三区| 午夜亚洲精品| 最新亚洲一区| 欧美在线视频a| 91久久国产综合久久91精品网站| 欧美女同视频| 久久成人免费| 99re6这里只有精品| 久久精品麻豆| 一本色道久久88精品综合| 国产精品自拍三区| 欧美激情精品久久久久久蜜臀| 亚洲视频999| 欧美激情一区二区三区四区| 亚洲欧美日韩精品久久奇米色影视| 激情偷拍久久| 国产精品久久久一区麻豆最新章节| 久久免费黄色| 亚洲在线免费| 亚洲精品乱码久久久久久黑人 | 韩国精品在线观看| 欧美日韩一区二区国产| 久久精品视频亚洲| 亚洲永久精品大片| 日韩亚洲欧美一区二区三区| 久久久7777| 欧美一区二区三区男人的天堂| 亚洲三级免费| 免费久久99精品国产自| 欧美成人免费全部观看天天性色| 亚洲午夜性刺激影院| 亚洲狼人精品一区二区三区| 激情婷婷久久| 国产自产精品| 国产日韩欧美精品一区| 欧美系列精品| 欧美日韩天堂| 欧美人在线视频| 在线精品视频一区二区| 国产一区二区三区不卡在线观看 | 欧美中文字幕在线观看| 亚洲午夜免费福利视频| 亚洲精品永久免费| 欧美激情一区三区| 欧美电影在线播放| 欧美77777| 欧美va天堂在线| 免费亚洲电影在线观看| 久久尤物视频| 美女视频网站黄色亚洲| 久久久亚洲人| 美国成人直播| 欧美黄色免费| 亚洲日本免费电影| 亚洲欧洲久久| 亚洲伦理在线免费看| 一区二区三区欧美视频| 亚洲一区综合| 午夜精品福利一区二区蜜股av| 午夜精品久久久久久久久| 欧美影视一区| 老司机67194精品线观看| 裸体歌舞表演一区二区| 欧美国产91| 欧美成人免费一级人片100| 欧美成人精品一区二区| 欧美激情精品久久久久久免费印度| 欧美激情偷拍| 一本一本大道香蕉久在线精品| 夜夜嗨av一区二区三区网页| 亚洲在线成人精品| 久久精品一本久久99精品| 老鸭窝亚洲一区二区三区| 欧美日韩一区不卡| 国产精品尤物| 亚洲电影在线免费观看| 一本久久a久久免费精品不卡| 亚洲欧美日韩国产一区二区| 久久亚洲精品一区| 亚洲国产精品毛片| 亚洲欧美99| 噜噜噜躁狠狠躁狠狠精品视频| 欧美日韩一区在线观看视频| 国产亚洲成av人在线观看导航 | 狠狠色丁香久久婷婷综合丁香 | 亚洲日本中文字幕| 欧美一区在线看| 亚洲高清免费视频| 亚洲在线观看视频| 蜜臀va亚洲va欧美va天堂| 国产精品xxxxx| 在线成人性视频| 亚洲一区在线观看视频| 欧美大片在线看免费观看| 亚洲先锋成人| 欧美精品aa| 影音先锋亚洲一区| 亚洲欧美日韩国产| 亚洲国产精品一区在线观看不卡| 午夜精品av| 欧美日韩精品二区第二页| 欧美一区二区在线看| 亚洲国产精品久久91精品| 午夜视频久久久|