久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當(dāng)前的位置: 首頁 > 新聞 > 其他

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

來源:量子位   編輯:非小米 時間:2024-05-06 09:06人閱讀

AI做數(shù)學(xué)題,真正的思考居然是暗中“心算”的?

紐約大學(xué)團隊新研究發(fā)現(xiàn),即使不讓AI寫步驟,全用無意義的“……”代替,在一些復(fù)雜任務(wù)上的表現(xiàn)也能大幅提升!

一作Jacab Pfau表示:只要花費算力生成額外token就能帶來優(yōu)勢,具體選擇了什么token無關(guān)緊要。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

舉例來說,讓Llama 34M回答一個簡單問題:自然常數(shù)e的前6位數(shù)字中,有幾個大于5的?

AI直接回答約等于瞎搗亂,只統(tǒng)計前6位數(shù)字居然統(tǒng)計出7個來。

讓AI把驗證每一數(shù)字的步驟寫出來,便可以得到正確答案。

讓AI把步驟隱藏,替換成大量的“……”,依然能得到正確答案!

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

這篇論文一經(jīng)發(fā)布便掀起大量討論,被評價為“我見過的最玄學(xué)的AI論文”。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

那么,年輕人喜歡說更多的“嗯……”、“l(fā)ike……”等無意義口癖,難道也可以加強推理能力?

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

從“一步一步”想,到“一點一點”想

實際上,紐約大學(xué)團隊的研究正是從思維鏈(Chain-of-Thought,CoT)出發(fā)的。

也就是那句著名提示詞“讓我們一步一步地想”(Let‘s think step by step)。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

過去人們發(fā)現(xiàn),使用CoT推理可以顯著提升大模型在各種基準(zhǔn)測試中的表現(xiàn)。

目前尚不清楚的是,這種性能提升到底源于模仿人類把任務(wù)分解成更容易解決的步驟,還是額外的計算量帶來的副產(chǎn)物。

為了驗證這個問題,團隊設(shè)計了兩個特殊任務(wù)和對應(yīng)的合成數(shù)據(jù)集:3SUM和2SUM-Transform。

3SUM要求從一組給定的數(shù)字序列中找出三個數(shù),使得這三個數(shù)的和滿足特定條件,比如除以10余0。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

這個任務(wù)的計算復(fù)雜度是O(n3),而標(biāo)準(zhǔn)的Transformer在上一層的輸入和下一層的激活之間只能產(chǎn)生二次依賴關(guān)系。

也就是說,當(dāng)n足夠大序列足夠長時,3SUM任務(wù)超出了Transformer的表達(dá)能力。

在訓(xùn)練數(shù)據(jù)集中,把與人類推理步驟相同長度的“…”填充到問題和答案之間,也就是AI在訓(xùn)練中沒有見過人類是怎么拆解問題的。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

在實驗中,不輸出填充token“……”的Llama 34M表現(xiàn)隨著序列長度增加而下降,而輸出填充token時一直到長度14還能保證100%準(zhǔn)確率。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

2SUM-Transform僅需判斷兩個數(shù)字之和是否滿足要求,這在 Transformer 的表達(dá)能力范圍內(nèi)。

但問題的最后增加了一步“對輸入序列的每個數(shù)字進(jìn)行隨機置換”,以防止模型在輸入token上直接計算。

結(jié)果表明,使用填充token可以將準(zhǔn)確率從 78.7%提高到93.6%。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

除了最終準(zhǔn)確率,作者還研究了填充token的隱藏層表示。實驗表明,凍結(jié)前面層的參數(shù),只微調(diào)最后一個Attention層,隨著可用的填充token數(shù)量增多,預(yù)測的準(zhǔn)確率遞增。

這證實了填充token的隱藏層表示確實包含了與下游任務(wù)相關(guān)的隱性計算。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

AI學(xué)會隱藏想法了?

有網(wǎng)友懷疑,這篇論文難道在說“思維鏈”方法其實是假的嗎?研究這么久的提示詞工程,都白玩了。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

團隊表示,從理論上講填充token的作用僅限于TC0復(fù)雜度的問題范圍內(nèi)。

TC0也就是可以通過一個固定深度的電路解決的計算問題,其中電路的每一層都可以并行處理,可以通過少數(shù)幾層邏輯門(如AND、OR和NOT門)快速解決,也是Transformer在單此前向傳播中能處理的計算復(fù)雜度上限。

而足夠長的思維鏈,能將Transformer的表達(dá)能力擴展到TC0之外。

而且讓大模型學(xué)習(xí)利用填充token并不容易,需要提供特定的密集監(jiān)督才能收斂。

也就是說,現(xiàn)有的大模型不太可能直接從填充token方法中獲益。

但這并不是當(dāng)前架構(gòu)的內(nèi)在局限性,如果在訓(xùn)練數(shù)據(jù)中提供足夠的示范,它們應(yīng)該也能從填充符號中獲得類似的好處。

這項研究還引發(fā)了一個令人擔(dān)心的問題:大模型有能力進(jìn)行無法監(jiān)控的暗中計算,對AI的可解釋性和可控性提出了新的挑戰(zhàn)。

換句話說,AI可以不依賴人類經(jīng)驗,以人們看不見的形式自行推理。

這既刺激又可怕。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

最后有網(wǎng)友開玩笑提議,讓Llama 3首先生成1千萬億點點點,就能得到AGI的權(quán)重了(狗頭)。

AI學(xué)會隱藏思維暗中推理!不依賴人類經(jīng)驗解決復(fù)雜任務(wù) 更黑箱了

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: AI 思維

相關(guān)文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
亚洲国产一区二区三区高清| 亚洲精品美女在线观看播放| 一道本一区二区| 亚洲国产专区| 欧美色图天堂网| 性做久久久久久久久| 欧美一区二区在线| 永久免费毛片在线播放不卡| 亚洲福利久久| 欧美特黄一区| 久久久久一区二区三区四区| 久久影院午夜片一区| 日韩视频在线永久播放| 亚洲视频狠狠| 国外视频精品毛片| 亚洲风情亚aⅴ在线发布| 欧美色欧美亚洲另类二区| 欧美在线免费一级片| 久久综合九色综合欧美就去吻 | 国产在线观看精品一区二区三区| 免费在线国产精品| 欧美精品性视频| 欧美一区二区高清| 欧美色视频一区| 久久久久国色av免费观看性色| 美女视频网站黄色亚洲| 亚洲一级一区| 欧美中文在线观看| 日韩亚洲在线观看| 亚洲欧美三级伦理| 亚洲日本久久| 欧美一级一区| 欧美一区二区精品在线| 91久久久久久久久| 亚洲一区二区三区四区视频| 1000精品久久久久久久久| 一本久道久久综合狠狠爱| 国产综合香蕉五月婷在线| 亚洲人成在线观看一区二区| 国产欧美精品日韩| 亚洲国产精品久久久久久女王| 国产精品一区二区三区免费观看| 欧美成人一区在线| 国产精品一二三视频| 亚洲国产第一| 国产亚洲精品7777| 亚洲精品国产精品国自产在线 | 欧美一区二区三区在线播放| 免费观看亚洲视频大全| 香蕉久久一区二区不卡无毒影院| 免费视频一区| 亚洲黄网站在线观看| 亚洲一区中文字幕在线观看| 亚洲精品综合精品自拍| 欧美一区二区三区视频免费播放| 一本色道久久综合| 久久久青草婷婷精品综合日韩 | 欧美在线短视频| 性8sex亚洲区入口| 一区二区三区产品免费精品久久75| 久久国产加勒比精品无码| 亚洲一二三区视频在线观看| 免费高清在线一区| 久久精品国产欧美激情| 国产精品av久久久久久麻豆网| 亚洲第一黄网| 黄色综合网站| 午夜天堂精品久久久久| 亚洲午夜免费福利视频| 欧美成人中文字幕在线| 久久综合九色综合欧美狠狠| 国产精品中文在线| 99在线视频精品| 日韩视频二区| 麻豆av一区二区三区| 久久久综合精品| 国产精品影视天天线| 一区二区三区国产在线观看| 亚洲激情社区| 久久在线免费观看视频| 久久青草欧美一区二区三区| 免费日韩av电影| 麻豆精品在线播放| 国产一区清纯| 香蕉久久精品日日躁夜夜躁| 亚洲欧美在线免费观看| 欧美日韩综合网| 亚洲巨乳在线| 999在线观看精品免费不卡网站| 美国十次成人| 亚洲激情电影中文字幕| 亚洲一区二区三区四区在线观看| 亚洲欧美日韩在线一区| 亚洲一区国产视频| 欧美日韩系列| 日韩午夜激情av| 中文无字幕一区二区三区| 欧美极品欧美精品欧美视频| 亚洲丰满在线| 亚洲三级免费电影| 欧美大片免费久久精品三p | 国产精品ⅴa在线观看h| 一区二区三区视频在线看| 中文国产一区| 国产精品igao视频网网址不卡日韩| 99国产精品久久久久久久成人热 | 亚洲日本电影在线| 欧美二区在线观看| 亚洲区国产区| 在线视频你懂得一区| 欧美日韩精品系列| 99综合精品| 亚洲欧美日本视频在线观看| 久久乐国产精品| 欧美 日韩 国产在线| 亚洲国产精品激情在线观看| 蜜桃久久av一区| 亚洲黄色免费| 一区二区精品| 国产精品草草| 午夜精品一区二区三区在线播放| 久久精品国产久精国产思思| 一区二区在线看| 欧美成人高清视频| 精品成人国产| 麻豆精品精华液| 亚洲青涩在线| 亚洲欧美日产图| 国产一区二区三区在线观看免费| 久久久国际精品| 亚洲东热激情| 亚洲性线免费观看视频成熟| 国产精品亚洲激情| 久久久999精品| 亚洲福利视频网| 亚洲一卡久久| 国产三区精品| 免费欧美日韩国产三级电影| 日韩午夜在线播放| 欧美亚洲视频在线观看| 极品少妇一区二区三区| 欧美国产三级| 亚洲一级片在线观看| 久久久综合免费视频| 亚洲三级电影在线观看| 国产精品久久久久久久午夜片 | 中文亚洲字幕| 久久婷婷影院| 99精品免费视频| 国产精品久久久久久久久免费| 久久狠狠一本精品综合网| 亚洲自拍偷拍网址| 狠狠色丁香婷综合久久| 欧美伦理91| 欧美一级淫片aaaaaaa视频| 欧美激情在线狂野欧美精品| 亚洲一区二区三区在线播放| 韩国女主播一区二区三区| 欧美精品一区二区三区一线天视频| 亚洲视频axxx| 欧美国产精品久久| 欧美成人午夜视频| 在线亚洲美日韩| 免费亚洲电影在线观看| 亚洲视频日本| 在线观看视频亚洲| 国产精品成人在线观看| 久热精品视频在线观看| 亚洲特级毛片| 欧美激情国产高清| 欧美一区二区视频网站| 亚洲欧洲三级| 国产性天天综合网| 欧美精品亚洲精品| 午夜精品一区二区在线观看| 米奇777超碰欧美日韩亚洲| 亚洲一区二区在线免费观看| 黄色一区三区| 欧美日韩国产不卡| 久久人体大胆视频| 欧美成人在线免费视频| 这里只有视频精品| 国产一区三区三区| 欧美日韩国产精品一卡| 久久精品女人天堂| 99国内精品久久| 国产精品成人一区二区网站软件| 中日韩美女免费视频网站在线观看| 欧美凹凸一区二区三区视频| 亚洲一区欧美二区| 欧美视频福利| 久久激五月天综合精品| 日韩一级大片| 免费在线亚洲| 亚洲欧美综合国产精品一区| 亚洲欧洲美洲综合色网| 国产精品v片在线观看不卡| 欧美国产在线电影| 欧美在线不卡视频| av成人天堂|