久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當(dāng)前的位置: 首頁 > 新聞 > 其他

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

來源:量子位   編輯:非小米 時間:2023-11-02 13:03人閱讀

有網(wǎng)友找到了GPT-4變“笨”的又一證據(jù)。

他質(zhì)疑:

OpenAI會緩存歷史回復(fù),讓GPT-4直接復(fù)述以前生成過的答案。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

最明顯的例子就是講笑話。

證據(jù)顯示,即使他將模型的temperature值調(diào)高,GPT-4仍重復(fù)同一個“科學(xué)家與原子”的回答。

就是那個“為什么科學(xué)家不信任原子?因為萬物都是由它們編造/構(gòu)造(make up)出來的”的冷笑話。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

在此,按理說temperature值越大,模型越容易生成一些意想不到的詞,不該重復(fù)同一個笑話了。

不止如此,即使咱們不動參數(shù),換一個措辭,強(qiáng)調(diào)讓它講一個新的、不同的笑話,也無濟(jì)于事。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

發(fā)現(xiàn)者表示:

這說明GPT-4不僅使用緩存,還是聚類查詢而非精準(zhǔn)匹配某個提問。

這樣的好處不言而喻,回復(fù)速度可以更快。

不過既然高價買了會員,享受的只是這樣的緩存檢索服務(wù),誰心里也不爽。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

還有人看完后的心情是:

如果真這樣的話,我們一直用GPT-4來評價其他大模型的回答是不是不太公平?

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

當(dāng)然,也有人不認(rèn)為這是外部緩存的結(jié)果,可能模型本身答案的重復(fù)性就有這么高:

此前已有研究表明ChatGPT在講笑話時,90%的情況下都會重復(fù)同樣的25個。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

具體怎么說?

證據(jù)實錘GPT-4用緩存回復(fù)

不僅是忽略temperature值,這位網(wǎng)友還發(fā)現(xiàn):

更改模型的top_p值也沒用,GPT-4就跟那一個笑話干上了。

(top_p:用來控制模型返回結(jié)果的真實性,想要更準(zhǔn)確和基于事實的答案就把值調(diào)低,想要多樣化的答案就調(diào)高)

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

唯一的破解辦法是把隨機(jī)性參數(shù)n拉高,這樣我們就可以獲得“非緩存”的答案,得到一個新笑話。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

不過,它的“代價”是回復(fù)速度變慢,畢竟生成新內(nèi)容會帶來一定延遲。

值得一提的是,還有人似乎在本地模型上也發(fā)現(xiàn)了類似現(xiàn)象。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

有人表示:截圖中的“prefix-match hit” (前綴匹配命中)似乎可以證明確實是用的緩存。

那么問題就來了,大模型到底是如何緩存我們的聊天信息的呢?

好問題,從開頭展現(xiàn)的第二個例子來看,顯然是進(jìn)行了某種“聚類”操作,但具體如何應(yīng)用于深度多輪對話咱不知道。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

姑且不論這個問題,倒是有人看到這里,想起來ChatGPT那句“您的數(shù)據(jù)存在我們這兒,但一旦聊天結(jié)束對話內(nèi)容就會被刪除”的聲明,恍然大悟。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

這不禁讓一些人開始擔(dān)憂數(shù)據(jù)安全問題:

這是否意味著我們發(fā)起的聊天內(nèi)容仍然保存在他們的數(shù)據(jù)庫中?

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

當(dāng)然,有人分析這個擔(dān)憂可能過慮了:

也許只是我們的查詢embedding和回答緩存被存下來了。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

因此,就像發(fā)現(xiàn)者本人說的:

緩存這個操作本身我不太擔(dān)心。

我擔(dān)心的是OpenAI這樣簡單粗暴地匯總我們的問題進(jìn)行回答,毫不關(guān)心temperature等設(shè)置,直接聚合明顯有不同含義的提示,這樣影響很不好,可能“廢掉”許多(基于GPT-4的)應(yīng)用。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

當(dāng)然,并不是所有人都同意以上發(fā)現(xiàn)能夠證明OpenAI真的就是在用緩存回復(fù)。

他們的理由是作者采用的案例恰好是講笑話。

畢竟就在今年6月,兩個德國學(xué)者測試發(fā)現(xiàn),讓ChatGPT隨便講個笑話,1008次結(jié)果中有90%的情況下都是同樣25個笑話的變體。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

像“科學(xué)家和原子”這個更是尤其出現(xiàn)頻率最高,它講了119次。

因此也就能理解為什么看起來好像是緩存了之前的回答一樣。

因此,有網(wǎng)友也提議用其他類型的問題測一測再看。

不過作者堅持認(rèn)為,不一定非得換問題,光通過測量延遲時間就能很容易地分辨出是不是緩存了。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

最后,我們不妨再從“另一個角度”看這個問題:

GPT-4一直講一個笑話怎么了?

一直以來,咱們不都是強(qiáng)調(diào)要讓大模型輸出一致、可靠的回答嗎?這不,它多聽話啊(手動狗頭)。

GPT-4更笨了!一個笑話講八百遍:讓換新的也不聽

所以,GPT-4究竟有沒有緩存,你有觀察到類似現(xiàn)象嗎?

參考鏈接: https://twitter.com/hammer_mt/status/1719150885559812379

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: 大模型 ChatGPT

相關(guān)文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
亚洲在线视频| 欧美综合国产精品久久丁香| 免费成人激情视频| 久久亚洲美女| 日韩一级免费| 亚洲网站在线观看| 国产欧美日韩视频一区二区三区| 午夜精品免费视频| 久久激情婷婷| 亚洲美女毛片| 亚洲在线一区二区| 在线观看视频一区二区欧美日韩| 免费视频亚洲| 欧美日韩伦理在线| 久久精品夜色噜噜亚洲aⅴ| 久久精品国产99| 日韩视频专区| 欧美一二三区精品| 99精品99久久久久久宅男| 亚洲欧美清纯在线制服| 在线免费观看欧美| 在线视频一区二区| 亚洲国产精品福利| 亚洲永久字幕| 亚洲精品一区二区网址 | 亚洲国产精品va在线观看黑人| 亚洲第一区色| 国产精品一区视频网站| 亚洲第一在线综合在线| 国产精品视频最多的网站| 欧美高清在线播放| 国产区欧美区日韩区| 亚洲第一毛片| 国产一区二区三区在线播放免费观看| 亚洲国产三级| 伊人色综合久久天天五月婷| 亚洲一区二区三区视频| aa级大片欧美三级| 久久综合999| 久久都是精品| 国产精品日日摸夜夜添夜夜av| 亚洲高清网站| 亚洲第一在线| 久久高清福利视频| 久久国产黑丝| 国产精品乱人伦中文| 亚洲精品一线二线三线无人区| 尤物九九久久国产精品的分类| 亚洲在线免费视频| 亚洲一区二区精品视频| 欧美金8天国| 欧美国产日韩免费| 亚洲电影免费观看高清完整版在线观看| 99视频精品在线| 夜夜嗨网站十八久久| 欧美搞黄网站| 91久久精品美女| 亚洲精品久久久久中文字幕欢迎你 | 亚洲美女电影在线| 亚洲视频欧美视频| 欧美一区二区三区播放老司机 | 欧美日韩亚洲高清| 亚洲激情午夜| 亚洲美女在线国产| 欧美激情bt| 91久久久久久久久| 亚洲精品国产视频| 欧美日韩成人在线视频| 日韩亚洲视频在线| 亚洲视频在线看| 国产精品v欧美精品v日韩精品| 中文一区二区在线观看| 亚洲欧美自拍偷拍| 国产伦理精品不卡| 久久精品免费电影| 欧美韩日亚洲| 一区二区三区免费看| 欧美三级韩国三级日本三斤| 一区二区欧美亚洲| 久久久久高清| 亚洲国内在线| 欧美日韩在线三级| 香蕉av777xxx色综合一区| 久久久久国产成人精品亚洲午夜| 尤物视频一区二区| 欧美黑人在线播放| 亚洲伊人色欲综合网| 久久婷婷av| 日韩一级成人av| 国产麻豆视频精品| 美女网站在线免费欧美精品| 亚洲久久一区二区| 久久久久久久久岛国免费| 亚洲国产女人aaa毛片在线| 欧美日韩亚洲视频| 久久精品男女| 亚洲精品乱码视频| 久久久久国产精品厨房| 日韩视频一区二区| 国产一区二区三区视频在线观看| 女主播福利一区| 亚洲一二三四区| 亚洲第一在线综合在线| 欧美在线免费视屏| 一本久道久久久| 红桃视频国产一区| 国产精品色婷婷| 欧美成人中文字幕| 久久国产色av| 在线视频亚洲| 91久久精品网| 免费不卡视频| 久久99在线观看| 制服丝袜亚洲播放| 亚洲欧洲日韩女同| 国产综合色在线视频区| 欧美日韩在线播放三区四区| 久久精品中文字幕免费mv| 亚洲视频中文| 亚洲欧洲精品一区| 欧美h视频在线| 久久精品在线播放| 香蕉久久国产| 亚洲欧美国产日韩天堂区| 日韩手机在线导航| 亚洲每日在线| 亚洲精品久久久久久久久久久久 | 国产在线拍揄自揄视频不卡99| 欧美色欧美亚洲高清在线视频| 最新精品在线| 日韩一二三在线视频播| 好看的日韩视频| 国产欧美精品在线观看| 国产精品久久综合| 欧美日韩一区二| 欧美日韩国产小视频在线观看| 美女图片一区二区| 免费久久99精品国产自在现线| 久久久久久电影| 久久爱www久久做| 欧美在线看片a免费观看| 欧美亚洲在线播放| 亚洲欧美一区二区在线观看| 亚洲欧美日韩国产中文| 亚洲一二三区精品| 欧美伊人久久| 久久aⅴ国产欧美74aaa| 久久久久国产精品一区二区| 久久久噜噜噜久噜久久| 久久亚洲免费| 欧美精品性视频| 国产精品成人播放| 国产乱码精品1区2区3区| 国产精品永久| 极品日韩久久| 亚洲品质自拍| 亚洲一区国产| 久久九九国产精品怡红院| 久色婷婷小香蕉久久| 亚洲成人资源网| 亚洲精品美女91| 亚洲影院污污.| 久久久久国产一区二区三区四区| 久久男人资源视频| 欧美日韩午夜激情| 国产日韩精品视频一区二区三区| 国产在线日韩| 一本色道久久加勒比88综合| 午夜精彩视频在线观看不卡| 久久久久一本一区二区青青蜜月| 蜜桃久久av| 在线视频精品一区| 久久久亚洲影院你懂的| 欧美精品1区| 国产在线精品成人一区二区三区| 亚洲精品网站在线播放gif| 亚洲一区二区高清| 免费永久网站黄欧美| 99re6热在线精品视频播放速度| 亚洲免费视频网站| 牛牛国产精品| 国产丝袜美腿一区二区三区| 亚洲九九精品| 久久久999国产| 日韩一级大片| 久久综合色婷婷| 国产日本精品| 亚洲午夜电影| 亚洲国产精品99久久久久久久久| 亚洲欧美日本在线| 欧美日韩成人| 亚洲第一狼人社区| 欧美一区中文字幕| 亚洲精品久久久久| 久久在精品线影院精品国产| 国产乱人伦精品一区二区 | 亚洲午夜激情| 亚洲国产mv| 久久午夜精品| 国产综合亚洲精品一区二|