久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當(dāng)前的位置: 首頁(yè) > 新聞 > 其他

Nature封面:AI訓(xùn)AI 越訓(xùn)越傻

來(lái)源:量子位   編輯:非小米 時(shí)間:2024-07-28 09:45人閱讀

AI訓(xùn)練AI,可能會(huì)讓AI變傻?!

來(lái)自牛津、劍橋等學(xué)校機(jī)構(gòu)的研究人員最新發(fā)現(xiàn),使用合成數(shù)據(jù)訓(xùn)練,大模型可能會(huì)崩潰。其研究成果被選為最新的Nature封面

直接一個(gè):GARBAGE OUT!

Nature封面:AI訓(xùn)AI 越訓(xùn)越傻

要知道,現(xiàn)在絕大部分科技公司的大模型都在用合成數(shù)據(jù)來(lái)緩解“數(shù)據(jù)荒”。這下無(wú)疑是整個(gè)行業(yè)澆了一波冷水。

研究團(tuán)隊(duì)給了這樣一個(gè)例子。

他們測(cè)試了Meta的OPT-125m模型,詢問(wèn)了關(guān)于中世紀(jì)建筑的相關(guān)信息。

Nature封面:AI訓(xùn)AI 越訓(xùn)越傻

每一次微調(diào)都是由上一次生成的數(shù)據(jù)來(lái)訓(xùn)練。結(jié)果前面幾輪回答還好。結(jié)果就在第九次,就開(kāi)始胡說(shuō)八道……

扯到兔子是什么鬼?!

該論文主要作者表示,他們?cè)紤]過(guò)合成數(shù)據(jù)可能對(duì)大模型造成誤差,但未曾預(yù)料到模型的惡化速度會(huì)如此迅速。

三個(gè)誤差導(dǎo)致模型崩潰

首先,團(tuán)隊(duì)定義了什么是模型崩潰。

模型崩潰是一個(gè)退化過(guò)程,模型生成的內(nèi)容會(huì)污染下一代的訓(xùn)練數(shù)據(jù)集。而在被污染的數(shù)據(jù)上訓(xùn)練之后,新一代模型就容易誤解現(xiàn)實(shí)。

以此循環(huán)往復(fù),一代更比一代差。

Nature封面:AI訓(xùn)AI 越訓(xùn)越傻

按照時(shí)間推移,主要分為兩種情況:早期模型崩潰和晚期模型崩潰。

早期模型崩潰中,模型開(kāi)始丟失一些尾部信息。(類似概率分布中一些低概率事件) 而在晚期模型崩潰,模型將收斂到同原始分布幾乎沒(méi)有任何相似之處。

這一過(guò)程的發(fā)生,同模型設(shè)計(jì)、學(xué)習(xí)過(guò)程和所用數(shù)據(jù)質(zhì)量有關(guān)。

具體到理論中,主要包括了這三個(gè)誤差導(dǎo)致大模型同原始模型的偏離。

統(tǒng)計(jì)近似誤差。這是主要類型的誤差,由于樣本數(shù)量有限而產(chǎn)生,并隨著樣本數(shù)量趨于無(wú)窮大而消失。這是因?yàn)樵谥匦虏蓸拥拿恳徊街行畔⒍加锌赡軄G失,這種概率不為零。函數(shù)表達(dá)性誤差。這種誤差是由于函數(shù)近似表達(dá)能力有限而產(chǎn)生的。特別是,神經(jīng)網(wǎng)絡(luò)只有在其規(guī)模達(dá)到無(wú)窮大時(shí)才是通用近似值。不過(guò),在沒(méi)有其他兩種誤差的情況下,這種誤差只會(huì)發(fā)生在第一代。函數(shù)近似誤差。主要由學(xué)習(xí)過(guò)程局限性引起,例如隨機(jī)梯度下降的結(jié)構(gòu)偏差或目標(biāo)的選擇。這種誤差可以看作是在無(wú)限數(shù)據(jù)和每一代都具有完美表達(dá)能力的情況下產(chǎn)生的誤差。

對(duì)語(yǔ)言模型的影響

隨后研究人員評(píng)估了模型崩潰對(duì)語(yǔ)言模型的影響。由于從頭開(kāi)始訓(xùn)練大模型成本非常高,他們選擇評(píng)估語(yǔ)言模型最常見(jiàn)的設(shè)置:微調(diào)設(shè)置

每個(gè)訓(xùn)練周期都從具有最新數(shù)據(jù)的預(yù)訓(xùn)練模型開(kāi)始。訓(xùn)練數(shù)據(jù)來(lái)自另一個(gè)經(jīng)過(guò)微調(diào)的預(yù)訓(xùn)練模型。

他們用Meta因果語(yǔ)言模型OPT-125m,在wikitext2上進(jìn)行了微調(diào)。

為了從訓(xùn)練好的模型中生成數(shù)據(jù),團(tuán)隊(duì)使用了five-way波束搜索。他們將訓(xùn)練序列設(shè)為 64 個(gè)token長(zhǎng)度;然后對(duì)于訓(xùn)練集中的每個(gè)token序列,要求模型預(yù)測(cè)下一個(gè)64個(gè)token。

他們會(huì)瀏覽所有原始訓(xùn)練數(shù)據(jù)集,并生成一個(gè)相同大小的人工數(shù)據(jù)集。如果模型的誤差為0,它就會(huì)生成原始的wikitext2數(shù)據(jù)集。

為了進(jìn)一步感受區(qū)別,他們采用兩種不同的設(shè)置:一組是除了最開(kāi)始訓(xùn)練,后續(xù)過(guò)程沒(méi)有任何原始訓(xùn)練數(shù)據(jù);另一組則是保留10%的原始數(shù)據(jù)。

Nature封面:AI訓(xùn)AI 越訓(xùn)越傻

結(jié)果顯示,隨著時(shí)間推移,模型產(chǎn)生的錯(cuò)誤會(huì)增加。在模型完全崩潰之前,它還會(huì)導(dǎo)致模型遺忘數(shù)據(jù)集中低概率事件,他們的輸出也變得更加同質(zhì)化。最終也就出現(xiàn)了開(kāi)頭這一現(xiàn)象。

另外在VAE、GMM模型中看到了類似模型崩潰的現(xiàn)象。

Nature封面:AI訓(xùn)AI 越訓(xùn)越傻

Nature封面:AI訓(xùn)AI 越訓(xùn)越傻

來(lái)自杜克大學(xué)的Emily Wenger教授表示,到目前為止,要緩解這一問(wèn)題并非易事。

有領(lǐng)先的科技公司已經(jīng)部署了一項(xiàng)技術(shù),即嵌入“水印”——

標(biāo)記AI生成的內(nèi)容,讓其在訓(xùn)練數(shù)據(jù)中排除。但困難在于,這需要科技公司之間的協(xié)調(diào),因此不太具有商業(yè)可行性。

這樣一來(lái),那從之前互聯(lián)網(wǎng)獲取數(shù)據(jù)的公司,他們訓(xùn)練的模型更能代表現(xiàn)實(shí)世界。所以,最開(kāi)始那一波大模型算是有了先發(fā)優(yōu)勢(shì)。

對(duì)于這一觀點(diǎn),你怎么看呢?

本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com

標(biāo)簽: AI 科學(xué)

相關(guān)文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
久久人体大胆视频| 欧美国产视频在线观看| 国产精品视频导航| 欧美在线www| 久久久久久有精品国产| 精品51国产黑色丝袜高跟鞋| 久久一本综合频道| 欧美成人免费网| 亚洲——在线| 久久精品91久久香蕉加勒比| 亚洲国产精品成人一区二区| 亚洲国产视频一区| 欧美午夜电影在线| 久久久97精品| 欧美激情在线狂野欧美精品| 亚洲一区免费网站| 久久精品在线免费观看| 日韩一区二区免费高清| 亚洲综合日韩| 亚洲国产综合在线看不卡| av成人黄色| 在线观看日韩www视频免费 | 亚洲一区免费看| 欧美一区二区免费| 一区二区欧美国产| 久久国产日韩| 性欧美video另类hd性玩具| 曰韩精品一区二区| 亚洲图片欧美午夜| 亚洲国产第一| 香蕉成人啪国产精品视频综合网| 亚洲国产综合91精品麻豆| 中文亚洲字幕| 91久久精品www人人做人人爽 | 亚洲国产精品久久久久秋霞影院 | 亚洲国产精品黑人久久久| 夜夜嗨av色一区二区不卡| 一区二区自拍| 午夜精品视频在线| 亚洲视频第一页| 欧美不卡一区| 蜜桃精品一区二区三区| 国产精品视频午夜| 日韩视频中文字幕| 亚洲黄色精品| 久久人人爽国产| 久久精品国产77777蜜臀| 欧美日韩一区二| 91久久精品日日躁夜夜躁国产| 国产一区二区三区免费在线观看 | 亚洲欧洲精品成人久久奇米网 | 欧美噜噜久久久xxx| 免费成人在线观看视频| 国产精自产拍久久久久久蜜| 日韩亚洲精品在线| 亚洲最新视频在线播放| 欧美大成色www永久网站婷| 久久综合久久综合久久| 国产欧美一区二区色老头| 中文亚洲欧美| 亚洲欧美激情视频| 国产精品高潮视频| av成人免费| 亚洲欧美欧美一区二区三区| 欧美日韩中文字幕日韩欧美| 99在线|亚洲一区二区| 99热免费精品| 欧美性感一类影片在线播放| 99riav国产精品| 亚洲欧美成人一区二区在线电影| 欧美香蕉视频| 先锋影院在线亚洲| 久久蜜臀精品av| 1000部国产精品成人观看| 老司机成人在线视频| 欧美激情视频一区二区三区免费| 亚洲高清久久| 欧美日本不卡高清| 亚洲午夜精品久久久久久app| 午夜视频在线观看一区二区| 国产欧美日韩亚洲一区二区三区| 欧美亚洲在线| 欧美韩国日本一区| 亚洲视频在线视频| 国产亚洲一区二区三区在线观看| 久久久青草婷婷精品综合日韩 | 亚洲丁香婷深爱综合| av成人国产| 国产日韩欧美精品在线| 久久久久久日产精品| 亚洲欧洲精品一区二区三区不卡| 亚洲视频免费看| 国产日韩亚洲欧美精品| 美女黄毛**国产精品啪啪| 99精品视频免费在线观看| 欧美在线短视频| 亚洲精品老司机| 国产精品一香蕉国产线看观看 | 亚洲在线观看免费| 欧美jizz19性欧美| 亚洲综合色激情五月| 在线观看日韩国产| 国产精品v欧美精品v日韩 | 亚洲高清网站| 久久精品视频免费播放| 亚洲免费成人| 伊人成人在线| 国产精品午夜久久| 欧美精品在线免费播放| 久久er精品视频| 亚洲美洲欧洲综合国产一区| 久久一区二区三区四区| 亚洲在线视频| 亚洲黄色尤物视频| 国语自产精品视频在线看一大j8| 欧美日韩精品在线观看| 久久亚洲高清| 久久精品人人做人人爽电影蜜月| 亚洲免费激情| 亚洲高清不卡| 欧美成人免费大片| 久久国产精品黑丝| 亚洲欧美日韩一区二区三区在线观看 | 亚洲黄色有码视频| 国产午夜精品全部视频在线播放| 欧美日韩和欧美的一区二区| 久久一区二区精品| 久久激情综合| 欧美在线free| 欧美影院久久久| 午夜精品在线看| 亚洲在线中文字幕| 国产精品99久久久久久久久| 亚洲精品久久久久久下一站 | 午夜一区不卡| 亚洲一区二区四区| 亚洲一区二区少妇| 亚洲一区二区网站| 亚洲一区在线视频| 亚洲欧美国产日韩中文字幕| 一本大道久久a久久精品综合| 亚洲区一区二区三区| 91久久精品美女| 亚洲精品久久久久久下一站| 亚洲经典在线看| 91久久久久久| 99精品视频一区二区三区| 亚洲精选视频在线| 中文在线资源观看视频网站免费不卡| 99re亚洲国产精品| 亚洲视频中文| 校园春色国产精品| 久久久久久亚洲精品不卡4k岛国| 久久久久五月天| 老巨人导航500精品| 免费久久99精品国产自在现线| 女人色偷偷aa久久天堂| 亚洲国产99| 亚洲免费电影在线观看| 亚洲性人人天天夜夜摸| 欧美在线啊v| 久久综合色综合88| 欧美日韩国产一区二区| 国产精品日韩一区二区| 国内精品久久久久国产盗摄免费观看完整版 | 久久亚洲精品视频| 欧美精品综合| 国产一区成人| 亚洲精品中文在线| 亚洲欧美激情四射在线日 | 欧美一区视频| 欧美不卡三区| 国产精品久久久久影院亚瑟| 国内不卡一区二区三区| 亚洲精选成人| 欧美一区综合| 亚洲精品1区2区| 欧美在线国产| 欧美日韩国产首页在线观看| 国产亚洲va综合人人澡精品| 亚洲高清精品中出| 午夜视频在线观看一区| 欧美18av| 午夜一区二区三区在线观看| 美日韩精品视频| 国产欧美一区二区色老头| 亚洲精品小视频在线观看| 欧美在线亚洲在线| 亚洲精品少妇| 狼人社综合社区| 国产婷婷色一区二区三区在线| 日韩一区二区精品视频| 久久伊伊香蕉| 亚洲制服av| 欧美日韩综合| 亚洲人成在线播放| 久久中文精品| 欧美亚洲一区二区在线| 国产精品久久久久一区| 亚洲精品看片|