久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當前的位置: 首頁 > 新聞 > 其他

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

來源:量子位   編輯:非小米 時間:2023-08-14 17:39人閱讀

用AI生成的指令微調羊駝大模型,數學能力超ChatGPT——

微軟最新開源大模型WizardMath來了。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

如下圖所示,經過GSM8k數據集測試,WizardMath數學能力直接擊敗了ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型——

并且是在參數只有700億,遠不及后三者的情況之下。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

HuggingFace已上線3個在線可玩版本(分別為7B、13B和70B參數),各種數學題可以直接丟進去試一試。

比如解決下面這道四次多項式方程:

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

或者是一道簡單的微積分:

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

亦或者是稍微修改過的拉格朗日方程推導:

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

它都全部正確(過程也不需要等太久)。

有網友向作者表示:

效果真的很驚人,感謝你們對開源LLM的貢獻。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

目前,相關代碼、復現方式以及論文也都開源或上線,GitHub短短幾天已攬獲4.8k標星。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

那么,WizardMath究竟是如何做到的?

用AI生成的指令增強大模型能力

OpenAI的大模型(InstructGPT、GPT-4等)能夠取得巨大成功、去執行各種復雜和多樣化的任務,一部分原因是使用了真實人類用戶生成的開放域指令數據進行了微調。

然而,不是誰都能像這家公司一樣獲得這樣的指令數據集。

一是因為整個注釋過程極其昂貴且耗時,二是人工難以創建出足夠比例的高難度指令。

因此,開發出一種成本相對較低的、大規模開放域指令自動生產方法,成為當下指令調優語言模型的關鍵。

在此,作者將他們的方法命名為Evol Instruction。

它是一種利用AI來代替人類自動生成涵蓋各種難度級別開放域指令的新方法。

具體而言,Evol Instruction分為指令進化器和指令消除器。

其中指令進化器可通過深度進化(藍線)或廣度進化(紅線)兩種路徑,將簡單指令升級為更復雜的指令或創建一條全新指令。

具體執行哪一條?隨機選擇就好。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

其中,深度進化的具體“進化法”,則是通過五種類型的操作來完成,包括:

添加約束(add constraints)、深化(deepening)、具體化(concretizing)、增加推理步驟(increase reasoning steps)和使輸入復雜化(complicate input)。

由于所有指令均由AI完成,有時難免會出現錯誤。因此,指令消除器就是用于過濾失敗指令的。

以下是一個具體示例,該方法從“1+1=?”開始,最終通過以上步驟自動生成了相當多的新指令。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

通過重復這一生成過程,最終我們就能得到足夠多的指令,然后將它們合并并隨機打亂,組成一個難度級別均勻分布的指令集,就可以對基礎大模型進行微調了。

在此,作者選擇Alpaca的訓練數據(僅由175條人工創建的種子指令生成)作為初始數據集,然后使用ChatGPT的API執行了四個進化周期,最終獲得25萬條指令。

為了與Vicuna的70k真實用戶數據(ShareGPT)進行公平比較,作者從這25萬條數據中抽取了等量的樣本,訓練LLaMA 7B模型,最終得到WizardLM,結果WizardLM的性能明顯優于Vicuna。

(Alpaca:斯坦福在LLaMa-7B基礎上微調出來的模型;Vicuna,UC伯克利在LLaMa-13B的基礎上微調得來)

此外,在更為復雜的測試指令下,人類更喜歡WizardLM的輸出,而非ChatGPT,這表明該方法可以顯著提高LLM處理復雜指令的能力。

基于此,作者又利用Evol Instruction生成了很多數學領域相關的指令,然后微調羊駝大模型,得到了WizardMath。

其效果如開頭所示,在GSM8k數據集上測得其數學能力超越包括ChatGPT、Claude Instant 1、PaLM 2-540B等一眾大模型,位列第5名,僅次于GPT-4、Claud1.3和2.0,以及5400億參數的Flan-PaLM 2之后。

以此類推,作者還在羊駝之上得到了專攻代碼能力的WizardCoder,效果超越Claude和Bard(詳情可戳文末地址)。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

團隊介紹本文共9位作者,全華人。

一作有3位:

Can Xu,微軟亞洲互聯網工程院S+D NLP組高級應用科學家,之前曾在微軟小冰研究組和微軟亞研院從事聊天機器人系統工作;

Qingfeng Sun, Microsoft Research科學家,研究方向為自然語言處理和信息檢索,精通構建高效搜索系統,為Microsoft Bing和Office 365貢獻了核心深度模型;

Kai Zheng,Microsoft Research科學家,研究方向為自然語言處理、搜索和推薦排名,同樣為Microsoft Bing和Office 365貢獻了核心深度模型。

數學能力超ChatGPT 70B開源大模型火了:用AI微調AI

通訊作者為姜大昕,微軟全球合伙人、副總裁、前微軟亞洲研究院首席科學家,在微軟工作16年有余、曾作為微軟必應搜索引擎和Cortana智能助手自然語言理解負責人,日前已被曝離職投身大模型創業。

另還有一位作者Jiazhan Feng,是北大學生,這篇合著論文是TA在微軟實習時產出的。

項目主頁: https://github.com/nlpxucan/WizardLM/tree/main/WizardMath

本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: 大模型 ChatGPT

相關文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
亚洲视频二区| 国产午夜精品视频免费不卡69堂| 亚洲国产成人av| 久久在线精品| 久久视频在线免费观看| 狠狠干综合网| 免费观看成人| 欧美a级片网| aa亚洲婷婷| 夜夜嗨av一区二区三区网页| 欧美午夜一区二区福利视频| 亚洲欧美日韩视频一区| 亚洲欧美精品在线观看| 国模精品一区二区三区色天香| 久久漫画官网| 美女视频网站黄色亚洲| 中文国产一区| 午夜精品久久久99热福利| 国内精品视频一区| 亚洲国产一区二区三区在线播 | 亚洲精品视频免费观看| 欧美日韩国产综合视频在线| 欧美成人乱码一区二区三区| 欧美日韩国产系列| 午夜精品免费在线| 久久国产主播| 99人久久精品视频最新地址| 亚洲先锋成人| 亚洲国产导航| 一区二区三区产品免费精品久久75| 国产区精品视频| 暖暖成人免费视频| 国产精品地址| 欧美jizz19性欧美| 国产精品自拍一区| 亚洲高清自拍| 国产亚洲aⅴaaaaaa毛片| 亚洲国产女人aaa毛片在线| 国产精品人成在线观看免费| 狼狼综合久久久久综合网| 欧美日韩一区二区视频在线| 久久综合网hezyo| 国产精品电影网站| 欧美韩日精品| 国产主播精品| 在线视频中文亚洲| 亚洲精品婷婷| 久久久精品一区| 亚洲欧洲99久久| 欧美韩日高清| 蜜臀久久99精品久久久久久9| 国产精品v欧美精品v日韩| 欧美成ee人免费视频| 国产精品婷婷| 中日韩男男gay无套| 亚洲人成网站在线播| 久久精品国产一区二区三区免费看 | 欧美sm视频| 国产一区二区三区久久悠悠色av | 亚洲第一色在线| 在线欧美电影| 久久精品亚洲精品国产欧美kt∨| 亚洲欧美日韩国产中文| 欧美日韩午夜精品| 亚洲精品少妇| 亚洲免费成人| 欧美乱在线观看| 亚洲精品国产拍免费91在线| 亚洲精品色婷婷福利天堂| 欧美凹凸一区二区三区视频| 欧美成人国产va精品日本一级| 韩国精品在线观看| 久久久99爱| 欧美福利一区二区三区| 91久久极品少妇xxxxⅹ软件| 男男成人高潮片免费网站| 欧美高清视频www夜色资源网| 精品福利电影| 欧美sm视频| 亚洲乱码视频| 午夜性色一区二区三区免费视频| 国产精自产拍久久久久久| 久久xxxx精品视频| 蜜臀久久久99精品久久久久久| 在线观看视频欧美| 日韩写真在线| 一区二区三区视频观看| 亚洲欧美国产另类| 国产麻豆综合| 久久久久一区二区三区| 欧美激情网友自拍| 一本色道久久综合狠狠躁篇怎么玩 | 亚洲夜间福利| 欧美午夜精品久久久久久浪潮| 亚洲国产综合91精品麻豆| 亚洲人成欧美中文字幕| 欧美精品在线网站| 亚洲韩国一区二区三区| 亚洲深夜福利视频| 国产精品国产自产拍高清av| 亚洲欧美国产三级| 久久尤物视频| 99这里有精品| 欧美精品导航| 久久精品卡一| 亚洲人成网站在线观看播放| 亚洲视屏一区| 国产一区二区三区高清 | 亚洲国产中文字幕在线观看| 亚洲素人一区二区| 国产日韩久久| 欧美99久久| 午夜精品久久久久99热蜜桃导演| 免费观看国产成人| 亚洲视频第一页| 激情六月婷婷综合| 欧美日韩精品在线| 久久成人18免费观看| 中国成人在线视频| 欧美福利一区| 欧美在线视频免费播放| 亚洲欧洲日产国码二区| 国产欧美日韩亚洲精品| 农村妇女精品| 国产精品99久久久久久宅男| 久久视频一区二区| 一区二区三区四区精品| 国产在线观看91精品一区| 欧美日韩成人在线| 久久久久一区二区三区| 99在线|亚洲一区二区| 久久久免费观看视频| 一区二区三区欧美| 一区二区亚洲欧洲国产日韩| 欧美亚州一区二区三区| 欧美国产日韩一区| 亚洲一区中文| 亚洲午夜国产一区99re久久| 亚洲国产精品va在线看黑人| 久久人人97超碰人人澡爱香蕉 | 欧美日韩调教| 美女国内精品自产拍在线播放| 亚洲在线观看免费| 日韩午夜电影av| 亚洲高清电影| 麻豆国产精品一区二区三区| 亚洲欧美清纯在线制服| 99riav久久精品riav| 亚洲福利av| 先锋影音国产一区| 欧美一区网站| 小处雏高清一区二区三区| 日韩视频中午一区| 亚洲三级影院| 91久久亚洲| 亚洲国产精品第一区二区三区| 在线播放日韩| 亚洲福利视频二区| 亚洲国产成人porn| 亚洲激情视频在线播放| 亚洲高清影视| 伊人久久久大香线蕉综合直播| 国产亚洲午夜高清国产拍精品| 国产精品视频九色porn| 国产精品国码视频| 国产精品久久久久久av下载红粉| 久久精品一区二区三区四区 | 久久久久国色av免费看影院| 欧美一区成人| 亚洲最快最全在线视频| 亚洲免费在线观看视频| 亚洲影视在线| 欧美一区二区视频网站| 久久9热精品视频| 久久九九99视频| 性欧美暴力猛交另类hd| 蜜臀91精品一区二区三区| 欧美国产精品中文字幕| 久久夜色精品国产亚洲aⅴ| 欧美在线综合| 欧美在线观看一二区| 久久久999精品免费| 亚洲欧洲一区二区天堂久久| 亚洲精选一区| 亚洲一区二区在线视频 | 另类av导航| 亚洲欧洲一区二区在线观看| 99热这里只有精品8| 亚洲永久免费| 久久久久久穴| 欧美日韩大陆在线| 国产日韩欧美日韩| 精品69视频一区二区三区| 亚洲精品极品| 欧美一区二区三区日韩| 欧美国产日韩一区| 正在播放欧美视频| 亚洲精品日韩精品| 久久视频免费观看| 国产精品日韩专区|