蘋果AI放大招!聲稱其設(shè)備端模型性能優(yōu)于GPT-4
快科技4月2日消息,據(jù)媒體報(bào)道,在最近的一篇論文中,蘋果的研究團(tuán)隊(duì)宣稱,他們提出了一個(gè)可以在設(shè)備端運(yùn)行的模型ReALM,這個(gè)模型在某些方面可以超過GPT-4。
ReALM的參數(shù)量分別為80M、250M、1B和3B,體積都非常小,適合在手機(jī)、平板電腦等設(shè)備端運(yùn)行。
ReALM研究的主要是,讓AI識(shí)別文本中提到的各種實(shí)體(如人名、地點(diǎn)、組織等)之間的指代關(guān)系的過程。
論文將實(shí)體分為三種:
屏幕實(shí)體(On-screen Entities):指的是當(dāng)前顯示在用戶屏幕上的內(nèi)容。
對(duì)話實(shí)體(Conversational Entities):指的是與對(duì)話相關(guān)的內(nèi)容。例如,用戶說“打電話給媽媽”,那么媽媽的聯(lián)系人信息就是對(duì)話實(shí)體。
后臺(tái)實(shí)體(Background Entities):指的是與用戶當(dāng)下操作或屏幕顯示內(nèi)容可能并不直接相關(guān)的實(shí)體,比如正在播放的音樂或即將響起的鬧鈴。
論文表示,盡管大型語(yǔ)言模型已經(jīng)證明在多種任務(wù)上具有極強(qiáng)的能力,但在用于解決非對(duì)話實(shí)體(如屏幕實(shí)體、后臺(tái)實(shí)體)的指代問題時(shí),它們的潛力還沒有得到充分利用。
而ReALM則是一種全新的方法,通過將其性能與GPT-3.5和GPT-4進(jìn)行了對(duì)比,顯示最小模型的性能與GPT-4相當(dāng),而更大的模型則顯著超過了GPT-4。
這項(xiàng)研究有望用來(lái)改進(jìn)蘋果設(shè)備上的Siri助手,幫助Siri更好地理解和處理用戶詢問中的上下文。
本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱:business@qudong.com


