全靠用戶投票！GPT-4o、訊飛星火分列CompassArena大模型前二

來(lái)源：快科技編輯：非小米時(shí)間：2024-08-02 16:40人閱讀

快科技8月2日消息，根據(jù)國(guó)內(nèi)權(quán)威大模型評(píng)估平臺(tái)OpenCompass（司南）近日公布的CompassArena周榜，GPT-4o和科大訊飛的星火大模型分別占據(jù)了排行榜的前兩位。

榜單采用專(zhuān)業(yè)用戶投票方式，結(jié)合了用戶對(duì)各款大模型的真實(shí)體驗(yàn)，更具客觀性和說(shuō)服力，可謂是含金量十足。

OpenCompass的評(píng)測(cè)體系涵蓋了學(xué)科、語(yǔ)言、知識(shí)、理解、推理等多個(gè)維度，能夠全面評(píng)估大模型的綜合能力。

在最新三期的評(píng)選中，訊飛星火以Elo-1078和Elo-1081的高分連續(xù)三周位列前三，并兩次獲得第二，顯示出其在大模型領(lǐng)域的強(qiáng)勁競(jìng)爭(zhēng)力。

值得注意的是，科大訊飛在今年6月27日發(fā)布的星火V4.0版本上，已完成了對(duì)GPT-4 Turbo的整體超越。

根據(jù)八個(gè)國(guó)際主流測(cè)試集的橫向評(píng)測(cè)，訊飛星火V4.0排名第一，在文本生成、語(yǔ)言理解、知識(shí)問(wèn)答、邏輯推理、數(shù)學(xué)能力等方面完成了整體超越。

此前，訊飛星火在《麻省理工科技評(píng)論》的橫評(píng)中也獲得了高分，憑借領(lǐng)先的語(yǔ)言能力、數(shù)學(xué)、理綜等多項(xiàng)核心能力，斬獲國(guó)產(chǎn)主流大模型榜首席位。

目前，訊飛星火的安卓端APP累計(jì)下載量已超過(guò)1.31億次，位列國(guó)內(nèi)工具類(lèi)通用大模型APP第一，持續(xù)領(lǐng)跑?chē)?guó)內(nèi)大模型第一梯隊(duì)。

本站所有文章、數(shù)據(jù)、圖片均來(lái)自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請(qǐng)來(lái)信告知我們刪除。郵箱：business@qudong.com

標(biāo)簽：用戶訊飛星火

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频