各大模型在高考中表現如何?科大訊飛星火數學題正確率50% 排名第一
來源:快科技 編輯:非小米 時間:2023-06-09 15:12人閱讀
快科技6月9日消息,科大訊飛于今日舉辦訊飛星火認知大模型V1.5 升級發布會,正式發布訊飛星火認知大模型V1.5,該模型的開放式問答能力取得突破,多輪對話和數學能力再升級,文本生成、語言理解、邏輯推理能力持續提升。
發布會上,科大訊飛展示了大模型在今年高考中的答題能力,科大訊飛星火力壓群雄,成為了解題正確率最高、“最聰明”的AI大模型。
數學題目測試中,媒體選擇了數學高考試卷前10道填空題,讓百度文心一言、阿里通義千問、科大訊飛星火認知大模型、360智腦、ChatGPT進行回答。
測試結果顯示,這五款大模型在答數學題的能力上差異顯著。
最“聰明”的訊飛星火答對了5題,正確率50%,大模型數學能力排名第一。百度文心一言和ChatGPT“緊跟其后”,答對了4題,正確率為40%。
而在語文主觀作答中,ChatGPT高考作文得分最高,文心一言、訊飛星火得分稍低,但跟ChatGPT處于同一水平。至于英語考試,訊飛星火、ChatGPT顯著領先其它各家。
此外,值得關注的是,在今日訊飛星火大模型V1.5迭代升級后,其數學能力將會再上一個臺階。
分享到:
本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。
如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com