售價(jià)超25萬元 NVIDIA最強(qiáng)顯卡H100刷新AI跑分記錄:近30倍領(lǐng)先
快科技6月28日消息,AI火爆之后,NVIDIA的顯卡成為香餑餑,尤其是高端的H100加速卡,售價(jià)超過25萬元依然供不應(yīng)求,而它的性能也非常夸張,最新的AI測(cè)試中全面刷新記錄,基于GPT-3的大語言模型訓(xùn)練任務(wù)紀(jì)錄已經(jīng)被刷至11分鐘。
機(jī)器學(xué)習(xí)及人工智能領(lǐng)域開放產(chǎn)業(yè)聯(lián)盟MLCommons公布了最新的MLPerf基準(zhǔn)評(píng)測(cè),其中包括8個(gè)負(fù)載測(cè)試,LLM大語言模型中就有基于GPT-3開源模型的,很考驗(yàn)平臺(tái)的AI性能。
參與測(cè)試的NVIDIA平臺(tái)由896個(gè)Intel至強(qiáng)8462Y+處理器和3584個(gè)H100加速卡組成,是所有平臺(tái)中唯一跑完所有測(cè)試的,而且刷新了記錄。
在關(guān)鍵的基于GPT-3的大語言模型訓(xùn)練任務(wù)中,H100平臺(tái)只用了10.94分鐘,可以對(duì)比的是Intel平臺(tái),由96個(gè)至強(qiáng)8380處理器和96個(gè)Habana Gaudi2 AI芯片構(gòu)建的系統(tǒng)中,完成同樣測(cè)試的時(shí)間為311.94分鐘。
H100平臺(tái)的性能幾乎是30倍于Intel平臺(tái),當(dāng)然兩套平臺(tái)的規(guī)模相差也很大,但只用768個(gè)H100加速卡的話,訓(xùn)練時(shí)間也只要45.6分鐘,依然遠(yuǎn)超Intel平臺(tái)的AI芯片。
H100基于GH100 GPU核心,定制版臺(tái)積電4nm工藝制造,800晶體管,集成18432個(gè)CUDA核心、576個(gè)張量核心、60MB二級(jí)緩存,支持6144-bit HBM高帶寬內(nèi)存,支持PCIe 5.0。
H100計(jì)算卡有SXM、PCIe 5.0兩種樣式,其中SXM版本15872個(gè)CUDA核心、528個(gè)Tensor核心,PCIe 5.0版本14952個(gè)CUDA核心、456個(gè)Tensor核心,功耗最高達(dá)700W。
性能方面,F(xiàn)P64/FP32 60TFlops(每秒60萬億次),F(xiàn)P16 2000TFlops(每秒2000萬億次),TF32 1000TFlops(每秒1000萬億次),都三倍于A100,F(xiàn)P8 4000TFlops(每秒4000萬億次),六倍于A100。
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來信告知我們刪除。郵箱:business@qudong.com