一個B200頂五個H100：黃仁勛真正打破了摩爾定律

來源：差評編輯：非小米時間：2024-03-20 01:48人閱讀

#顯卡 #NVIDIA

那個愛穿皮衣的黃姓男人又帶著他的 “ 家伙事 ” 來炸場了。

昨天凌晨， NVIDIA GTC 大會正式拉開帷幕， NVIDIA 創(chuàng)始人兼 CEO 黃仁勛現(xiàn)場兩個小時的演講，讓能容納兩萬人的 SAP 體育中心直接被塞爆了。

有網(wǎng)友把黃仁勛比作是新的喬布斯，還問 NVIDIA 會不會成為新的蘋果。

就連馬斯克也稱贊 “ 現(xiàn)在沒什么硬件能比 NVIDIA 的更適合 AI 。 ”

反正這次大會，老黃和 NVIDIA 是又被捧到了新高度。

那這次開發(fā)者大會，到底都講了些啥？大會演講全程兩個小時，沒有耐心看完演講的友友們，直接看我的總結(jié)就行。

之前，有網(wǎng)友調(diào)侃過老黃是科技圈的泰勒 · 斯威夫特，所以這次一開場，老黃就先水了一波觀眾：注意注意，這不是演唱會，這是開發(fā)者大會。

接著又甩出一張圖，跟大家伙兒嘮了半小時計算機和 NVIDIA 的發(fā)展史，還 cue 到了當(dāng)年把第一臺 DGX-1 超級計算機送給 OpenAI 的事兒。

不過這些，都只是些餐前小甜點，真正的大菜在后面呢。因為這次演講的主題叫做《見證 AI 的變革時刻》，估計大伙兒也能猜出個七七八八，大會內(nèi)容基本跟 AI 脫不了關(guān)系。

首先就是，全新的GPU 架構(gòu) Blackwell ，和新芯片 B200 。

大會現(xiàn)場，黃仁勛先是掏出了一塊 H100 ，還夸它 “changed the world” 。

但下一秒 Blackwell 架構(gòu)的 B200 出現(xiàn)以后，大伙兒的注意力就被老黃口中這個 “ NVIDIA 史上最成功的產(chǎn)品 ” 給吸引住了。

肉眼上看， B200 和 H100 最大的區(qū)別就是，前者要更大。

根據(jù)介紹， B200 由兩個 Die（裸片）封裝組合而成的，包含了 2080 億個晶體管（ H100 是 800 億個），可以支持參數(shù)量多達(dá) 10 萬億的 AI 模型搞訓(xùn)練推理。

并且， B200 的算力性能是 20PFlops ，而上一代 H100 只有 4PFlops 。

實際，在芯片制程上 B200 其實是沒什么創(chuàng)新的，畢竟 4nm 工藝已經(jīng)是目前這顆星球上的芯片極限了，所以 B200 另辟蹊徑，兩個芯片之間的數(shù)據(jù)傳輸速度足夠快。

這樣，兩塊芯片就來了一波超級合體，約等于是一塊芯片，但威力卻加倍了。

大會上老黃還裝了個 X ：他說當(dāng)他們被告知 Blackwell 的野心超出了物理極限時， NVIDIA 的工程師回了一句: 那又怎樣？

另外，芯片還能繼續(xù)像搭積木一樣合體，把兩塊 B200 組合到一起，再跟 NVIDIA 的 Grace CPU 配對之后，又能整出一個超級芯片 GB200 。

這個 GB200 ，直接把計算性能拉滿了。

按照老黃的說法，在 1750 億組參數(shù)的 GPT-3 模型基準(zhǔn)測試中， GB200 的性能是 H100 的 7 倍.

以前要 90 天內(nèi)訓(xùn)練一個 1.8 萬億參數(shù)的 MoE 架構(gòu) GPT 模型，需要 8000 個 H100 ，但現(xiàn)在，有 2000 個 GB200 就夠了。

老黃在這，也算是非官方的透露了一下 GPT-4 的參數(shù)量， 1.8 萬億參數(shù)的 MoE ，和之前網(wǎng)友猜測的其實也大差不差。

更夸張的是，還有把 36 個 GB200 放一起的 GB200 NVL72 服務(wù)器，還有結(jié)合了 8 個 GB200 NVL72 的 DGX SuperPOD ，這些由 Blackwell GPU 壘起來的計算平臺，一個比一個炸裂。

一個B200頂五個H100：黃仁勛真正打破了摩爾定律

甚至于，老黃也直接說 “ DGX SuperPOD 就是 AI 的革命工廠！ ”

之前科技公司不是老嚷嚷著搞大模型算力不夠不夠，這次老黃直接就整了個算力怪獸出來。

我只想說，友商連 H100 還沒趕上呢，這 B200 怎么又遙遙領(lǐng)先了？

而且，操心底層算力還不算完， NVIDIA 這次連 AI 應(yīng)用的落地也要摻和一腳。就說這個 NVIDIA 要推出的 NIM 推理服務(wù)吧，它可以提供預(yù)訓(xùn)練好的 AI 模型并開放 API ，再讓客戶自己來開發(fā)應(yīng)用。

舉個例子， NVIDIA 這次推了 25 個醫(yī)療場景的微服務(wù)，這些微服務(wù)包括了一系列模型，比如預(yù)測蛋白質(zhì)結(jié)構(gòu)的 ESMFold 、生成化學(xué)的 MolMIM 等等等等，醫(yī)療公司就可以基于這些微服務(wù)，開發(fā)相關(guān)的應(yīng)用出來。

按照老黃的說法，現(xiàn)在的 NVIDIA 就是一個 AI 代工廠，里面有模型、有模型開發(fā)工具，還有一系列基礎(chǔ)設(shè)施。

這就相當(dāng)于擴展了自己的 AI 生態(tài)鏈條， NVIDIA 一下子路就走寬了。

另外，這次大會還有個重頭戲，那就是人形機器人基礎(chǔ)模型 GROOT 。

簡單來理解，用 GROOT 驅(qū)動的人形機器人可以理解自然語言、模仿人類的行為，從而實現(xiàn)跟物理世界的交互，也就是咱們經(jīng)常提到的具身智能。

為了配合人形機器人， NVIDIA 還專門發(fā)布了個人形機器人芯片 Jetson Thor 。這又是 GROOT 又是 Thor ，難不成老黃是要致敬漫威？

總的來說，這次 NVIDIA 的開發(fā)者大會干貨還是挺多的。

反正新架構(gòu)出來之后， NVIDIA 車載計算平臺 “ NVIDIA DRIVE Thor ” 要升級的消息一傳開，比亞迪以后也要把 NVIDIA DRIVE Thor 芯片用在自家車上了，還要用 NVIDIA 的基礎(chǔ)設(shè)施來開發(fā)自動駕駛大模型。

NVIDIA 的 Omniverse 平臺也跟蘋果來了波聯(lián)動，讓設(shè)計師可以戴著 Vision Pro 來設(shè)計汽車；臺積電和新思科也要引入 NVIDIA 的光刻計算平臺 cuLitho ，給芯片制造提一波速。

還有什么 AI 游戲數(shù)字人技術(shù)，地球氣候數(shù)字孿生， NVIDIA 這次掏出來的東西基本上就沒有水貨。

AI 軍火商果然名不虛傳，反正從我的觀察來看，今年以來 NVIDIA 的股價已經(jīng)漲了超過 80% ，財報也是一片欣欣向榮。

但即便如此，不少人還是覺得 NVIDIA 的帝國背后，危機重重，有人覺得 NVIDIA 的生意太依賴谷歌、微軟這些巨頭了，不太具有持續(xù)性。

也有人把 NVIDIA 比作是我們這個時代的思科，因為在上個世紀(jì)末，一堆人覺得思科的交換機和路由器，就是互聯(lián)網(wǎng)時代的黃金，只要互聯(lián)網(wǎng)在，思科的股價永遠(yuǎn)漲，可最后，思科的股價在互聯(lián)網(wǎng)泡沫的破裂中，蒸發(fā)大半。

但不論如何，如今的 NVIDIA 依舊是 AI 芯片領(lǐng)域的最強話事人。

正如 NVIDIA 官網(wǎng)上說的那樣，是他們發(fā)明了 GPU ,也是他們讓 GPU 從專用的圖形處理設(shè)備，變成了通用計算平臺，從而推動了如今 AI 的發(fā)展。

所以在我的眼里， NVIDIA 不單單只是 AI “ 戰(zhàn)爭 ” 中的軍火商，因為如今 AI 這個火熱的場子，一定程度上都是 NVIDIA 搭起來的。

在新一代的 “ 軍火 ” 亮相之后，我已經(jīng)來不及想看下一階段的 AI 大戰(zhàn)，有多激烈和壯觀了。

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱：business@qudong.com