一個B200頂五個H100:黃仁勛真正打破了摩爾定律
那個愛穿皮衣的黃姓男人又帶著他的 “ 家伙事 ” 來炸場了。
昨天凌晨, NVIDIA GTC 大會正式拉開帷幕, NVIDIA 創(chuàng)始人兼 CEO 黃仁勛現(xiàn)場兩個小時的演講,讓能容納兩萬人的 SAP 體育中心直接被塞爆了。
有網(wǎng)友把黃仁勛比作是新的喬布斯,還問 NVIDIA 會不會成為新的蘋果。
就連馬斯克也稱贊 “ 現(xiàn)在沒什么硬件能比 NVIDIA 的更適合 AI 。 ”
反正這次大會,老黃和 NVIDIA 是又被捧到了新高度。
那這次開發(fā)者大會,到底都講了些啥?大會演講全程兩個小時,沒有耐心看完演講的友友們,直接看我的總結(jié)就行。
之前,有網(wǎng)友調(diào)侃過老黃是科技圈的泰勒 · 斯威夫特,所以這次一開場,老黃就先水了一波觀眾:注意注意,這不是演唱會,這是開發(fā)者大會。
接著又甩出一張圖,跟大家伙兒嘮了半小時計算機和 NVIDIA 的發(fā)展史,還 cue 到了當(dāng)年把第一臺 DGX-1 超級計算機送給 OpenAI 的事兒。
不過這些,都只是些餐前小甜點,真正的大菜在后面呢。因為這次演講的主題叫做《 見證 AI 的變革時刻 》,估計大伙兒也能猜出個七七八八,大會內(nèi)容基本跟 AI 脫不了關(guān)系。
首先就是,全新的GPU 架構(gòu) Blackwell ,和新芯片 B200 。
大會現(xiàn)場,黃仁勛先是掏出了一塊 H100 ,還夸它 “changed the world” 。
但下一秒 Blackwell 架構(gòu)的 B200 出現(xiàn)以后,大伙兒的注意力就被老黃口中這個 “ NVIDIA 史上最成功的產(chǎn)品 ” 給吸引住了。
肉眼上看, B200 和 H100 最大的區(qū)別就是,前者要更大。
根據(jù)介紹, B200 由兩個 Die( 裸片 )封裝組合而成的,包含了 2080 億個晶體管( H100 是 800 億個 ),可以支持參數(shù)量多達(dá) 10 萬億的 AI 模型搞訓(xùn)練推理。
并且, B200 的算力性能是 20PFlops ,而上一代 H100 只有 4PFlops 。
實際,在芯片制程上 B200 其實是沒什么創(chuàng)新的,畢竟 4nm 工藝已經(jīng)是目前這顆星球上的芯片極限了,所以 B200 另辟蹊徑,兩個芯片之間的數(shù)據(jù)傳輸速度足夠快。
這樣,兩塊芯片就來了一波超級合體,約等于是一塊芯片,但威力卻加倍了。
大會上老黃還裝了個 X :他說當(dāng)他們被告知 Blackwell 的野心超出了物理極限時, NVIDIA 的工程師回了一句: 那又怎樣?
另外,芯片還能繼續(xù)像搭積木一樣合體,把兩塊 B200 組合到一起,再跟 NVIDIA 的 Grace CPU 配對之后,又能整出一個超級芯片 GB200 。
這個 GB200 ,直接把計算性能拉滿了。
按照老黃的說法,在 1750 億組參數(shù)的 GPT-3 模型基準(zhǔn)測試中, GB200 的性能是 H100 的 7 倍.
以前要 90 天內(nèi)訓(xùn)練一個 1.8 萬億參數(shù)的 MoE 架構(gòu) GPT 模型,需要 8000 個 H100 ,但現(xiàn)在,有 2000 個 GB200 就夠了。
老黃在這,也算是非官方的透露了一下 GPT-4 的參數(shù)量, 1.8 萬億參數(shù)的 MoE ,和之前網(wǎng)友猜測的其實也大差不差。
更夸張的是,還有把 36 個 GB200 放一起的 GB200 NVL72 服務(wù)器,還有結(jié)合了 8 個 GB200 NVL72 的 DGX SuperPOD ,這些由 Blackwell GPU 壘起來的計算平臺,一個比一個炸裂。
甚至于,老黃也直接說 “ DGX SuperPOD 就是 AI 的革命工廠! ”
之前科技公司不是老嚷嚷著搞大模型算力不夠不夠,這次老黃直接就整了個算力怪獸出來。
我只想說,友商連 H100 還沒趕上呢,這 B200 怎么又遙遙領(lǐng)先了?
而且,操心底層算力還不算完, NVIDIA 這次連 AI 應(yīng)用的落地也要摻和一腳。就說這個 NVIDIA 要推出的 NIM 推理服務(wù)吧,它可以提供預(yù)訓(xùn)練好的 AI 模型并開放 API ,再讓客戶自己來開發(fā)應(yīng)用。
舉個例子, NVIDIA 這次推了 25 個醫(yī)療場景的微服務(wù),這些微服務(wù)包括了一系列模型,比如預(yù)測蛋白質(zhì)結(jié)構(gòu)的 ESMFold 、生成化學(xué)的 MolMIM 等等等等,醫(yī)療公司就可以基于這些微服務(wù),開發(fā)相關(guān)的應(yīng)用出來。
按照老黃的說法,現(xiàn)在的 NVIDIA 就是一個 AI 代工廠,里面有模型、有模型開發(fā)工具,還有一系列基礎(chǔ)設(shè)施。
這就相當(dāng)于擴展了自己的 AI 生態(tài)鏈條, NVIDIA 一下子路就走寬了。
另外,這次大會還有個重頭戲,那就是人形機器人基礎(chǔ)模型 GROOT 。
簡單來理解,用 GROOT 驅(qū)動的人形機器人可以理解自然語言、模仿人類的行為,從而實現(xiàn)跟物理世界的交互,也就是咱們經(jīng)常提到的具身智能。
為了配合人形機器人, NVIDIA 還專門發(fā)布了個人形機器人芯片 Jetson Thor 。這又是 GROOT 又是 Thor ,難不成老黃是要致敬漫威?
總的來說,這次 NVIDIA 的開發(fā)者大會干貨還是挺多的。
反正新架構(gòu)出來之后, NVIDIA 車載計算平臺 “ NVIDIA DRIVE Thor ” 要升級的消息一傳開,比亞迪以后也要把 NVIDIA DRIVE Thor 芯片用在自家車上了,還要用 NVIDIA 的基礎(chǔ)設(shè)施來開發(fā)自動駕駛大模型。
NVIDIA 的 Omniverse 平臺也跟蘋果來了波聯(lián)動,讓設(shè)計師可以戴著 Vision Pro 來設(shè)計汽車;臺積電和新思科也要引入 NVIDIA 的光刻計算平臺 cuLitho ,給芯片制造提一波速。
還有什么 AI 游戲數(shù)字人技術(shù),地球氣候數(shù)字孿生, NVIDIA 這次掏出來的東西基本上就沒有水貨。
AI 軍火商果然名不虛傳,反正從我的觀察來看,今年以來 NVIDIA 的股價已經(jīng)漲了超過 80% ,財報也是一片欣欣向榮。
但即便如此,不少人還是覺得 NVIDIA 的帝國背后,危機重重,有人覺得 NVIDIA 的生意太依賴谷歌、微軟這些巨頭了,不太具有持續(xù)性。
也有人把 NVIDIA 比作是我們這個時代的思科,因為在上個世紀(jì)末,一堆人覺得思科的交換機和路由器,就是互聯(lián)網(wǎng)時代的黃金,只要互聯(lián)網(wǎng)在,思科的股價永遠(yuǎn)漲,可最后,思科的股價在互聯(lián)網(wǎng)泡沫的破裂中,蒸發(fā)大半。
但不論如何,如今的 NVIDIA 依舊是 AI 芯片領(lǐng)域的最強話事人。
正如 NVIDIA 官網(wǎng)上說的那樣,是他們發(fā)明了 GPU ,也是他們讓 GPU 從專用的圖形處理設(shè)備,變成了通用計算平臺,從而推動了如今 AI 的發(fā)展。
所以在我的眼里, NVIDIA 不單單只是 AI “ 戰(zhàn)爭 ” 中的軍火商,因為如今 AI 這個火熱的場子,一定程度上都是 NVIDIA 搭起來的。
在新一代的 “ 軍火 ” 亮相之后,我已經(jīng)來不及想看下一階段的 AI 大戰(zhàn),有多激烈和壯觀了。
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請來信告知我們刪除。郵箱:business@qudong.com