久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频

您當前的位置: 首頁 > 新聞 > 其他

拿CPU搞AI推理 誰給你的底氣

來源:量子位   編輯:非小米 時間:2024-03-27 16:54人閱讀

大模型的訓練階段我們選擇GPU,但到了推理階段,我們果斷把CPU加到了菜單上。

量子位在近期與眾多行業人士交流過程中發現,他們中有很多人紛紛開始傳遞出上述的這種觀點。

無獨有偶,Hugging Face在官方優化教程中,也有數篇文章劍指“如何用CPU高效推理大模型”:

拿CPU搞AI推理 誰給你的底氣

而且細品教程內容后不難發現,這種用CPU加速推理的方法,所涵蓋的不僅僅是大語言模型,更是涉獵到了圖像、音頻等形式的多模態大模型。

拿CPU搞AI推理 誰給你的底氣

不僅如此,就連主流的框架和庫,例如TensorFlow和PyTorch等,也一直在不斷優化,提供針對CPU的優化、高效推理版本。

就這樣,在GPU及其他專用加速芯片一統AI訓練天下的時候,CPU在推理,包括大模型推理這件事上似乎辟出了一條“蹊徑”,而且與之相關的討論熱度居然也逐漸高了起來。

拿CPU搞AI推理 誰給你的底氣

至于為什么會出現這樣的情況,與大模型的發展趨勢可謂是緊密相關。

自從ChatGPT問世引爆了AIGC,國內外玩家先是以訓練為主,呈現出一片好不熱鬧的百模大戰;然而當訓練階段完畢,各大模型便紛紛踏至應用階段。

就連英偉達在公布的最新季度財報中也表示,180億美元數據中心收入,AI推理已占四成。

由此可見,推理逐漸成為大模型進程,尤其是落地進程中的主旋律。

為什么Pick CPU做推理?

要回答這個問題,我們不妨先從效果來倒推,看看已經部署了CPU來做AI推理的“玩家”用得如何。

有請兩位重量級選手——京東云和英特爾。

今年,京東云推出了搭載第五代英特爾? 至強? 可擴展處理器的新一代服務器。

首先來看這款新服務器搭載的CPU。

若是用一句話來形容這個最新一代的英特爾? 至強? 可擴展處理器,或許就是AI味道越發得濃厚——

與使用相同內置AI加速技術(AMX,高級矩陣擴展)的前一代,也就是第四代至強? 可擴展處理器相比,它深度學習實時推理性能提升高達42%;與內置上一代AI加速技術(DL-Boost,深度學習加速)、隔輩兒的第三代至強? 可擴展處理器相比,AI推理性能更是最高提升至14倍。

到這里,我們就要詳細說說英特爾? 至強? 內置AI加速器經歷的兩個階段了:

第一階段,針對矢量運算優化。

從2017年第一代至強? 可擴展處理器引入高級矢量擴展 512(英特爾? AVX-512)指令集開始,讓矢量運算利用單條CPU指令就能執行多個數據運算。

再到第二代和第三代的矢量神經網絡指令 (VNNI,是DL-Boost的核心),進一步把乘積累加運算的三條單獨指令合并,進一步提升計算資源的利用率,同時更好地利用高速緩存,避免了潛在的帶寬瓶頸。

拿CPU搞AI推理 誰給你的底氣

第二階段,也就是現階段,針對矩陣運算優化。

所以從第四代至強? 可擴展處理器開始,內置AI加速技術的主角換成了英特爾? 高級矩陣擴展(英特爾AMX)。它特別針對深度學習模型最常見的矩陣乘法運算優化,支持BF16(訓練/推理)和INT8(推理)等常見數據類型。

英特爾AMX主要由兩個組件組成:專用的Tile寄存器存儲大量數據,配合TMUL加速引擎執行矩陣乘法運算。有人把它比作內置在CPU里的Tensor Core,嗯,確實很形象。

這么一搞,它不僅做到在單個操作中計算更大的矩陣,還保證了可擴展性和可伸縮性。

英特爾AMX在至強CPU每個內核上并靠近系統內存,這樣一來可減少數據傳輸延遲、提高數據傳輸帶寬,實際使用上的復雜性也降低了。

例如現在若是將不超過200億參數的模型“投喂”給第五代至強? 可擴展處理器,那么時延將低到不超過100毫秒!

拿CPU搞AI推理 誰給你的底氣

其次再看新一代京東云服務器。

據介紹,京東與英特爾聯合定制優化的第五代英特爾? 至強? 可擴展處理器的Llama2-13B推理性能(Token 生成速度)提升了 51%,足以滿足問答、客服和文檔總結等多種AI場景的需求場景。

拿CPU搞AI推理 誰給你的底氣
△ Llama2-13B推理性能測試數據

對于更高參數模型,甚至是70B Llama2, 第五代英特爾至強可擴展處理器仍可勝任勝任。

由此可見,CPU內置AI加速器發展到現在,用于推理已能保證在性能上足夠應對實戰需求了。

像這樣建立在通用服務器基礎上的AI加速方案,除了可用于模型推理之外,還能靈活滿足數據分析、機器學習等應用的需求,夸張點說,一個服務器就能完成AI應用的平臺化和全流程支持。

不僅如此,用CPU做AI推理,也存在CPU與生俱來的優勢,例如成本,還有更為重要的——部署和實踐的效率。

因為它本身就是計算機的標準組件,幾乎所有的服務器和計算機都配備了CPU,傳統業務中也已然存在大量的基于CPU的現成應用。

這意味著選擇CPU進行推理,既容易獲取,也不需要導入異構硬件平臺的設計或具備相關的人才儲備,還更容易獲得技術支持和維護。

以醫療行業為例,過去CPU已廣泛用于電子病歷系統、醫院資源規劃系統等,培養出成熟的技術團隊,也建立了完善的采購流程。

以此為基礎,醫療信息化龍頭企業衛寧健康,就利用CPU構建了能夠高效、低成本部署和應用的WiNEX Copilot落地方案,這個方案已深度集成到衛寧新一代的WiNEX產品中,任何一家已采用該系統的醫院,都能迅速上崗這種“醫生AI助手”。

僅其一項病歷文書助手功能,就可以在8小時內,也就是在醫生下班后的時間里處理近6000份病歷,相當于三甲醫院12位醫生一天工作量的總和!

拿CPU搞AI推理 誰給你的底氣

而且也正如我們剛才所提到的,從Hugging Face所提供的優化教程來看,只需要簡單的幾步,就可以讓CPU快速部署用于高效推理。

優化簡單、上手快,便是CPU真正在AI應用落地過程中的又雙叒一個優勢了。

這意味著任何或大或小的場景中,只要基于CPU的優化實現了一個單點的成功突破,那么它很快就可以實現精準且快速的復制或擴展,結果就是:能讓更多用戶能在相同或相近的場景中,以更快的速度、更優的成本把AI應用落到實地。

畢竟英特爾不僅是一家硬件公司,同時也擁有著龐大的軟件團隊。在傳統深度學習時代就積累了大量優化方法和工具,如OpenVINO? 工具包就在工業、零售等行業廣泛應用。

到了大模型時代,英特爾也深入與主流大模型如Llama 2、Baichuan、Qwen等深度合作,以英特爾? Extension for Transformer工具包為例,它就能讓大模型推理性能加速達40倍。

加之現在大模型所呈現的明顯趨勢就是越發地開始卷應用,如何能讓層出不窮的新應用“快好省”地落下去、用起來成了關鍵中的關鍵。

因此,為什么越來越多的人會選擇CPU做AI推理,也就不難理解了。

或許,我們還可以再引用一下英特爾CEO帕特·基辛格2023年底接受媒體訪問時所說的話,來鞏固一下各位的印象:

“從經濟學的角度看推理應用的話,我不會打造一個需要花費四萬美元的全是H100的后臺環境,因為它耗電太多,并且需要構建新的管理和安全模型,以及新的IT基礎設施。”

“如果我能在標準版的英特爾芯片上運行這些模型,就不會出現這些問題。”

AI Everywhere

回看2023年,大模型本身是AI圈絕對的話題中心。

但2024年剛開始,明顯能感覺到的趨勢就是各類技術進展,各行業應用落地進展都在加快,呈現一種“多點開花”的局面。

在這種局面下,可以預見的是還將有更多AI推理需求涌現,推理算力在整個AI算力需求中所占的比例只會增加。

比如以Sora為代表的AI視頻生成,業內推測其訓練算力需求其實比大模型少,但推理算力需求卻是大模型的成百上千倍。

而AI視頻應用落地需要的視頻傳輸等其他加速優化,也是CPU的拿手好戲。

所以綜合來看,CPU在整個英特爾AI Everywhere愿景下的定位也就明確了:

補足GPU或專用加速器覆蓋不到或不足的地方,為更多樣和復雜的場景提供靈活的算力選擇,在強化通用計算的同時,成為AI普及的重要基礎設施。

拿CPU搞AI推理 誰給你的底氣

本站所有文章、數據、圖片均來自互聯網,一切版權均歸源網站或源作者所有。

如果侵犯了你的權益請來信告知我們刪除。郵箱:business@qudong.com

標簽: CPU處理器 CPU

相關文章

久久在线视频在线_欧美在线一级va免费观看_欧美日韩国产在线一区_亚洲一区二区三区在线观看视频
午夜性色一区二区三区免费视频| 在线视频你懂得一区| 亚洲精品美女91| 亚洲国产精品视频| 欧美精品在线一区二区| 中文国产一区| 一色屋精品视频在线看| 亚洲人成网站在线播| 亚洲每日在线| 国产日韩精品入口| 久久亚洲午夜电影| 欧美精品福利视频| 西瓜成人精品人成网站| 久久久国产成人精品| 99av国产精品欲麻豆| 亚洲一级黄色av| 在线精品高清中文字幕| 亚洲精品乱码久久久久久蜜桃91| 国产精品二区在线| 久久先锋影音av| 欧美激情亚洲国产| 欧美影院久久久| 久久综合网络一区二区| 午夜宅男久久久| 欧美高清一区二区| 久久精品中文| 欧美日韩国产综合视频在线观看| 欧美在线电影| 欧美日本在线视频| 久热精品视频在线观看| 欧美日韩一区自拍| 欧美黑人在线观看| 国产午夜精品美女视频明星a级| 欧美激情精品久久久六区热门| 国产精品视频99| 亚洲欧洲在线看| 国产有码在线一区二区视频| 亚洲另类春色国产| 在线欧美影院| 久久精品国产亚洲a| 亚洲永久精品大片| 欧美精品一区二区三区蜜臀| 美女视频黄a大片欧美| 国产日产欧美a一级在线| 99re热精品| 亚洲精品在线免费观看视频| 久久激情视频免费观看| 欧美亚洲免费电影| 国产精品成人国产乱一区| 亚洲国产精品精华液网站| 有坂深雪在线一区| 久久精品99国产精品酒店日本| 午夜精品久久久久久久99热浪潮| 久久视频免费观看| 久久精品日产第一区二区三区| 亚洲网站在线观看| 欧美精品导航| 亚洲欧洲在线看| 一区二区三区高清在线观看| 欧美激情a∨在线视频播放| 欧美激情久久久久| 亚洲破处大片| 欧美成人精品| 亚洲国产精品高清久久久| 亚洲人成网在线播放| 欧美www在线| 亚洲国产视频a| 日韩视频免费观看高清在线视频| 欧美gay视频激情| 亚洲国产欧美在线人成| 99视频一区| 欧美系列一区| 午夜精品久久久久久久久久久久久| 性视频1819p久久| 国产欧美日韩一区二区三区在线观看| 亚洲一区欧美二区| 久久久xxx| 亚洲国产合集| 欧美日韩国产在线看| 亚洲小视频在线| 久久手机免费观看| 亚洲精品乱码久久久久久黑人| 欧美精品在线极品| 亚洲资源在线观看| 久久久www| 99国产精品国产精品久久| 国产精品wwwwww| 欧美伊人久久久久久久久影院| 美日韩精品视频免费看| 亚洲精品一区在线观看| 国产精品入口夜色视频大尺度| 欧美一区综合| 亚洲人成艺术| 久久狠狠亚洲综合| 亚洲精品日韩欧美| 国产丝袜一区二区| 欧美精品久久久久久久| 亚洲欧美中文在线视频| 免费人成精品欧美精品| 亚洲资源在线观看| 亚洲国产精品va在线看黑人| 国产精品国码视频| 免费观看欧美在线视频的网站| 在线视频一区二区| 欧美福利专区| 久久精品国产免费看久久精品| 日韩视频免费观看高清完整版| 国产欧美日韩在线观看| 欧美大片一区| 久久精品亚洲精品| 亚洲性感激情| 91久久精品国产91性色tv| 久久精品国产在热久久 | 欧美日韩国产va另类| 亚洲尤物在线| 亚洲精品久久| 亚洲福利电影| 久久亚洲精品欧美| 久久精品91久久久久久再现| 亚洲一二三区在线| 日韩一级网站| 亚洲精品美女| 亚洲韩国日本中文字幕| 欧美激情黄色片| 午夜精品福利在线| 日韩一二三区视频| 亚洲国产99| 亚洲第一福利视频| 韩国一区电影| 国内精品免费在线观看| 国产乱码精品一区二区三区五月婷| 欧美日韩精品免费观看视一区二区| 久久综合色天天久久综合图片| 先锋a资源在线看亚洲| 午夜精品久久一牛影视| 亚洲一区网站| 欧美一级在线播放| 欧美在线精品一区| 久久国产主播精品| 久久全国免费视频| 麻豆91精品| 你懂的视频欧美| 欧美激情一区二区三区四区| 欧美成人精品高清在线播放| 久久综合九色综合久99| 鲁大师影院一区二区三区| 老牛国产精品一区的观看方式| 久久久水蜜桃av免费网站| 美玉足脚交一区二区三区图片| 久久国产日本精品| 欧美aaaaaaaa牛牛影院| 欧美高清自拍一区| 欧美午夜精品久久久久久超碰| 国产精品久久二区| 国产麻豆精品在线观看| 极品尤物av久久免费看| 亚洲第一久久影院| 日韩天堂av| 亚洲欧美激情视频| 久久一区二区视频| 欧美激情一区在线| 国产精品99久久久久久白浆小说| 亚洲私拍自拍| 久久久久久久91| 欧美精品一区二| 国产农村妇女精品| 亚洲国产精品女人久久久| 亚洲视频欧美在线| 久久免费黄色| 亚洲精品视频在线观看免费| 亚洲午夜久久久久久久久电影院 | 欧美一乱一性一交一视频| 久久午夜国产精品| 欧美三级在线视频| 国产一区三区三区| 一区二区三区www| 久久精品免费播放| 亚洲国产小视频| 欧美一区二区三区在线| 欧美日本国产精品| 国产视频一区二区三区在线观看| 亚洲国产精品一区二区第四页av | 国产综合av| 中文网丁香综合网| 欧美成年人视频| 亚洲直播在线一区| 欧美日产国产成人免费图片| 国产一区二区视频在线观看| 99re6这里只有精品视频在线观看| 久久av二区| av不卡在线| 欧美第一黄网免费网站| 国产日韩精品在线观看| 亚洲视频网在线直播| 欧美激情精品久久久久久黑人 | 国产精品久久久久久久午夜片| 亚洲福利av| 久久久久久久性| 亚洲欧美影院| 国产精品热久久久久夜色精品三区|