拿起能跑100+億參數(shù)大模型的手機(jī)：0.6秒就進(jìn)入了AI世界

來源：雷峰網(wǎng) 編輯：非小米時(shí)間：2023-11-12 18:48人閱讀

年初在手機(jī)上用AI生成一張圖還需要15秒，半年多后的今天只需要0.6秒，0.6秒大概就是點(diǎn)擊一下鼠標(biāo)點(diǎn)時(shí)間，數(shù)碼發(fā)燒友瑞澤被手機(jī)AI進(jìn)化的速度嚇到。

讓瑞澤同樣吃驚的是，10月底發(fā)布的AI PC處理器驍龍X Elite，能夠以30 tokens/s的速度運(yùn)行70億參數(shù)的生成式AI模型。

這比普通人每分鐘閱讀200-300個(gè)單詞，也就是每秒處理5-7個(gè)tokens的速度，快了好幾倍，就算問AI PC數(shù)字助理一個(gè)復(fù)雜答案，馬上就能得到答案。

觸手可及的智能手機(jī)和AI PC，已經(jīng)成為了進(jìn)入AI世界的任意門。

走進(jìn)終端AI的任意門里，用一張自拍照，無需等待就能生成超乎想象的照片；讓手機(jī)“看”幾秒食物，就能知道是否還能食用；對(duì)著貼身數(shù)字管家說出旅行的要求，瞬間就能獲得專門定制的旅行計(jì)劃。

“生成式AI在終端上的應(yīng)用呈幾何式增長(zhǎng)，一年前我們只能看到一兩個(gè)用例，現(xiàn)在有數(shù)百個(gè)，預(yù)計(jì)到2024年我們將會(huì)看到上千個(gè)用例，驍龍將會(huì)發(fā)揮非常核心的作用。”高通公司總裁兼CEO安蒙說，“我們見證了下一個(gè)轉(zhuǎn)型的開始，AI將無處不在。”

每一次重大技術(shù)革命的背后，都需要底層強(qiáng)大的計(jì)算和連接力作支撐，高通會(huì)成為這場(chǎng)AI變革的主角，讓端側(cè)AI像電力一樣全面融入普通人的生活。

能跑百億參數(shù)大模型，手機(jī)變身進(jìn)入AI世界的“任意門”

瑞澤最常用的手機(jī)AI功能是拍照，他沒料到，最新旗艦級(jí)第三代驍龍8具備運(yùn)行100億參數(shù)的生成式AI模型的能力后，不僅能將前后攝像頭的畫面實(shí)時(shí)合成在一起，將視頻中多余的人或物體去除，大幅增強(qiáng)夜景視頻效果，還帶來了超越想象的全新功能。

“照片擴(kuò)展”就是一個(gè)讓人眼前一亮的新功能，用戶使用任意照片進(jìn)行縮放，生成式AI都能讓照片看起來具有廣角的效果。比如用一朵花的照片，縮放后馬上就能會(huì)變成一片花海的照片。

端側(cè)生成式AI還有更多用法，如果用在工作中，一個(gè)電話會(huì)議結(jié)束之后，馬上就能獲得通話中聊到的重要事項(xiàng)并添加待辦事項(xiàng)；

如果想去一個(gè)目的地，手機(jī)可以基于你所在的位置給出最符合你出行習(xí)慣的路線規(guī)劃；

如果你想開始徒步，簡(jiǎn)單輸入個(gè)人信息，再掃描一下皮膚狀態(tài)，就會(huì)有私教般的運(yùn)動(dòng)訓(xùn)練建議。

這些任務(wù)都是在手機(jī)端完成，完全不用擔(dān)心隱私問題，也不用付月費(fèi)，高通和合作伙伴就像是打開了生成式AI世界的任意門。

如此讓人眼前一亮的端側(cè)AI應(yīng)用的實(shí)現(xiàn)并非一蹴而就，在AI領(lǐng)域投入超過10年的高通，2015年首次將AI技術(shù)集成到商用的產(chǎn)品用，用于增強(qiáng)音頻技術(shù)，此后逐步將AI應(yīng)用到了影像和視頻技術(shù)中。

三年前高通啟動(dòng)第三代驍龍8開發(fā)時(shí)，終端智能就被放在了首位，這也是為什么第三代驍龍8一發(fā)布，手機(jī)端AI大模型文字生成圖片的速度就能從15秒速降到0.6秒。

“0.6秒的運(yùn)行時(shí)間帶來一個(gè)優(yōu)勢(shì)，可以將這一模型嵌入相機(jī)應(yīng)用。”高通技術(shù)公司產(chǎn)品管理高級(jí)副總裁Ziad Asghar)表示，“消費(fèi)者通常希望拍攝之間最多間隔1-2秒，如果運(yùn)行一次模型需要15秒，將無法使用。”

第三代驍龍8如何實(shí)現(xiàn)數(shù)量級(jí)的AI性能提升？

強(qiáng)大的硬件是基礎(chǔ)，第三代驍龍8的CPU性能相比前代提升高達(dá)30%，GPU性能提升25%，Hexagon NPU性能直接翻倍，第三代驍龍8的AI性能站在了行業(yè)之巔。

“通過改進(jìn)架構(gòu)，提高向量加速器主頻、升級(jí)獨(dú)特的微切片推理技術(shù)等方式，來加速Transformer網(wǎng)絡(luò)推理。”高通技術(shù)公司產(chǎn)品管理總監(jiān)Lekha Motiwala介紹，第三代驍龍8支持業(yè)內(nèi)最新的LPDDR5-x內(nèi)存，頻率達(dá)到4.8GHz，通過更快的數(shù)據(jù)速度和更大帶寬支持用戶運(yùn)行更大、更復(fù)雜的AI模型。

要讓第三代驍龍8能夠以每秒生成20個(gè)token的速度運(yùn)行大語(yǔ)言模型（如Llama2），還需要升級(jí)高通AI軟件棧工具。

“我們先將龐大的AI模型量化到INT4，實(shí)現(xiàn)了性能、精度和能效間的絕佳平衡。再充分發(fā)揮業(yè)界最快DDR內(nèi)存的優(yōu)勢(shì)，憑借77GB/s吞吐量來支持LLM，以驚人的速度運(yùn)行量化模型。”Ziad Asghar說，“Hexagon NPU能夠以閃電般的速度支持LVM。我們采用了一個(gè)100億參數(shù)模型，并使用了蒸餾等先進(jìn)技術(shù)和高效的UNET模型，大大加快了擴(kuò)散過程，達(dá)到了0.6秒這個(gè)如此驚人的速度。”

Ziad Asghar透露，SnapFusion支持Snap以同樣快的速度生成圖像，而不會(huì)犧牲圖像質(zhì)量。SnapFusion將在2024年支持Snapchat Dreams功能，支持用戶生成超乎想象的自拍圖片。

要激發(fā)基于第三代驍龍8平臺(tái)的端側(cè)AI創(chuàng)新，少不了高通AI軟件棧的優(yōu)化。

高通AI軟件棧的核心是高通神經(jīng)網(wǎng)絡(luò)處理SDK和高通AI引擎Direct，連接芯片與所有主流AI框架，高通利用托管模型，開發(fā)者可以直接使用TensorFlow、ONNX、PyTorch，輕松訪問Hexagon NPU，這將大幅降低基于第三代驍龍8移動(dòng)平臺(tái)進(jìn)行AI創(chuàng)新的門檻。

除了AI圖像生成，聊天機(jī)器人也是生成式AI世界的另一類重要應(yīng)用。

為了讓能夠?qū)崿F(xiàn)聊天機(jī)器人功能的大模型在終端上流暢運(yùn)行，高通使用了推測(cè)性解碼的技術(shù)。“我非常興奮地宣布，這是預(yù)測(cè)解碼首次在邊緣終端中使用。”Ziad Asghar說。

如果要為聊天機(jī)器人加上一個(gè)虛擬形象，可以利用高通AI引擎中Adreno GPU強(qiáng)大的渲染能力，渲染出嘴形和聲音同步的AI虛擬形象。

出色的AI體驗(yàn)還不能僅靠單一的輸入或輸出形式，視覺、文本、語(yǔ)音的結(jié)合更為直觀，這就是多模態(tài)AI。

第三代驍龍8支持多模態(tài)AI，還能充分利用用戶手機(jī)上的全部數(shù)據(jù)，利用LoRA等端側(cè)學(xué)習(xí)技術(shù)，可以在保障用戶數(shù)據(jù)隱私的同時(shí)，讓終端側(cè)的AI模型變好的同時(shí)更加個(gè)性化。

比如，詢問AI助理回家的最佳路線或推薦的餐廳時(shí)，云端AI方案給出的回復(fù)是通用答案。而基于第三代驍龍8的AI終端，發(fā)揮高通傳感器中樞與終端側(cè)大語(yǔ)言模型持續(xù)協(xié)作，能夠基于用戶的年齡、最喜歡的活動(dòng)、當(dāng)前位置等個(gè)人信息生成定制化回復(fù)。

以搭載第三代驍龍8手機(jī)為代表的終端側(cè)AI，性能足，節(jié)省成本和時(shí)間，并且更加隱私和安全、還能提升個(gè)性化，是觸手可及的AI世界任意門。

同樣觸手可及的PC也會(huì)是進(jìn)入AI世界的任意門嗎？

AI性能6年提升100倍，AI PC提高效率又激發(fā)創(chuàng)意

AI PC才是進(jìn)入AI世界的另一個(gè)任意門。

“回顧行業(yè)歷史，僅有兩項(xiàng)其他技術(shù)像如今的AI一樣具有顛覆性。二十世紀(jì)六七十年代，命令行的盛行使得個(gè)人電腦的廣泛使用成為可能。

二十世紀(jì)九十年代，圖形用戶界面讓普通用戶能夠輕松、容易地使用PC。”惠普公司高級(jí)總監(jiān)Bobby Moore 在2023驍龍峰會(huì)上說，“AI正推動(dòng)PC計(jì)算變革，使其變得更加個(gè)性化、更加自然、更加直觀。”

高通技術(shù)公司高級(jí)副總裁兼手機(jī)、計(jì)算和XR業(yè)務(wù)總經(jīng)理阿力克斯·卡圖贊（Alex Katouzian）也表示，“目前，我們?cè)诤饬縋C性能方面處于轉(zhuǎn)折點(diǎn)，雖然CPU和GPU依舊至關(guān)重要，但同時(shí)我們引入了第三個(gè)衡量維度：終端側(cè)AI。”

過去很長(zhǎng)一段時(shí)間，普通消費(fèi)者選擇筆記本電腦的時(shí)候很難兼顧輕薄外形和高性能，驍龍X Elite的發(fā)布，讓筆記本電腦實(shí)現(xiàn)了輕薄外形下的超高性能和超高能效，特別是強(qiáng)大的AI功能。

驍龍X Elite搭載的高通自研Oryon CPU，相比蘋果M2 Max，實(shí)現(xiàn)相同單線程性能，Oryon CPU能耗減少30%。對(duì)比專門為高性能游戲終端設(shè)計(jì)的i9-13980HX CPU，Oyron實(shí)現(xiàn)相同性能功耗降低70%，成為了PC移動(dòng)處理器領(lǐng)域性能和能效的新標(biāo)桿。

GPU性能也艷壓群雄，與性能領(lǐng)先的x86集成GPU相比，驍龍X Elite的性能領(lǐng)先高達(dá)80%，達(dá)到競(jìng)品的最高性能功耗可以降低80%。

作為專為AI PC而生的處理器，驍龍X Elite的AI性能更加驚艷，Hexagon NPU算力可以達(dá)到45 TOPS，是競(jìng)品近期發(fā)布NPU的4倍。包含CPU、GPU和NPU在內(nèi)的整個(gè)高通AI引擎，可以讓驍龍X Elite的AI性能達(dá)到75TOPS。

驍龍X Elite高達(dá)75TOPS的AI性能，是高通驍計(jì)算平臺(tái)6年AI性能提升100倍里程碑。這樣強(qiáng)勁的AI性能可以在沒有云端資源的情況下運(yùn)行超過130億參數(shù)的AI生成式模型。

與第三代驍龍8一樣，驍龍X Elite的Hexagon NPU同樣做了大量升級(jí)，包括增加全新的供電系統(tǒng)兼顧極致性能和功耗，引入微切片推理，對(duì)張量加速器進(jìn)行升級(jí)，增加共享內(nèi)存規(guī)模。

這讓驍龍X Elite這個(gè)性能猛獸應(yīng)對(duì)AI任務(wù)游刃有余。

DaVinci Resolve的付費(fèi)版包含一系列在好萊塢創(chuàng)意界被廣泛使用的AI強(qiáng)大功能，比如MagicMask支持近乎即時(shí)的物體追蹤/輪鏡、AI賦能的自動(dòng)字幕生成和剪輯，以及音軌分離和對(duì)話平衡器來實(shí)現(xiàn)卓越音質(zhì)。

對(duì)于支持AI的計(jì)算密集型Magic Mask，驍龍X Elite比采用集成GPU的高端十二核x86處理器快1.7倍。Magic Mask在驍龍X Elite的集成NPU上運(yùn)行，比在同為Arm架構(gòu)的12核處理器上運(yùn)行快3倍，這是讓所有創(chuàng)作者興奮的效率提升。

將于2024年發(fā)布的搭載驍龍X Elite的筆記本電腦，可以運(yùn)行原生ARM64的DaVinci Resolve。

AI原生公司Uniphore用上為AI而生的驍龍X Elite，AI PC作為生產(chǎn)力工具的效率會(huì)進(jìn)一步提升，Uniphore將生成式AI模型用于語(yǔ)音到文本轉(zhuǎn)錄、情緒分析和通話摘要，幫助企業(yè)交付更高質(zhì)量的服務(wù)的同時(shí)，降低使用云端AI的成本。

“商業(yè)筆記本電腦大約占一半的PC銷量。”高通技術(shù)公司產(chǎn)品管理高級(jí)總監(jiān)Nitin Kumar表示，“94%的商界領(lǐng)袖表示，AI已在工作中提高生產(chǎn)力。在IT決策者中，AI是影響購(gòu)買決策的最大因素。新的研究表明，近一半的IT決策者準(zhǔn)備基于AI性能更換PC品牌。驍龍X Elite恰逢其時(shí)。”

大幅提升效率的同時(shí)，驍龍X Elite還能激發(fā)出更多AI用例，驍龍X Elite集成的高通傳感器中樞進(jìn)行了升級(jí)，性能提高2倍的同時(shí)還保持超低功耗，加上率先引入的始終感知ISP，端側(cè)AI節(jié)省成本和時(shí)間，更加隱私和安全、提升個(gè)性化的優(yōu)勢(shì)，也能在AI PC上展現(xiàn)的淋漓盡致，讓PC游戲更有沉浸感，生產(chǎn)效率更高。

端側(cè)生成式AI的大門全面開啟

與AI PC和手機(jī)開啟AI無處不在時(shí)代的，還有各種形態(tài)的終端AI設(shè)備。

2023驍龍峰會(huì)上最新推出的高通S7音頻平臺(tái)的AI性能是前代平臺(tái)的100倍，強(qiáng)大的AI能力可以提高使用者沉浸式音頻應(yīng)用的精準(zhǔn)性。

“我們不僅設(shè)計(jì)了完全在終端上運(yùn)行的AI技術(shù)，這些功能還將擴(kuò)展至我們的全部產(chǎn)品線。”Ziad Asghar說，“我們將從產(chǎn)品形態(tài)最小的功能開始，比如智能手表中的活動(dòng)建議和AR眼鏡中的3D LVM，到電動(dòng)車中的終端側(cè)助手。”

為了和生態(tài)合作伙伴一起加速AI時(shí)代的到來，高通還推出了高通AI軟件棧模型，這是一套能夠滿足開發(fā)人員需求的模型，模型經(jīng)過高通公司的全面優(yōu)化、測(cè)試和驗(yàn)證，可支持第三代驍龍8和驍龍 X Elite平臺(tái)，發(fā)布之時(shí)有30多個(gè)模型，更多模型會(huì)持續(xù)推出。

谷歌也是推開端側(cè)生成式AI大門的重要力量。過去幾個(gè)月，谷歌的研發(fā)團(tuán)隊(duì)致力于對(duì)其規(guī)模龐大的下一代大語(yǔ)言模型進(jìn)行精煉，以適應(yīng)移動(dòng)終端。

為了讓無處不在的AI時(shí)代有無縫的體驗(yàn)，高通還準(zhǔn)備好了包含硬件和軟件框架的解決方案Snapdragon Seamless，讓用戶能夠創(chuàng)建連接智能手機(jī)、筆記本電腦、平板電腦、耳塞、智能手表和XR設(shè)備的自組織智能網(wǎng)絡(luò)，終端之間能夠共享信息、情境和其他功能，即便在休眠模式下也能如此。

AI時(shí)代的革新已經(jīng)開始，高通也正在從一家通訊企業(yè)轉(zhuǎn)變?yōu)橐患揖W(wǎng)聯(lián)計(jì)算處理公司，順應(yīng)時(shí)代的變化才能總是立于時(shí)代的潮頭。雷峰

本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。

如果侵犯了你的權(quán)益請(qǐng)來信告知我們刪除。郵箱：business@qudong.com

標(biāo)簽：大模型