拿起能跑100+億參數(shù)大模型的手機(jī):0.6秒就進(jìn)入了AI世界
年初在手機(jī)上用AI生成一張圖還需要15秒,半年多后的今天只需要0.6秒,0.6秒大概就是點(diǎn)擊一下鼠標(biāo)點(diǎn)時(shí)間,數(shù)碼發(fā)燒友瑞澤被手機(jī)AI進(jìn)化的速度嚇到。
讓瑞澤同樣吃驚的是,10月底發(fā)布的AI PC處理器驍龍X Elite,能夠以30 tokens/s的速度運(yùn)行70億參數(shù)的生成式AI模型。
這比普通人每分鐘閱讀200-300個(gè)單詞,也就是每秒處理5-7個(gè)tokens的速度,快了好幾倍,就算問AI PC數(shù)字助理一個(gè)復(fù)雜答案,馬上就能得到答案。
觸手可及的智能手機(jī)和AI PC,已經(jīng)成為了進(jìn)入AI世界的任意門。
走進(jìn)終端AI的任意門里,用一張自拍照,無需等待就能生成超乎想象的照片;讓手機(jī)“看”幾秒食物,就能知道是否還能食用;對(duì)著貼身數(shù)字管家說出旅行的要求,瞬間就能獲得專門定制的旅行計(jì)劃。
“生成式AI在終端上的應(yīng)用呈幾何式增長(zhǎng),一年前我們只能看到一兩個(gè)用例,現(xiàn)在有數(shù)百個(gè),預(yù)計(jì)到2024年我們將會(huì)看到上千個(gè)用例,驍龍將會(huì)發(fā)揮非常核心的作用。”高通公司總裁兼CEO安蒙說,“我們見證了下一個(gè)轉(zhuǎn)型的開始,AI將無處不在。”
每一次重大技術(shù)革命的背后,都需要底層強(qiáng)大的計(jì)算和連接力作支撐,高通會(huì)成為這場(chǎng)AI變革的主角,讓端側(cè)AI像電力一樣全面融入普通人的生活。
能跑百億參數(shù)大模型,手機(jī)變身進(jìn)入AI世界的“任意門”
瑞澤最常用的手機(jī)AI功能是拍照,他沒料到,最新旗艦級(jí)第三代驍龍8具備運(yùn)行100億參數(shù)的生成式AI模型的能力后,不僅能將前后攝像頭的畫面實(shí)時(shí)合成在一起,將視頻中多余的人或物體去除,大幅增強(qiáng)夜景視頻效果,還帶來了超越想象的全新功能。
“照片擴(kuò)展”就是一個(gè)讓人眼前一亮的新功能,用戶使用任意照片進(jìn)行縮放,生成式AI都能讓照片看起來具有廣角的效果。比如用一朵花的照片,縮放后馬上就能會(huì)變成一片花海的照片。
端側(cè)生成式AI還有更多用法,如果用在工作中,一個(gè)電話會(huì)議結(jié)束之后,馬上就能獲得通話中聊到的重要事項(xiàng)并添加待辦事項(xiàng);
如果想去一個(gè)目的地,手機(jī)可以基于你所在的位置給出最符合你出行習(xí)慣的路線規(guī)劃;
如果你想開始徒步,簡(jiǎn)單輸入個(gè)人信息,再掃描一下皮膚狀態(tài),就會(huì)有私教般的運(yùn)動(dòng)訓(xùn)練建議。
這些任務(wù)都是在手機(jī)端完成,完全不用擔(dān)心隱私問題,也不用付月費(fèi),高通和合作伙伴就像是打開了生成式AI世界的任意門。
如此讓人眼前一亮的端側(cè)AI應(yīng)用的實(shí)現(xiàn)并非一蹴而就,在AI領(lǐng)域投入超過10年的高通,2015年首次將AI技術(shù)集成到商用的產(chǎn)品用,用于增強(qiáng)音頻技術(shù),此后逐步將AI應(yīng)用到了影像和視頻技術(shù)中。
三年前高通啟動(dòng)第三代驍龍8開發(fā)時(shí),終端智能就被放在了首位,這也是為什么第三代驍龍8一發(fā)布,手機(jī)端AI大模型文字生成圖片的速度就能從15秒速降到0.6秒。
“0.6秒的運(yùn)行時(shí)間帶來一個(gè)優(yōu)勢(shì),可以將這一模型嵌入相機(jī)應(yīng)用。”高通技術(shù)公司產(chǎn)品管理高級(jí)副總裁Ziad Asghar)表示,“消費(fèi)者通常希望拍攝之間最多間隔1-2秒,如果運(yùn)行一次模型需要15秒,將無法使用。”
第三代驍龍8如何實(shí)現(xiàn)數(shù)量級(jí)的AI性能提升?
強(qiáng)大的硬件是基礎(chǔ),第三代驍龍8的CPU性能相比前代提升高達(dá)30%,GPU性能提升25%,Hexagon NPU性能直接翻倍,第三代驍龍8的AI性能站在了行業(yè)之巔。
“通過改進(jìn)架構(gòu),提高向量加速器主頻、升級(jí)獨(dú)特的微切片推理技術(shù)等方式,來加速Transformer網(wǎng)絡(luò)推理。”高通技術(shù)公司產(chǎn)品管理總監(jiān)Lekha Motiwala介紹,第三代驍龍8支持業(yè)內(nèi)最新的LPDDR5-x內(nèi)存,頻率達(dá)到4.8GHz,通過更快的數(shù)據(jù)速度和更大帶寬支持用戶運(yùn)行更大、更復(fù)雜的AI模型。
要讓第三代驍龍8能夠以每秒生成20個(gè)token的速度運(yùn)行大語(yǔ)言模型(如Llama2),還需要升級(jí)高通AI軟件棧工具。
“我們先將龐大的AI模型量化到INT4,實(shí)現(xiàn)了性能、精度和能效間的絕佳平衡。再充分發(fā)揮業(yè)界最快DDR內(nèi)存的優(yōu)勢(shì),憑借77GB/s吞吐量來支持LLM,以驚人的速度運(yùn)行量化模型。”Ziad Asghar說,“Hexagon NPU能夠以閃電般的速度支持LVM。我們采用了一個(gè)100億參數(shù)模型,并使用了蒸餾等先進(jìn)技術(shù)和高效的UNET模型,大大加快了擴(kuò)散過程,達(dá)到了0.6秒這個(gè)如此驚人的速度。”
Ziad Asghar透露,SnapFusion支持Snap以同樣快的速度生成圖像,而不會(huì)犧牲圖像質(zhì)量。SnapFusion將在2024年支持Snapchat Dreams功能,支持用戶生成超乎想象的自拍圖片。
要激發(fā)基于第三代驍龍8平臺(tái)的端側(cè)AI創(chuàng)新,少不了高通AI軟件棧的優(yōu)化。
高通AI軟件棧的核心是高通神經(jīng)網(wǎng)絡(luò)處理SDK和高通AI引擎Direct,連接芯片與所有主流AI框架,高通利用托管模型,開發(fā)者可以直接使用TensorFlow、ONNX、PyTorch,輕松訪問Hexagon NPU,這將大幅降低基于第三代驍龍8移動(dòng)平臺(tái)進(jìn)行AI創(chuàng)新的門檻。
除了AI圖像生成,聊天機(jī)器人也是生成式AI世界的另一類重要應(yīng)用。
為了讓能夠?qū)崿F(xiàn)聊天機(jī)器人功能的大模型在終端上流暢運(yùn)行,高通使用了推測(cè)性解碼的技術(shù)。“我非常興奮地宣布,這是預(yù)測(cè)解碼首次在邊緣終端中使用。”Ziad Asghar說。
如果要為聊天機(jī)器人加上一個(gè)虛擬形象,可以利用高通AI引擎中Adreno GPU強(qiáng)大的渲染能力,渲染出嘴形和聲音同步的AI虛擬形象。
出色的AI體驗(yàn)還不能僅靠單一的輸入或輸出形式,視覺、文本、語(yǔ)音的結(jié)合更為直觀,這就是多模態(tài)AI。
第三代驍龍8支持多模態(tài)AI,還能充分利用用戶手機(jī)上的全部數(shù)據(jù),利用LoRA等端側(cè)學(xué)習(xí)技術(shù),可以在保障用戶數(shù)據(jù)隱私的同時(shí),讓終端側(cè)的AI模型變好的同時(shí)更加個(gè)性化。
比如,詢問AI助理回家的最佳路線或推薦的餐廳時(shí),云端AI方案給出的回復(fù)是通用答案。而基于第三代驍龍8的AI終端,發(fā)揮高通傳感器中樞與終端側(cè)大語(yǔ)言模型持續(xù)協(xié)作,能夠基于用戶的年齡、最喜歡的活動(dòng)、當(dāng)前位置等個(gè)人信息生成定制化回復(fù)。
以搭載第三代驍龍8手機(jī)為代表的終端側(cè)AI,性能足,節(jié)省成本和時(shí)間,并且更加隱私和安全、還能提升個(gè)性化,是觸手可及的AI世界任意門。
同樣觸手可及的PC也會(huì)是進(jìn)入AI世界的任意門嗎?
AI性能6年提升100倍,AI PC提高效率又激發(fā)創(chuàng)意
AI PC才是進(jìn)入AI世界的另一個(gè)任意門。
“回顧行業(yè)歷史,僅有兩項(xiàng)其他技術(shù)像如今的AI一樣具有顛覆性。二十世紀(jì)六七十年代,命令行的盛行使得個(gè)人電腦的廣泛使用成為可能。
二十世紀(jì)九十年代,圖形用戶界面讓普通用戶能夠輕松、容易地使用PC。”惠普公司高級(jí)總監(jiān)Bobby Moore 在2023驍龍峰會(huì)上說,“AI正推動(dòng)PC計(jì)算變革,使其變得更加個(gè)性化、更加自然、更加直觀。”
高通技術(shù)公司高級(jí)副總裁兼手機(jī)、計(jì)算和XR業(yè)務(wù)總經(jīng)理阿力克斯·卡圖贊(Alex Katouzian)也表示,“目前,我們?cè)诤饬縋C性能方面處于轉(zhuǎn)折點(diǎn),雖然CPU和GPU依舊至關(guān)重要,但同時(shí)我們引入了第三個(gè)衡量維度:終端側(cè)AI。”
過去很長(zhǎng)一段時(shí)間,普通消費(fèi)者選擇筆記本電腦的時(shí)候很難兼顧輕薄外形和高性能,驍龍X Elite的發(fā)布,讓筆記本電腦實(shí)現(xiàn)了輕薄外形下的超高性能和超高能效,特別是強(qiáng)大的AI功能。
驍龍X Elite搭載的高通自研Oryon CPU,相比蘋果M2 Max,實(shí)現(xiàn)相同單線程性能,Oryon CPU能耗減少30%。對(duì)比專門為高性能游戲終端設(shè)計(jì)的i9-13980HX CPU,Oyron實(shí)現(xiàn)相同性能功耗降低70%,成為了PC移動(dòng)處理器領(lǐng)域性能和能效的新標(biāo)桿。
GPU性能也艷壓群雄,與性能領(lǐng)先的x86集成GPU相比,驍龍X Elite的性能領(lǐng)先高達(dá)80%,達(dá)到競(jìng)品的最高性能功耗可以降低80%。
作為專為AI PC而生的處理器,驍龍X Elite的AI性能更加驚艷,Hexagon NPU算力可以達(dá)到45 TOPS,是競(jìng)品近期發(fā)布NPU的4倍。包含CPU、GPU和NPU在內(nèi)的整個(gè)高通AI引擎,可以讓驍龍X Elite的AI性能達(dá)到75TOPS。
驍龍X Elite高達(dá)75TOPS的AI性能,是高通驍計(jì)算平臺(tái)6年AI性能提升100倍里程碑。這樣強(qiáng)勁的AI性能可以在沒有云端資源的情況下運(yùn)行超過130億參數(shù)的AI生成式模型。
與第三代驍龍8一樣,驍龍X Elite的Hexagon NPU同樣做了大量升級(jí),包括增加全新的供電系統(tǒng)兼顧極致性能和功耗,引入微切片推理,對(duì)張量加速器進(jìn)行升級(jí),增加共享內(nèi)存規(guī)模。
這讓驍龍X Elite這個(gè)性能猛獸應(yīng)對(duì)AI任務(wù)游刃有余。
DaVinci Resolve的付費(fèi)版包含一系列在好萊塢創(chuàng)意界被廣泛使用的AI強(qiáng)大功能,比如MagicMask支持近乎即時(shí)的物體追蹤/輪鏡、AI賦能的自動(dòng)字幕生成和剪輯,以及音軌分離和對(duì)話平衡器來實(shí)現(xiàn)卓越音質(zhì)。
對(duì)于支持AI的計(jì)算密集型Magic Mask,驍龍X Elite比采用集成GPU的高端十二核x86處理器快1.7倍。Magic Mask在驍龍X Elite的集成NPU上運(yùn)行,比在同為Arm架構(gòu)的12核處理器上運(yùn)行快3倍,這是讓所有創(chuàng)作者興奮的效率提升。
將于2024年發(fā)布的搭載驍龍X Elite的筆記本電腦,可以運(yùn)行原生ARM64的DaVinci Resolve。
AI原生公司Uniphore用上為AI而生的驍龍X Elite,AI PC作為生產(chǎn)力工具的效率會(huì)進(jìn)一步提升,Uniphore將生成式AI模型用于語(yǔ)音到文本轉(zhuǎn)錄、情緒分析和通話摘要,幫助企業(yè)交付更高質(zhì)量的服務(wù)的同時(shí),降低使用云端AI的成本。
“商業(yè)筆記本電腦大約占一半的PC銷量。”高通技術(shù)公司產(chǎn)品管理高級(jí)總監(jiān)Nitin Kumar表示,“94%的商界領(lǐng)袖表示,AI已在工作中提高生產(chǎn)力。在IT決策者中,AI是影響購(gòu)買決策的最大因素。新的研究表明,近一半的IT決策者準(zhǔn)備基于AI性能更換PC品牌。驍龍X Elite恰逢其時(shí)。”
大幅提升效率的同時(shí),驍龍X Elite還能激發(fā)出更多AI用例,驍龍X Elite集成的高通傳感器中樞進(jìn)行了升級(jí),性能提高2倍的同時(shí)還保持超低功耗,加上率先引入的始終感知ISP,端側(cè)AI節(jié)省成本和時(shí)間,更加隱私和安全、提升個(gè)性化的優(yōu)勢(shì),也能在AI PC上展現(xiàn)的淋漓盡致,讓PC游戲更有沉浸感,生產(chǎn)效率更高。
端側(cè)生成式AI的大門全面開啟
與AI PC和手機(jī)開啟AI無處不在時(shí)代的,還有各種形態(tài)的終端AI設(shè)備。
2023驍龍峰會(huì)上最新推出的高通S7音頻平臺(tái)的AI性能是前代平臺(tái)的100倍,強(qiáng)大的AI能力可以提高使用者沉浸式音頻應(yīng)用的精準(zhǔn)性。
“我們不僅設(shè)計(jì)了完全在終端上運(yùn)行的AI技術(shù),這些功能還將擴(kuò)展至我們的全部產(chǎn)品線。”Ziad Asghar說,“我們將從產(chǎn)品形態(tài)最小的功能開始,比如智能手表中的活動(dòng)建議和AR眼鏡中的3D LVM,到電動(dòng)車中的終端側(cè)助手。”
為了和生態(tài)合作伙伴一起加速AI時(shí)代的到來,高通還推出了高通AI軟件棧模型,這是一套能夠滿足開發(fā)人員需求的模型,模型經(jīng)過高通公司的全面優(yōu)化、測(cè)試和驗(yàn)證,可支持第三代驍龍8和驍龍 X Elite平臺(tái),發(fā)布之時(shí)有30多個(gè)模型,更多模型會(huì)持續(xù)推出。
谷歌也是推開端側(cè)生成式AI大門的重要力量。過去幾個(gè)月,谷歌的研發(fā)團(tuán)隊(duì)致力于對(duì)其規(guī)模龐大的下一代大語(yǔ)言模型進(jìn)行精煉,以適應(yīng)移動(dòng)終端。
為了讓無處不在的AI時(shí)代有無縫的體驗(yàn),高通還準(zhǔn)備好了包含硬件和軟件框架的解決方案Snapdragon Seamless,讓用戶能夠創(chuàng)建連接智能手機(jī)、筆記本電腦、平板電腦、耳塞、智能手表和XR設(shè)備的自組織智能網(wǎng)絡(luò),終端之間能夠共享信息、情境和其他功能,即便在休眠模式下也能如此。
AI時(shí)代的革新已經(jīng)開始,高通也正在從一家通訊企業(yè)轉(zhuǎn)變?yōu)橐患揖W(wǎng)聯(lián)計(jì)算處理公司,順應(yīng)時(shí)代的變化才能總是立于時(shí)代的潮頭。雷峰
本站所有文章、數(shù)據(jù)、圖片均來自互聯(lián)網(wǎng),一切版權(quán)均歸源網(wǎng)站或源作者所有。
如果侵犯了你的權(quán)益請(qǐng)來信告知我們刪除。郵箱:business@qudong.com