將AI大模型引入終端,高通混合AI引領下一個時代

2023-07-13 18:22:30    編輯: robot
導讀 隨着下半年的到來,搭載下一代旗艦芯片的新機很快就要與消費者見面了。以往我們在暢想下一代智能手機之時,大家最感興趣的還是性能、功耗、遊戲、拍照等等,但今年有點不同尋常,當下正處於智能手機AI體驗變革的...

隨着下半年的到來,搭載下一代旗艦芯片的新機很快就要與消費者見面了。以往我們在暢想下一代智能手機之時,大家最感興趣的還是性能、功耗、遊戲、拍照等等,但今年有點不同尋常,當下正處於智能手機AI體驗變革的前夜,或許下一刻,一台真正的“萬能助手”就將來到我們身邊。

不要認爲筆者說得誇張,想一想ChatGPT是如何在短短兩個月就實現月活用戶突破一億?再想一想互聯網大廠齊聚生成式AI賽道,AIGC應用又是如何一夜之間成爲行業“新風口”的?只能說技術發展的太快,改變往往只是一瞬間的事情。

當然,好的前景是一回事,能否實現快速落地就是另外一回事了,畢竟這需要廠商和开發者以及整個行業的共同努力才行。好消息是,在生成式AI探索最前沿,我們不僅看見了OpenAI、微軟、谷歌、百度、阿裏等國內外科技企業的身影,同樣還有高通這樣的全球知名芯片廠商,在爲AI規模化發展添磚加瓦,種種表現似乎都在告訴我們一件事:這次是要玩真的了。

推動AI規模化發展,混合AI是趨勢

一般來說,AI處理通常會部署在雲端和終端側,其中像ChatGPT這類大家熟悉的生成式AI應用,其背後需要動輒數十億參數的各類大模型作爲支撐,而AI大模型越復雜,越需要大量的計算資源和更長的訓練時間,因此幾乎都在雲端部署運行。

但無論是在雲端進行AI訓練,還是執行大模型處理,都是一個不小的成本,特別它的推理成本是隨着日活用戶數量以及使用頻率增加而增加的,很顯然,這會是一個極高的成本,也並不利於AI規模化發展。

基於這樣的現狀,高通在不久前正式發布《混合AI是AI的未來》白皮書,自此,“混合AI”开始走向台前。

所謂混合AI,簡單理解就是在雲端和邊緣終端(智能手機、PC、汽車以及其他終端設備)之間分配並協調AI工作負載,從而實現更強大、更高效且高度優化的AI。

在高通看來,混合AI在成本、能耗、性能、隱私、安全和個性化方面有着顯著優勢,並且幾乎適用於所有生成式AI應用和終端領域。

仍舊以成本爲例,生成式AI搜索可以提供出色的用戶體驗和搜索結果,但它的成本也是傳統搜索方法的10倍,隨着用戶數量和查詢次數的增多,企業運營成本將會是一個天文數字,而且這還不包括硬件、數據中心場地、能耗、運營、額外帶寬和網絡傳輸的成本,如果都算上,成本還會持續增加。

混合AI則不同,目前全世界有數十億台已部署或者具備AI能力的終端設備,這些終端設備能夠獨立,或者與雲端協同,主動承擔起相當大一部分計算負載,如果是智能手機、PC等設備生成文本或者圖片,成本將會非常低,甚至沒有成本。從這一點就不難發現,相比單一的雲端AI,混合AI策略確實更有利於推動AI規模化發展。

下沉終端,高算力平台是關鍵

當然,依靠混合AI策略實現AI規模化擴展,關鍵在於終端一側。雲端不受設備體積和功耗限制,因此可以提供足夠算力。但終端設備卻不在此列,試想,如果讓手機跑大模型,發熱和續航會是一個令人頭疼的問題。

但這個問題並非無解,僅從手機行業來看,高通其實已經取得了一些突破。此前,高通AI Research利用高通AI軟件棧執行全棧AI優化,這一全棧優化最終讓Stable Diffusion能夠在智能手機上高效運行,在15秒內執行20步推理,生成一張512x512像素的圖像。


全球首個運行在Android手機上的Stable Diffusion終端側演示

Stable Diffusion是一個基於輸入的文本生成圖片的AI模型,它的參數超過10億,這樣的參數規模過去只能在雲端計算集群內運行,如今能夠在手機終端運行,除了結合高通AI軟件棧和AI Studio提供全棧AI能力和優化外,高通AI引擎強悍的AI性能同樣不容忽視。


全球最快的手機上的ControlNet終端側演示

值得一提的是,在剛剛結束的2023世界人工智能大會,高通首次展示了全球最快的手機端“ControlNet”用例演示,該模型有15億參數,並可以完全在手機上運行,只需不到12秒就能生成一張AI圖像。

其實高通並非AI領域的“新玩家”,早在2015年的驍龍820芯片上,就已經推出了高通第一代AI引擎,從此之後,AI就和智能手機緊緊綁定了在一起,從視頻拍照到語音助手,從系統資源調度到溫度控制,從信號增強到網絡穩定,幾乎都有AI的影子。

去年,高通正式發布了第二代驍龍8移動平台,它搭載最新的高通AI引擎,全新升級了Hexagon處理器,提升了分組卷積、激活函數加速和Hexagon張量加速器的性能,支持微切片推理和INT4硬件加速,從而可以快速高效地運行Transformer網絡,以及前面提到的,行業內率先在終端側支持Stable Diffusion、ControlNet等生成式AI用例。

目前,第二代驍龍8移動平台已經可以支持參數超過10億的AI模型運行。未來幾個月內,隨着終端側處理能力的持續提升,更將有望支持擁有100億或更高參數的模型在終端側運行,爲智能手機搭載生成式AI應用鋪平道路,進一步激發混合AI的潛力。

助力AI發展與應用,高通優勢突出

和很多互聯網科技企業不同,高通在AI領域具有自己獨特的優勢,作爲業界領先的芯片廠商,高通業務遍布全球以及各個行業,採用高通解決方案的終端設備規模十分龐大,每年還有每年有數億台的新終端還在進入市場,在衆多設備中,除了智能手機外,更有汽車、XR頭顯與眼鏡、PC以及其他物聯網終端,完全滿足終端側AI大規模落地的需求。

此外高通還爲此开發了高通AI軟件棧(Qualcomm AI Stack),爲OEM廠商和开發者提供一套完整的AI解決方案,它集成所有AI框架、开發者庫、操作系統的整合平台,也同時具備了“一次开發,多終端使用”的特點,爲AI由單一終端擴展到其他各種終端提供了便利。

與此同時,高通在無线領域堪稱“難逢敵手”,高通最新的5G芯片驍龍X75,已經5G-Advanced擴展至手機、汽車、衛星通信、計算、工業物聯網等全部關鍵垂直領域,而AI與5G的結合還將催生出更多新的應用場景,爲傳統行業帶來新的發展機遇。

總的來說,“混合AI”是基於高通自身優勢而來的一種策略,與生成式AI未來的發展路徑高度吻合。相信隨着AI大模型參數越來越小,以及終端AI能力的不斷增強,混合AI架構將真正推動人工智能走進千家萬戶,惠及百業千行,真正創造一個觸手可及的AI世界。



標題:將AI大模型引入終端,高通混合AI引領下一個時代

地址:https://www.utechfun.com/post/237426.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡