ChatGPT帶火的大模型,在軟件應用領域一路高歌,與硬件設備的結合卻不疾不徐。
最先有動作的是微軟的老對頭谷歌。今年5月,後者公布新一代大語言模型PaLM 2,其代號爲“壁虎”的版本,每秒可處理約20個Tokens(大約爲16個單詞),適用於手機等移動設備,可以離线使用。並且,聯動谷歌旗下搜索、地圖、郵件、視頻等各類產品後,相應的功能可進行重構。
大模型向手機端蔓延的战火突然加速。6月29日,榮耀在上海世界移動通信大會上表示,未來將把AI大模型引入端側。7月初,搭載高通第二代驍龍8芯片的安卓手機,直接運行了參數規模超過10億的Stable Diffusion,只需要15秒左右就可以出圖。更重要的是,這是完全本地化,只依賴手機本身的算力。
8月初的華爲开發者大會上,隨着HarmonyOS 4的發布,基於AI大模型的全新技術,華爲的智能語音助手小藝也公布了三大方向的優化升級。
在華爲的構想中,旗下盤古大模型給小藝賦予的能力一改往日的呆板,看起來更加吸引人。但冷靜下來看,由ChatGPT引發的故事已經老套,這時各大廠商們爆出將大模型接入智能手機,究竟是噱頭還是創新?
“人工智障”有了大腦
移動端的智能語音助手,在過去的很長一段時間內,被人戲稱爲“人工智障”。
這種巨大的落差在於,藝術作品中的AI助手如《鋼鐵俠》中的賈維斯,拉高了人們的期待,而現實中無論是蘋果的Siri還是國產陣營的小愛、小度、小藝等,實際體驗都與智慧二字沾不上邊。大部分人或許有這樣的經歷,對語音助手下達指令時,得到最多的回復是“我不太明白你在說什么?”,甚至沒有反應,不得不尷尬地喊話多次。
而在大模型的賦能下,用華爲的話來說,小藝會變得“更聰明、更能幹、更貼心”,在1+8設備操控、語音交互、文案幫寫等方面都能處理得遊刃有余,能夠理解更爲復雜的場景對話,輸出相應的交互動作和內容。
這得益於華爲早前在大模型領域的布局。今年7月7日的華爲开發者大會2023(Cloud)上,華爲常務董事、華爲雲CEO張平安就宣布推出盤古大模型3.0,通用大模型、行業大模型及更爲細化的場景模型分別對應“L0~L2”三層模型架構,進而爲行業提供大模型服務。
最新迭代的HarmonyOS 4就融入了自身盤古大模型底層能力,能爲C端用戶帶來更智慧化、高效化、個性化的AI體驗。比如智慧助手小藝,在傳統的語音交互外,還擴展了文字、文檔、圖片等交互功能。用戶的表達可以更加模糊,口語化,能夠像與朋友交流一樣與小藝自然交互。
小藝背後的大模型就是在盤古L0基座大模型的基礎上,針對終端消費者場景構建了大量的場景數據與精調模型後的L1層對話模型,進而適用於終端消費者場景。
不過,根據官方發布會以及线下體驗視頻來看,華爲小藝確實展現出了如定鬧鐘、聽新聞、識別文字制作表格等,面對復雜內容時的良好表現能力。但由於目前受制於鴻蒙系統的正式發布,小藝也只是公布了測試計劃:在今年8月底开放邀請測試,並於晚些時候在搭載HarmonyOS 4.0及以上的部分機型通過OTA升級體驗。也就是說,從目前華爲公布的藍圖到落地,再到小藝融入尋常百姓家,這個過程中仍有着時間鴻溝。
參數、算力、能耗問題何解?
大模型顧名思義包含的參數規模是巨大的,訓練時的算力也成了關鍵。
中國工程院院士、鵬城實驗室主任高文把算力比作電力,認爲沒有大算力做大模型就是天方夜譚。華爲輪值董事長胡厚崑也提到,大模型訓練的效率或者是創新的速度,根本上取決於算力的大小。
因此,研發ChatGPT的OpenAI對英偉達A100/H100芯片的需求持續增加,訂單量超過數十億美元,並且造成了預計H100的43萬張缺口。同理,當手機上嵌入大模型後,其算力如何保證,以及算力背後的芯片性能如何提升,也影響着產品應用的使用體驗。
在能耗方面,榮耀CEO趙明表達過看法和擔憂:端側大模型在後台不斷地運行,AI低功耗的能力未來會是一個核心。未來端側大模型的時代,一定對續航的體驗不會產生大的影響,實現路徑上會在“更聰明的AI”和“更優的續航”之間做一個平衡。
因爲表現良好的模型規模較大,所需要的存儲空間也越多,所以更大的模型也意味着在推理訓練和運算的過程中需要更多的能耗。而目前行業中對移動端大模型壓縮精簡的方法主要是,通過知識蒸餾、輕量化模型架構、剪枝、量化等其中的一種或幾種方式進行壓縮後 “塞”到手機裏,最終的能耗和續航表現也需要在實驗室測試完畢後才能拿到市場進行驗證。
最後還要考慮大模型訓練時所需要的數據參數,放在手機上就是來自於語音助手的日常交互量。
據華爲終端BG首席運營官何剛介紹,華爲手機語音助手小藝月活用戶數超2億,智慧屏小藝日均喚醒次數爲7次以上。而小米旗下的小愛同學截止到3月27日,月活用戶達 1.15億,語音交互次數累計達2158億;激活小愛同學的設備數達4.59億,小愛同學支持控制共79類,支持智能產品共計5312款。對於語音助手的覆蓋數量來看,想要達到大模型的千億級參數量級以便能有更爲精准的交互和反饋,小藝、小愛同學還遠遠不夠看。
噱頭還是創新?
剛剛結束的小米新品發布會上雷軍提到,未來的小米將全面擁抱大模型,小愛同學也將第一時間用上大模型。與此同時有消息顯示,OPPO、vivo也都在發力於大模型領域,但最終的落地會稍晚一點。據國外媒體報道,蘋果也开始着急招聘大模型研發人才,其位於巴黎的AI研究所從Meta挖到了相關研發人員。
智能手機真的能在AI大模型的加持下,如愿捅破存量市場的天花板嗎?
一方面,部署在雲端的人工智能算法和App,在手機這類設備中應用時,往往存在三個短板:服務響應延遲高、服務個性化不足、雲端服務器壓力大。這不僅直接影響到用戶的產品體驗,而且會增加廠商對雲服務器的採購成本。
而作爲如今每年擁有十幾億出貨量的個人終端設備,智能手機就像是擁有大量闲置算力的移動計算單元,如果能在這些設備闲置時間裏將碎片化、分布式的算力利用起來,對於廠商和用戶來說會是一種雙贏的局面。
另一方面,智能手機廠商們在高度同質化的激烈競爭下,存量市場遲遲得不到突破,亟需新的技術和故事來拉動市場表現。而一直被認爲是雞肋的語音助手剛好是用戶的智能化入口,在對用戶的個性化需求理解方面更具優勢。
用語音助手來服務用戶的同時也面臨着一些爭議,比如訓練語言模型的數據是否合法?在這方面,華爲表示堅持以安全與隱私保護爲首要原則,主張更負責任的AI,所有AI體驗創新和場景設計的第一原則是安全與隱私保護。
AI大模型一日千裏,其發展故事早已不夠稀奇和吸睛,但由於其表現出的巨大技術潛力,剛好符合智能手機廠商對未來的期待,想要徹底在端側引爆大模型,還需要時間來鑑定。
參考資料:
如何把大模型裝入智能手機?榮耀CEO趙明:低功耗的AI算力是關鍵-鈦極客
Google 的 AI 大計劃:讓大模型變小、嵌入每一個產品-晚點LatePost
AI大模型會如何顛覆手機?-阿爾法工場研究院
原文標題 : 華爲小藝做起“賈維斯”夢
標題:華爲小藝做起“賈維斯”夢
地址:https://www.utechfun.com/post/251334.html