那邊適道剛盤點完2024年的AI預言,這邊三星就宣布將在今年1月18日推出新款Galaxy手機,並引入多項AI功能,包括但不限於:視頻AI處理、本地AI聊天機器人、通話實時翻譯等等。相比之下,蘋果iPhone16要搞的“AI大動作”還在外界的猜測中。
可以看到,幾乎在所有預言中,AI硬件爆發和邊緣計算都有被提及。不過,盡管AI硬件包含XR眼鏡、“領帶夾”AI Pin,甚至是比爾蓋茨提到的智能耳機。但就目前來看,智能手機,一個人人都離不开的“器官”,最可能先被AI改造。
2007年,隨着第一代iPhone橫空出世,智能手機時代就此拉开序幕。17年來,手機屏幕越來越大,攝像頭越來越多,功能越來越強大。然而,顛覆性創新似乎沒有出現,即便你可以從“會說話的湯姆貓”玩到“王者榮耀”。
無論是“卷誰屏幕更大”還是“卷誰劉海更短”,內卷的本質是科技創新的停滯。如今,AI技術的突飛猛進讓智能手機廠商久旱逢甘露。近日,高通CEO Cristiano Amon在接受FT採訪時預測,2024年將成爲全球AI智能手機的關鍵元年,生成式AI正在“非常、非常快”的進入手機。
有句話“立場決定嘴巴。”早在去年3月,Amon就表示:在ChatGPT熱潮之下,手機將成AI主流設備,並帶領高通成爲AI公司。
當然,高通急於“押寶”的心情可以理解。2021年7月,Amon出任高通CEO,並將工作重心放在尋找5G應用場景,探索5G時代硬件形態等推動5G發展的事業上。結果是,5G技術並沒有帶來手機銷量銷量的“大躍進”,反而是彎道超車的英偉達,用GPU擠出了一片天。
在此背景下,去年6月,高通的高級副總裁 Alex Katouzian 宣布,高通正在從一家通信公司過渡到一家智能邊緣計算公司。
那么,換道鑽研邊緣計算的高通如何看待發生在終端設備上的AI革新?適道簡譯了FT對Amon的採訪,試着梳理出一些要點。
01 爲什么不能100%在雲端?
首先,提出一個根本問題:爲什么執着將模型塞進手機裏?AI運算放在雲端不好嗎?
終端側,即可以直接和用戶交互的設備,例如手機、汽車、XR眼鏡等。具有兩個特點:一是個體相對復雜,部署起來各有各的難點;二是本地芯片算力有限,帶不動大模型。(雖然蘋果最新發布的Flash-LLM技術可能會改變這一情況。)
因此,在雲端部署AI模型是一條正確的思路。
然而,這其中也有一些限制。一是,雲計算帶寬不足。例如,高速公路上的無人駕駛汽車要在毫秒內做出反應,即便雲端算力足夠,帶寬也無法承載。
二是,雲計算不能保證隱私。例如,用生成式AI撰寫包含敏感財務數據文檔時,你一定不想將這些數據上傳到雲端。
三是,傳統雲端AI交互性差。例如,你要向ChatGPT發出一串明確的Prompts,它才會作出響應。但在理想情況下,你更想讓ChatGPT預測出自己的每一個動作,主動理解需求並提供服務。
Amon在採訪中表示:一方面,隨着訓練方法的改進,一些更小型、高效的AI處理器和模型將被集成到便攜設備中。端側芯片的算力困局得到了解決;另一方面,更多混合型AI將在設備上運行,即一部分AI處理在端側進行,而另一部分在雲端完成。這種方法可以降低運行AI的成本。例如,开發者基於在終端運行的Stable Diffusion創建應用程序,生成每張圖像將承擔很低的查詢成本,甚至完全沒有成本。
對此,Amon還提出了一條人類運算史的發展規律:“創新最初出現在集中化的系統(大型計算機或雲計算中),隨後轉移到更分散的系統(PC和手機)。”
02 AI手機將如何改變生活?
具體來看,以端側AI爲代表的AI手機將如何改變我們的生活?
Amon從兩個層面回答了這個問題。
一是,響應速度更快。例如文生圖大模型 Stable Diffusion的參數超過了10億,但目前在手機上運行僅花費0.6 秒就能生成一張圖像,大大提高了用戶拍照和編輯圖片的體驗。
二是,可實現更深層次交互。不同於傳統智能手機只能操作單一應用,AI手機由生成式 AI 調動所有應用協同工作。例如,訪問用戶的實時上下文信息(如位置、當前活動等),提供定制化服務。
Amon舉了一個發短信的例子。你正在編寫發給Clare的短信,此時部署在手機裏的AI會思考“這裏有我要做的事嗎?”。當你寫道:想和Clare約下周二見面。AI助手會調出日程表,提示你的空闲時間,詢問是否給Clare發送邀請;而當你又寫道:剛和家人度過了一個美好的假期。AI會跳出來:這些是你拍的照片,想分享給Clare嗎?
Amon表示,不同於連比爾蓋茨都吐槽過的微軟Clippy,當前的AI應用更加精確和智能。過去的技術難以准確理解用戶語言和上下文含義,需要對每個一步驟進行編程。而現在,內置AI的設備能夠更准確地學習用戶的行爲和偏好,並提供更個性化,且不打擾用戶的體驗。
至於AI手機能否刺激消費者市場,Amon非常樂觀:“這是一個價值數十億美元的問題。你將在2024年初看到搭載多種AI用例的手機。它有潛力創造智能手機的新升級周期。最終你會說:‘我的舊手機已經用了四年,但現在我想購买一部可以運行AI的新手機。’你不得不买一部新手機,因爲這關乎那些新平台上將出現的計算引擎。”
03 “訓練”芯片轉向“推理”芯片
當我們談論AI大模型時,芯片制造商有兩個角色:一是事先處理所有數據來構建模型,被稱爲“訓練”;二是在實際應用中使用模型,被稱爲“推理”。
Amon表示,芯片制造商的主要战場會由“訓練”轉向“推理”。
目前AI市場主要集中在使用大數據訓練模型的“訓練”階段,英偉達是主要受益者。但Amon表示,隨着AI模型變得更小巧、能夠在設備上運行並專注於特定任務,芯片制造商的主要市場將轉向“推理”,即模型的應用。數據中心也开始對專門用於已訓練模型推理的處理器感興趣,這一切預示着推理市場將大於訓練市場。
Amon的話有暗戳戳給自家貼金的嫌疑。公正起見,我們也來看看高通的老對手——英偉達。
去年11月,英偉達發布了新一代GPU——H200。相較H100,其實H200在算力方面提升並不明顯。數據顯示,在GPT-3175B大模型的訓練中,H200只比H100強了10%。
但在處理Llama 2等大語言模型時,H200的推理速度比H100提高了接近1倍。
也就是說,無論是高通還是英偉達,都提前切中了“推理”和“模型應用”這一要點。在接下來的時間裏,我們或許將會看到新的競爭格局和新的贏家。
04 改變iOS和Android雙雄格局
Amon表示:目前負責構建和運行AI大模型的公司(如OpenAI、Anthropic、微軟、亞馬遜和Meta)和生產智能手機及操作系統的公司(如蘋果、谷歌和三星)存在很大不同。
但隨着將AI模型放進手機裏,微軟和Meta等公司可能會重獲影響力,改變由iOS和Android長期主導的行業格局。然而,實現這一目標需要手機制造商、操作系統开發商和應用开發商之間的合作,而這種合作實現起來也不太容易。
和App Store不同,AI模型將被預先安裝在設備引擎中。移動平台將支持第一方和第三方模型,以及原始設備制造商(OEM)的模型。這就像將相機功能內置在設備中一樣,不同的AI引擎也將內置於設備中。
另外,除了AI手機,Amon表示,他本人始終看好輕便型的可穿戴設備,比如AR眼鏡,(沒有提VR)。一是產品會變得更輕,用戶能夠佩戴更長時間。二是隨着這些設備功能增多,更優質的內容將會出現。他相信,隨着市場規模的擴大,开發者將愿意投入更多資金,進一步推動更豐富的內容。
結語
2024年,隨着AI大模型應用落地,智能手機進化的號角也終於吹響。
根據市場研究機構Counterpoint預測,2024年生成式AI智能手機出貨量有望突破1億支,在整體智能手機中佔比8%;2027年出貨量有望達到5.22億支,佔智能手機比重40%。2023-2027年復合成長率達83%,這或將在五年內,引發一場關於交互方式的革新。
可以預見的是,無論是三星、蘋果還是其他廠商,都會在巨大的壓力和機遇中完成智能手機的第二次革命。現在,AI改造終端的浪潮才剛剛开始,我們將持續觀察。
原文標題 : 預言成真!高通CEO:2024將成爲AI手機關鍵元年
標題:高通CEO:2024將成爲AI手機關鍵元年
地址:https://www.utechfun.com/post/318392.html