隨着去年ChatGPT走紅後,大模型的熱度便持續不減,AI技術正在加速顛覆各行各業。近日,一則奔馳與微軟合作將ChatGPT接入車輛測試的消息引發輿論關注,微軟發言人稱其是ChatGPT在汽車上的首次應用。一時間,關於“大模型上車”的話題开始頻頻見諸報端。事實上,從今年上半年开始,國內衆多科技巨頭就已經紛紛發布了旗下的AI大模型產品,如百度文心一言、阿裏通義千問、訊飛星火等,並且已經开啓了與主機廠之間的合作。業內普遍認爲,AI大模型有望將汽車智能化帶到一個前所未有的高度。前景固然美好,但AI大模型上車真的會順風順水么?
何爲AI大模型?
簡單來說,AI大模型是基於深度學習技術的人工智能模型。通過人工智能技術,使用數以億計的參數和計算資源進行大規模、高復雜度的學習和訓練,從而實現自然語言處理、圖像識別、語音識別等復雜任務。從功能上來看,AI大模型在汽車領域有兩種可能的落地形式。
一類是用於人工智能對話交流,大多數應用在智能座艙。比如此前發布的百度的文心一言,已有東風日產、紅旗、長城以及吉利銀河等近十家車企宣布接入;阿裏巴巴也宣布AliOS智能汽車操作系統已接入通義千問大模型進行測試等。很多業內人士認爲,智能座艙在AI大模型的賦能下將有着質的提升,尤其將爲人機交互打开新的大門。通過大數據的深度“喂養”和自主學習,車載語音助手可以從任務型逐步升級爲闲聊型,智慧程度更接近真人,且具備情感化,從而推動智能汽車向第三生活空間轉變,滿足乘客更深層次的生理和心理需求。而這也符合大多數用戶對於AI大模型上車的期待,通過AI技術提升智能座艙內語音交互表現。
另一類則與智能駕駛有關。自從2020年特斯拉將Transformer大模型引入自動駕駛領域中,便打开了AI大模型在自動駕駛領域應用的大門。可以說,AI大模型更快速、准確地解決認知和決策問題的能力,爲車輛自動駕駛能力的提升提供了核心驅動力。今年4月,毫末智行發布了自動駕駛生成式大模型DriveGPT,通過引入駕駛數據建立 RLHF(人類反饋強化學習)技術,對自動駕駛認知決策模型進行持續優化,終極目標是實現端到端自動駕駛。百度自動駕駛業務部總經理陳卓認爲,AI技術加速了自動駕駛規模落地,自動駕駛是人工智能的典型應用場景。
AI大模型有望重塑智能汽車
現階段,以智能化、電動化爲顯著特徵的新汽車正在重塑人們的駕駛與出行體驗,汽車已經不單純是出行工具,而是具有交互主體多、交互方式多、計算零件多、數據規模大,以及空間屬性和社會屬性等特徵,而這些正是AI大模型最適合的應用場景。中國工程院院士、清華大學教授、國家智能網聯汽車創新中心首席科學家李克強認爲,AI大模型在處理文本、獲取和加工數據、建立場景的訓練和迭代方面的優勢,將會對人機交互智能化和智能駕駛方面起到加速推動作用。
相比按鍵、觸屏和手勢控制,通過語音方式完成對車輛軟硬件的控制不僅學習成本低,而且在操作時手也不用離开方向盤,安全性也要更高。但從近兩年的客戶端反饋來看,普遍使用率比較低,這其中最主要的原因就是用戶體驗差。現階段,部分車企對於語音交互技術掌握的不夠成熟,不僅沒能爲用戶帶來更好的智能化體驗,然而平添不少麻煩。此前就有一名汽車大V在社交媒體上抱怨,自己在某款自主新能源車後排休息聽語言類節目時,車載語音頻繁出錯,誤以爲後排有人呼喚它而打斷節目播放。
AI大模型上車後,對話機器人可以通過高質量的大數據持續訓練,從而讓車載語音助手的智慧更加接近真人,在與用戶交互過程中具備情感化。簡單來說,以往的車載語音助手只是單純的執行用戶的指令,屬於命令式交互;而在AI大模型的加持下,轉變成能和用戶“闲聊”的夥伴,屬於對話式交互。以理想汽車爲例,在其車載AI助手“理想同學”升級搭載了自研的“Mind GPT”認知大模型後,人車對話內容更加復雜多樣,包括地點、信息、菜譜等,甚至還可以給你講故事、畫畫等。這背後是數十TB的原始訓練數據,經過精心過濾和去重後,相當於具備人類高質量知識總和。
另外,AI大模型還可以對用戶大量行爲數據進行分析和學習,生成更加准確的用戶畫像,從而能夠理解用戶的喜好、需求和用車行爲,提供更具個性化的服務。比如你和車載語音助手說“我餓了”,它會推薦你常去的餐廳或你喜歡喫的食物等。
除了能提升車載語音助手的智能化水平外,AI大模型在智能駕駛領域擁有更多的落地場景。華泰證券在研報中指出,GPT大模型有望賦能垂直領域智能駕駛感知標注、決策推理等核心環節,加速智駕落地。
AI大模型的自學習算法能力在汽車駕駛過程中發揮的關鍵作用主要體現在感知和決策層面。就感知層面而言,以往自動駕駛感知使用的都是各個小模型“堆疊”的方式,識別的原理就是自己先看,然後去知識庫裏比對,如果以往沒有學習過,那就無法准確識別出來。這種方法對於感知能力的提升是有限的,因爲路況的變化是日新月異的。此前特斯拉高速撞上側翻的白色貨車,就有可能是將側翻的車廂誤判爲是天空或者強反光地面。而有了AI大模型的加入後,可以在有限的標注數據前提下,找到相似障礙物之間的相關性。有了這個認知後,在遇到新的物體時,大模型可以對比這個物體與之前所認識到共性,由此判斷是否是個障礙物。
目前,自動駕駛的數據來源主要有真實數據、虛擬仿真和影子模式。其中虛擬仿真在AI技術的加持下,可大量合成虛擬場景以用於模型訓練和測試,從而提高自動駕駛技術精度以及自動感知泛化能力,帶來更安全、可靠的駕駛體驗。
此外,AI大模型具備對海量數據的處理能力以及多維度分析能力,可以通過分析駕駛行爲數據來訓練自動駕駛控制系統。特別是在決策層面,高等級自動駕駛的認知決策需要更加智能化和人性化,AI大模型加入後,傳統的決策規劃方法將從基於規則向基於自學習的決策智能方向發展,可以讓車輛更加聰明地處理復雜場景。同時,基於海量數據處理的分析能力,幫助汽車准確識別和預測交通情況,並實時提供個性化出行服務,優化出行效率。
AI大模型上車充滿挑战
拋开汽車而言,AI大模型本身也是一個相當燒錢的項目,雖然現階段”百模大战”將市場烘托的一片紅火,但部分投資圈人士表現的卻十分謹慎,認爲最終勝出的企業不超過2個。而對於AI大模型上車,雖然目前已經有了一些成果出現,但想要達到深層次的結合,面臨的不確定因素還有很多,包括算法、算力和數據支持,以及安全性、法律法規等方面,還有很長的路要走。中國工程院院士、清華大學教授、國家智能網聯汽車創新中心首席科學家李克強認爲,目前汽車領域對於大模型的應用還處於初期的嘗試階段,後續仍需基於雲平台進行打通,向深層領域應用推進仍然任重道遠。
AI大模型上車,首當其衝要面臨的就是數據隱私和安全問題。人工智能的不斷成長,在爲我們日常用車生活帶來便利的同時,也存在數據隱私泄露的風險。AI大模型訓練需要非常龐大的數據量,投喂的數據越多,車輛也會變得更聰明,輸出的信息也會更加准確。但這個數據投喂過程中,大量車主信息被記錄,比如圖像、聲音、行爲特徵,以及其他一些敏感隱私信息。一旦遭遇黑客攻擊,在大數據分析下,通過圖像、聲音等信息比對就可以獲取到更多的車主隱私信息。前一段時間特斯拉就被曝出數據泄露醜聞,特斯拉員工通過內部消息系統,私下分享車主攝像頭記錄的隱私視頻和圖像。所以在AI大模型與汽車深層次結合前,首先要解決的就是數據隱私安全問題。
其次,硬件配置問題。AI大模型的運行需要高規格的硬件配置支持,需要具備高算力、大容量內存以及低時延的特性。但現階段車載設備的硬件水平雖然有所提升,但還無法達到支撐AI大模型運行的水平。以自然語言處理(NLP)的預訓練模型GPT-3爲例,需要數萬億次TOPS的計算能力,這就要求芯片的算力至少要在萬級TOPS以上才能夠勝任計算工作。但從目前的車載硬件部署來看,即便目前蔚來、理想等造車新勢力使用的英偉達Orin X芯片,單顆算力也僅爲254TOPS,這已經是目前量產車中算力最高的芯片,遠遠達不到大模型的計算要求。
所以,要想爲AI大模型提供海量算力,現階段最好的辦法就是通過雲計算來實現,但這其中有涉及到通信的問題。在千億、萬億參數規模的大模型訓練過程中,通信的佔比最大可達50%,傳統的網絡帶寬遠遠不夠,這就會造成網絡堵塞,出現時延問題。但你想過沒有,如果這個AI大模型應用在自動駕駛領域,哪怕只有一點點的通信時延,那就有可能在公路上造成無法挽回的悲劇。
而提到高算力、雲計算和高速網絡,這些又都與成本掛鉤。據普超資本微信公衆號顯示,GPT-3訓練成本預計在500萬美元/次。當然,GPT-3還只是OPEN AI在2020年推出的模型。如今到GPT-4,參數相較GPT-3呈百倍增長,那所需花費的成本勢必要以億美元爲單位了。因此AI大模型也只有那些科技巨頭能玩的轉,其他中小企業只能是花錢來使用。對於車企而言,即便未來通過與科技巨頭的合作實現AI大模型與汽車深度融合,後期隨着大模型的數據規模不斷增長,訓練算力提升,所需花費的成本也不是小數,而且還是持續性的投入。
另外,AI大模型上車還面臨着道德與法規的問題。AI系統在某些情況下有可能會做出自主決策,這就會引發道德選擇問題。其實這也是一個老生常談的問題,現在看還沒有得到解決。比如,在自動駕駛汽車中,面臨不可避免的撞擊事故時,是優先避免撞到老年人,還是年輕人,亦或是優先避免撞到女人,還是男人等,如何決策成爲一個道德困境。另外,目前國內暫時還沒有針對AI大模型的數據採集使用、數據安全以及生成內容使用權等方面的法律法規。好消息是, 國家網信辦已經於今年4月起草了《生成式人工智能服務管理辦法(徵求意見稿)》,但具體何時能夠落地目前還是個未知數。
總結:
不可否認,AI大模型的到來爲智能汽車的未來發展帶來更多可能,开啓了汽車領域的新賽道。但就現階段而言,AI大模型在汽車領域的應用還存在太多不確定性,無限的想象何時能夠落地,還有待時日。
標題:AI大模型上車 是否正當時?
地址:https://www.utechfun.com/post/236409.html