ChatGPT走紅後,大模型的熱度持續不減,並日漸形成了“千模大战”的局面。前兩個月,百度、阿裏、騰訊加入;進入5月份,先有網易有道,發布了基於“子曰”大模型开發的AI口語老師劇透視頻,介紹其基於教育場景的類ChatGPT產品;後有科大訊飛,發布認知大模型“訊飛星火”……總之,各種大大小小的發布會,都在向外界證明自己到底有多大的想象空間。
在大模型進展如火如荼之下,其產業化也被越來越多地提及,從前炒作的“AI+”也再次站上風口。在此背景下,關於AI大模型在汽車領域的應用,也开始熱度飆升。
目前來看,大模型重構各行各業雖然已經成爲業界共識,但ChatGPT“上車”遠比預想中的來得更快。作爲繼家庭和辦公場所之外的“第三空間”,汽車正在變成一個新型智能終端。ChatGPT到來了之後,車機關系也受到了更多的影響。
一是ChatGPT對汽車自動駕駛的影響。業內人士分析表示,大模型具備對海量數據的處理能力以及多維度分析能力,可以提供更精准、更全面的數據分析和預測能力,持續優化模型,提高智能駕駛的准確性和可靠性。尤其是隨着ChatGPT的出現,人們發現當模型的參數量,達到了一定程度之後,呈現出的效果不是“性能變好”,而是“出奇的好”。
具體到應用層面,大模型對自動駕駛的影響是:在雲端,車企可以發揮模型參數量的大容量優勢,通過大模型完成絕大多數的數據標注和數據挖掘工作,節省數據標注成本,還能夠借助仿真場景構建賦能。在車端,它可以將分管不同子任務的小模型合並爲一個大模型,節省車端推理計算時間,增加汽車安全性。最重要的是,被認爲是自動駕駛算法終局的端到端感知決策一體化算法瓶頸,或許在汽車接入大模型之後可以得到有效解決,自動駕駛算法升級指日可待。
二是對汽車智能座艙的影響。車載ChatGPT語音助手,可以處理完整的對話,比如追問,並能保持對前後文的理解,形成較爲良好的語音交互體驗。比如,微軟與梅賽德斯—奔馳探索ChatGPT的插件生態系統,爲第三方服務集成开闢可能性。駕駛員未來有望通過車載系統完成預訂餐廳、預訂電影票等任務,進一步提升便利性和生產力,極大地豐富智能汽車與人之間的交互體驗。
另外,在改變智能駕駛和智能座艙交互能力的情況下,其也對汽車的研發方式和商業模式產生全新的影響。研發方式方面,由於機器的高效標注能力,使得需要一年時間的數據標注任務,現在只需要短短數小時,研發周期大幅縮短,而且多模態(視覺、語音、手勢等)的豐富數據,更可以進一步提升總體的研發效能,降低研發成本。就商業模式而言,車載AI語音交互在它具備情感智能之後,它就會從“僱傭關系”演變成“陪伴關系”,對人的喜好和習慣會更加了解,這將會衍生出全新的商業價值。
或許正是意識到了這一點,現在正有越來越多的車企選擇接入AI大模型。除了國外的奔馳宣布ChatGPT之外,國內理想汽車也發布了自研大模型MindGPT,百度的文心一言也被接入到了長安、吉利、嵐圖、紅旗、零跑等衆多車企之中,就連“讓夢想窒息”的法拉利未來,也在新車中納入了大模型,不難預見未來大模型在智能汽車中普及,將會是大概率事件。從整個參與的車企來看,其發展大模型的方向和側重點並不相同。
從功能上來看其主要可以分爲以下兩類:一類是用於人工智能交流對話領域,多數應用在智能座艙上。比如,百度的文心一言,目前已經有東風日產、紅旗、長城等近十家車企宣布接入;上海車展期間,商湯科技亮相了日日新Sensenova大模型,展示了其中文語言模型“商量SenseChat”以及“如影SenseAvatar”等與座艙的結合;此前阿裏巴巴也宣布AliOS智能汽車操作系統,已接入通義千問大模型進行測試等。
另一類是聚焦智能駕駛的大模型應用。比如毫末智行發布了自動駕駛生成式大模型DriveGPT,幫助解決認知決策問題,最終實現端到端的自動駕駛。理想汽車自研大模型MindGPT,擺脫對高清地圖的依賴,讓汽車做到更接近人類司機的駕駛表現。蔚來、小鵬、長城、奇瑞四家車企,也已經注冊申請了多個與GPT相關的商標。
從參與主體來看,也主要可以分爲兩類:一是車企親自下場做的,如理想汽車、百度將自家大模型應用於自家汽車產品等;另一類是外部廠商提供大模型給車企,比如華爲盤古大模型、百度文心一言等用於給其他車企使用。
相較通用大模型來說,垂直領域的大模型訓練和使用成本更低,或許會成爲更容易實現商業化落地的領域。業內人士分析稱,汽車有着明確的交互需求,且相較於通用大模型,垂直領域的應用場景相對較小,對參數的量級要求也沒有通用型AI那么大。因此,無論是傳統車廠還是新勢力,抑或是大模型科技廠商,普遍認爲智能汽車最有可能成爲率先實現大模型落地的B端場景。
目前來看,盡管ChatGPT的首發“上車”,已經拉开了智能汽車領域大模型較量的序幕。但現階段距離大模型的真正規模上車,也還有一段距離。
首先,車企做大模型,多模態數據的收集、處理、訓練本身是一個難題。自動駕駛所需傳感器數據包括激光雷達、毫米波雷達、超聲波雷達,以及高清攝像頭、GPS等。這些數據來自不同的坐標系,帶有不同的觸發時間戳,且要考慮到硬件損壞等問題;同時,需要大量的場景數據,比如交通標志线、交通流、行爲模型等。這讓汽車大模型的研發、訓練門檻變得很高。
業內人士認爲,模型數據調動管理需要利用智能網聯汽車以及計算技術平台、雲控技術平台等諸多平台,只有做到海量數據匯聚才可以做交叉,尤其是垂直領域,這和車內的其他系統並不相同,假如基礎的平台能力不能打通,其很難向更深層次發展。另外,盡管生成式AI在信息獲取上獲得了突破,但在決策、執行控制層面,其離真正在汽車上落地還有較大的距離。
另外,端到端的AI大模型訓練,需要在智能汽車中構建全新的基於AI大模型的全新算法,這也需要一個過程,業內人士認爲至少需要3—5年甚至更長的時間,來完成這一過程。
其次,受限於車載設備的硬件條件,汽車內大模型所需要的硬件配置可能會受到限制,難以有效發揮好作用。具體來說,大模型需要高規格的硬件配置,包括高性能計算能力、大容量內存和低時延等特點,但車載設備的硬件條件相對有限,無法提供足夠的算力資源支撐大模型運行。比如,在自然語言處理領域的GPT-3模型,就需要數萬億TOPS的計算能力。這要求芯片的算力至少要在萬級TOPS以上,才能夠勝任大模型的計算任務。但是在車載部署場景下,芯片的算力往往只有數百TOPS,遠遠達不到大型模型的要求。
在此背景下,升級汽車內的算力基礎設施已成必然趨勢,目前來看智算中心或許會成爲未來智能汽車的“標配”。比如,特斯拉發布了獨立的雲端智算中心——Dojo,總計使用了1.4萬個英偉達的GPU來訓練AI模型。在國內,小鵬汽車與阿裏雲合建了智算中心“扶搖”,專門用於自動駕駛模型訓練,算力可達到600PFLOPS;毫末智行與火山引擎聯合打造了國內自動駕駛行業最大的智算中心“雪湖。綠洲”,每秒浮點運算可達到67億億次。不過,目前這些建設還處於探索應用階段,大模型應用大規模上車的時機,還沒有完全成熟。
目前來看,AI大模型對汽車最本質的改變,可能在於它將進一步驅動汽車,從制造屬性向科技+消費電子屬性轉變。在這種背景下,車廠本身的底層科技能力,將會成爲未來的決勝關鍵。
一方面,AI大模型會重新定義“人機交互”和“服務生態”,加速汽車應用服務生態消費電子化,這將改變底層的產品定義。當前車載語音系統底層是未完全成熟的任務型對話系統,尚無法真正實現個性化、情感化、自由化的交互能力,而大模型可以通過深度學習+語音生成,迎來开放場景+自然交互的全新人機交互體驗。同時,在研發設計上,隨着大模型的OS化,傳統的APP上車、點觸功能、HMI交付的必要性和重要性值得思考,這意味着汽車“產品”的重新定義。
正如前華爲自動駕駛產品部部長蘇箐所言:“傳統車廠看法首先我的基座是車,現在有些計算機的單點,那么我是把車作爲一個基礎,試圖把計算機嵌進去,這是傳統車廠的看法。我們的看法不一樣,基礎是計算機,車是計算機控制的外設,一個大計算機了事,把車掛上去。這是本質看法不一樣。”事實上,在大模型上車之後,汽車的計算中心、智能化、消費電子屬性將變得更加明顯,其產品定義將遵循消費電子的底層邏輯迭代演變(如APP化、生態服務等)。
另一方面,AI大模型將會改變汽車的現有算法,考慮到大模型應用所需要的硬件成本以及外部環境來看,未來國內企業大模型的技術實力,將更加取決於包括AI操作系統等在內的底層技術。具體來說,原來汽車的自動駕駛算法較爲依賴人工,而接入大模型之後,就需要依靠大模型驅動形成新的智能算法,而要構築這樣的算法,除了要做好產品,還要做好平台。
比如,圍繞芯片、雲端等在內的計算平台,需要做到低成本、可標配;有了好的產品,才能夠有足夠多的銷量,有足夠多的銷量,才能增加“端到端”(雲端到車端)的閉環數據;作爲基礎支撐的AI大算力芯片,也需要重新考慮車企自身的情況來做,回到底層來說就是誰的訓練成本低,誰的轉化速度快,誰就將跑到最前面。
拿英偉達的訓練芯片來說,一枚芯片被炒到了10萬塊錢,關鍵是這種高成本芯片訓練方案,對於車企並非最優解決辦法。而且受外部制裁影響,這種“外供依賴”隨時有可能被掐掉,脆弱性很大。因而從長遠來看,車企想要在這一領域走到行業前列去,要么加大對底層芯片的自研力度以減少採購成本,如百度自研AI芯片,要么在AI算法、操作系統上去尋求破局,以找到最佳的應用路徑。
標題:AI大模型,智能汽車的下一個战場?
地址:https://www.utechfun.com/post/235821.html