隨着ChatGPT在全球範圍內迅速爆紅,AI大模型賽道的熱潮也开始從國外湧向國內,並隨之急速升溫。而作爲新一代的顛覆性技術,AI大模型一度被視爲一次全新的生產力革命。因此,各路玩家都圍繞“AI大模型”發布了一系列產品,國內AI界也开始上演一場關於“大模型”的战爭。
縱觀國內當下涉足AI大模型賽道的玩家,主要可分爲以阿裏、騰訊、百度等爲代表的互聯網廠商和以商湯科技、昆侖萬維、科大訊飛等爲代表的科技公司,以及以王小川、王慧文等爲代表的初創企業。而正所謂,八仙過海各顯神通,這三類不同屬性的參與者在這場“千模大战”中也展現出了其獨特的優勢。
(配圖來自Canva可畫)
互聯網大廠資源傍身
國產AI大模型賽道熱鬧非凡,互聯網廠商們紛紛摩拳擦掌。百度和阿裏先後上线了各自的大規模語言模型“文心一言”和“通義千問”;騰訊、網易、京東也相繼公开了自家的大模型產品“混元”、“玉言”和“ChatJD”。而一衆互聯網大廠之所以能夠競相推出自己的AI大模型新品或研發計劃,其背後的實力不容小覷。
首先,互聯網大廠擁有雄厚的資金儲備,能夠長期有效地支持其AI大模型的創新和研發。高算力代表着高成本,這就意味着AI大模型需要高昂的訓練費用和研發投入,而沒有雄厚的資金支撐,幾乎沒有跑完全程的希望。相比較而言,互聯網大廠資金儲備充足,能保證大模型的正常運行。據公开資料顯示,無論是百度、阿裏還是騰訊,每年研發投入資金就高達百億元,研發團隊人數破萬,在技術研發上實力雄厚,是目前當之無愧的“第一梯隊”玩家。
其次,互聯網大廠積累了海量數據參數,可以在一定程度上提升AI大模型的能力和效用。數據是大模型的基礎,目前來看,通過大規模數據訓練超大參數量的巨量模型,被認爲是非常有希望實現通用人工智能的一個重要方向。而“BAT”等互聯網大廠流量大、用戶覆蓋面廣,能夠爲大模型的生成提供足夠的數據參數。比如,“文心一言”背後有百度的海量搜索數據和語料庫;阿裏的“通義千問”則有來自電商、雲計算等領域的語料庫。
最後,互聯網大廠豐富的應用場景和大模型十分貼近,可以讓AI大模型的落地變得更容易。互聯網大廠分別來自電商、社交、遊戲、教育等諸多行業,並且擁有面向用戶的多個產品和服務,如百度和360的搜索、騰訊的社交媒體、阿裏的雲計算和電商等,其主營業務十分貼近大模型應用場景,而基於其原有業務在資源和技術上的積累,這些互聯網大廠則是最有機會推動模型技術向C端用戶普及的玩家。
科技公司技術作保
在互聯網大廠積極布局AI大模型之時,科技公司的身影也異常活躍。商湯科技宣布推出了“日日新”大模型體系;昆侖萬維和奇點智源合作自研了大語言模型“天工”;科大訊飛也發布了“星火”大模型。而科技公司之所以能夠爭先恐後地推出自己的AI大模型方案和發展計劃,則與其自身強大的底氣不無關系。
一方面,科技公司在AI大模型的應用探索上已取得了一定的先發優勢,這有助其率先搶佔用戶心智。憑借超前的战略眼光,大多數科技公司多年前便已展开了人工智能技術在各業務領域的應用探索,並將相關技術全面應用到旗下社交娛樂、信息分發等業務板塊,且現已取得一定的先發優勢。比如,昆侖萬維在2020年就已經开始領先布局AIGC,耕耘三年,如今發布的“天工”3.5也被其自稱爲將是“中國第一個真正實現智能湧現的國產大語言模型”。
另一方面,科技公司在人工智能等技術上有着深厚積累,可以爲AI大模型的落地提供強有力的技術支撐。包括商湯科技、科大訊飛等在內的科技公司早在ChatGPT火爆之前,就有了大量關於人工智能的積累。比如,作爲國內領先的人工智能企業,科大訊飛不但擁有豐富的AI技術積累和經驗,目前還建有業界一流的AI數據中心。而憑借在AI技術領域的巨大優勢,這些科技公司更有可能做出真正意義上的類ChatGPT的自然語言生成的大模型。
另外,科技公司在AI技術應用上的商業化落地經驗,能爲其AI大模型商業化落地提供借鑑。由於在AI領域的長期積累,大多數科技公司已經通過建立技術優勢,以及AI產業化實現了盈利反哺技術研發,形成了可持續發展的商業模式。比如“AI四小龍”之一的商湯科技,就有着超過20年的AI原創技術,並且其領先的AI技術正不斷落地在生活場景中。而隨着其AI技術應用逐漸規模化落地,其商業化也在隨之加速。
創業企業洞察力爲憑
在互聯網大廠和科技公司开卷之際,創業公司也在AI大模型的風口中找到了機會,又爲這一領域添了一把火。原美團聯合創始人王慧文的一則“AI英雄榜”,宣布高調入局“劍指”大模型;隨後,前搜狗CEO王小川、前京東AI掌門人周伯文、被譽爲“AI框架領域第一華人”的阿裏技術副總裁賈揚清等一衆大佬也爭先加入了AI大模型的創業隊伍。而這些創業企業之所以能夠成爲殺向大模型賽道的一匹黑馬,當然還是得益於其得天獨厚的優勢。
一是,初創企業更敏銳,能夠快速洞悉AI大模型的市場需求並展开相應業務。互聯網時代競爭激烈,各企業都在搶佔市場盲點,想要憑借先發優勢佔得市場份額的高點。相比較而言,初創企業往往具有更敏銳的市場洞察力,能夠迅速發現市場中未被充分滿足的需求,也更容易適應市場需求並做出战略調整,從而推出具有獨特性和優勢的產品和服務。
二是,初創企業更靈活,可以基於大模型進行“再开發”,以挖掘新的交易機會。由於初創企業往往充滿探索精神,因此其可以選擇的商業模式也更爲多樣化,除了利用AI大模型爲自己打工,AI創業者們還能基於大模型進行“再开發”,尤其是一些基於AI大模型發展的垂直應用場景,也有可能成爲企業新的增長機會。比如,使用文心一言大模型,基於其語音和文本處理功能,开發者可以再增加线上記账小模型,用語音輸入實現實時記账。
三是,初創企業更專注,有足夠的時間和精力去研究和开發出AI大模型更多的場景和功能。衆所周知,無論是互聯網大廠還是科技巨頭,往往都有着多條業務线,因此,各項資源就會比較分散,而作爲其若幹個業務中的一個,大模型領域能被分到的資源就十分有限。相比較而言,初創企業更專注於一項業務,會通過聚焦產品本身進行深度思考,從而精准挖掘用戶需求,設計出讓用戶滿意的產品,讓用戶更愿意爲之买單。
有門道,更有門檻
爲了追逐AI大模型的浪潮,無論是互聯網大廠,還是科技公司,亦或是初創企業,無一不都亮出了絕招。國內的AI大模型已然遍地开花了,至於誰會成爲最後的贏家,目前雖尚無定論,但值得注意的是,每一個狂熱賽道的背後往往不乏擔憂,而追逐大模型的玩家自然也都面臨着共同的難題。
一來,AI大模型在算力、算法等核心技術方面都還不太完善,還有很大的進步空間。在AI時代,生產力的三要素分別是應用場景、專有數據和基礎模型。然而,大模型技術應用範圍雖然廣泛,但目前落地的場景卻比較有限。而且當前國內算力稀缺、數據模型訓練不足,甚至版權糾紛等問題依舊難以忽視。更何況,本身缺乏核心技術、套用別家公司硬件或數據庫來預訓練參數的也不在少數,可見,國產大模型還有很長的一段路要走。
二來,AI大模型頂級的技術人才是稀缺資源,各玩家之間的搶人大战將難以避免。隨着大模型越來越火熱,高精尖的技術人才就成了兵家必爭之地,大廠們更是毫不吝嗇地开出百萬年薪來爭奪。根據脈脈發布的《AIGC?才趨勢報告》顯示,自OpenAI推出的2021年以來,對於AIGC相關人才的爭奪就已經开始了。2021年1-2月,AIGC相關崗位招聘同比上升281.88%;2022年和今年的1-2月,招聘數量分別保持了76.74%和31.3%的同比增幅。
三來,AI大模型目前的落地場景還較爲有限,商業化想要徹底跑通恐怕還需要時間。無論是對哪個行業而言,商業化都是極爲難過的一關。即便是技術領跑全行業的openAI,在商業化方面也有着不小的煩惱,比如,openAI的估值雖然隨着ChatGPT的走紅而一路高升,但每一次預訓練參數都要耗費巨資,因此其虧損也在持續擴大。其他玩家的商業化嘗試恐怕也是收效甚微,短時間內幾乎不可能覆蓋預訓練所需成本。
總而言之,對所有參與的玩家來說,大模型無疑是一場艱苦的馬拉松競賽。而且,隨着國內各種大模型接踵而至,“百模大战”也已經正式打響,留給參與者們的時間似乎並不算多了。而待到潮水消退,國內的AI大模型玩家們恐怕只有堅持做自己,才能夠在這場競賽中走得更長遠些。
原文標題 : AI大模型:玩家們的新擂台
標題:AI大模型:玩家們的新擂台
地址:https://www.utechfun.com/post/217732.html