騰訊“散裝”大模型

2023-06-02 18:40:16    編輯: robot
導讀 撰文 | 吳坤諺   編輯 | 吳先之 大模型浪潮下的互聯網行業暗流湧動,大家都在翹首以盼誰能率先跑出中國GPT。 百度、360、阿裏、昆侖萬維、商湯、金山、科大訊飛......即使拋去高校國家隊和...

撰文 | 吳坤諺  

編輯 | 吳先之

大模型浪潮下的互聯網行業暗流湧動,大家都在翹首以盼誰能率先跑出中國GPT。

百度、360、阿裏、昆侖萬維、商湯、金山、科大訊飛......即使拋去高校國家隊和創業公司,已經在大模型領域秀過肌肉的大廠也能拉出一張清單來。中國科技巨頭歷來喜歡追逐風口,大模型的航海時代自然也不會免俗,但有那么一家巨頭卻很沉得住氣,至今未曾露出什么大動作。

作爲早在2022年4月便正式亮出旗下混元大模型的騰訊,在計算機視覺自然語言處理、多模態內容理解、文案生成、文生視頻等多個方向均有所建樹,如今卻給外界一種“失聲”的感覺。

自今年2月起,騰訊在大模型領域爲外界所感知的大動作僅有兩次,一是2月27日針對類 ChatGPT 對話式產品已成立「混元助手(HunyuanAide)」項目組,騰訊史上最高專業職級擁有者張正友爲項目Owner;二是4月14日發布新一代HCC(High-Performance Computing Cluster)高性能計算集群。

在友商紛紛下場展示實力與聲量,爭取在大模型時代獲取更多認知,騰訊的失聲很可能是一部慢,步步慢。更有意思的是,騰訊控股自3月29日起便跌跌不休,以Naspers爲首的大股東更是在持續減持套現,這興許也是資本市場對騰訊在大模型賽道失聲現狀的不滿情緒體現。

難道,騰訊還在“等風來”?

“失聲”是表象

北上廣不相信眼淚,互聯網大廠只相信效率。即使是OpenAI這個不停燒錢的公司也會不時對外放出一些意見以及信息,在信息爆炸的現代社會中試圖短暫地獲取關注力,而騰訊也是如此。

我們不妨以2月27日爲節點,從騰訊對外宣布的動作中尋找其大模型訓練進度的蛛絲馬跡。據光子星球不完全統計,騰訊自2月27日起至今的動作集中在三方面,一個是AI商業化應用,另一個是視頻號,最後是政企合作。

細數下來,其實騰訊在各方面的動作並不小。除了分別於移動、聯通兩大運營商達成雲計算方面的合作外,3月30日,騰訊發布AI智能創作助手“騰訊智影”。4月,騰訊在上海智慧車站前夕發布智慧出行汽車雲,發布了據稱是國內性能最強的大模型計算集群,還與字節跳動破冰,探索視頻合作。當時間到了5月,騰訊微視面向頭部的抖音、小紅書與快手招募創作者,於5月9日發布了“开悟”AI开放研究平台,更是开放QQ渠道爲載體,讓AI繪圖工具Midjourney开啓官方中文版內測。

與率先發布通用大模型並展开應用探索的諸位友商相比,騰訊的聲量雖小卻也談不上“安靜”。而且其中無論是“开悟”AI开放研究平台、“騰訊智影”AI智能創作助、計算集群的發布還是Midjourney相關動作,其實都與大模型訓練有不小的關系。

智慧出行汽車雲是基於雲服務以及AI訓練的“車雲一體”服務,“开悟”本身是由AI Labs聯合王者榮耀項目組推出的,本身是借用遊戲場景進行AI訓練的平台;“騰訊智影”這款支持虛擬數字人、文本配音、智能 AI 繪畫、文章轉視頻的應用本身也屬於大語言模型的功能範疇;Midjourney开放內測是對AI原生應用於C端落地的探索;高效的計算集群更是在大模型訓練中不可或缺的基礎設施。

再往下深挖,這三個項目其實也分屬騰訊內部不同事業群。“車雲一體”屬於CSIG(雲與智慧產業事業群),“开悟”屬於IEG(互動娛樂事業群),“騰訊智影”應屬於WXG(微信事業群),大模型計算集群分屬TEG(技術工程事業群),QQ的應用探索屬於SNG(社交網絡事業群)。

這不免讓我們聯想到騰訊特色的“內部賽馬”機制,這是在過去的騰訊業務线中,不同競品之間養蠱最後確認勝者的流程。而光子星球自某位接近騰訊人士處獲悉,CSIG、TEG與PGC均在訓練業務範圍內的大模型。

但考慮到大模型訓練極高的投入,內部賽馬將造成更大的沉沒成本。因此,目前的“賽馬”現象更大可能是TEG統領全局,由各個BG提供語料以及數據集標注,爲各BG的業務线打造專屬模型,最後再通過知識蒸餾匯總到混元AI之中。

這樣的战略布局好處很明顯,既可以最大限度調動全局並提供高質量數據集,也能在長時間的模型訓練中探索商業場景落地的可行路徑。但弊端也同樣顯著,大型組織架構中各個BG難以相互配合,龐雜組織架構難免的山頭林立也讓成果互通變得困難。

“我們最开始以爲這是互聯網十年不遇的機會,但是越想越覺得這是幾百年不遇的、類似發明電的工業革命一樣的機遇。所以我們覺得(AI)非常重要,但這的確需要有很多的積累”,結合Tony在騰訊一季度財報會議上的講話,騰訊在試圖對外解釋自己的“不緊不慢”,但在各家發力开卷的當下,未曾透露具體進度的回應總歸顯得有些蒼白。

不受待見的AI Labs走上風口浪尖

無論最終騰訊通過田忌賽馬落地了多少個BG的大模型應用,最終的目的一定是保證最頂端的“混元”能夠幫助騰訊在AI時代站穩腳跟,甚至再現移動互聯網時代的社交輝煌。

於是,一直以來在組織架構中顯得有些邊緣的AI Labs踏上舞台中央,享受着最集中的資源同時也承受着前所未有的壓力。

這是因爲,以騰訊AI Labs以及阿裏達摩院爲代表的大廠AI研究實驗室通常進行的是較爲前沿且高通用的算法研究,研究成果通常會通過API接口或SDK形式對其他BG輸出,而業務性強的具體場景一般都需要算法的定制化,按需制作。相比以主導者的身份統籌業務BG,更多的可能是以中台的定位幫助業務BG打造搭載前沿技術的產品。

光子星球自一位接近騰訊人士處了解到,AI Labs一貫給其他BG的印象便是“不幹實事、論文灌水”,之所以會讓同僚們產生如此刻板印象, 是因爲許多前沿研究僅有成果而未能投產,“並非研究人員劃水”。其中比較典型的是經過AI Labs多次優化後的智能音箱,作爲騰訊20周年慶的員工禮物於內部送出的同時項目也面臨叫停的風險。

據了解,智能音箱項目於2018年4月上馬,隸屬於當時騰訊移動互聯網事業群(MIG)旗下的智能創新業務事業部,其發布首日便在京東商城取得了兩萬台的首日銷量。只是在智能音箱項目上线後8個月,CSIG作爲當時騰訊的業務重心也推出了自己的智能音箱項目叮當帶屏音箱,項目劃分問題與不同BG間微妙的“市場競爭”關系耐人尋味,這或許也是智能音箱項目被叫停的原因。

“當一群本應專研算法,頭腦風暴公司下一階段核心競爭力的組織疲於應付各個業務BG的產品,甚至下場田忌賽馬,即使如此還是不能落下學術產出,(公司)還能指望它做得多好?”一位接近騰訊人士說。

技術變現是大廠技術部門的永恆命題,關鍵在於着急與否。一位咨詢顧問告訴光子星球,相比於進入大廠的中台,淪爲“算法外包工”,無論是進入工業界的業務部門還是轉身高校專研學術,都是性價比更高的選擇。這或許也解釋了曾經騰訊AI Labs主任、斯坦福博士張潼於2018年12月離職並重返學術界的原因。

如果未曾出現大模型這樣目前公認的通往AGI的切實路徑,AI Labs可能也不會走上風口浪尖。只是中台的角色定位不變的話,沒有強有力的話語權支撐,AI Labs能否完成組織交付的任務還是要打一個問號。

畢竟曾經展开中台這個故事的阿裏已經通過分拆上市解構了中台神話,就像亟需數字化的中小企業中業務部門與IT部門相互不對付,中台與各事業群之間的微妙關系已然讓互聯網企業組織架構走進了一個死胡同。

成也賽馬,敗也賽馬?

人都是經驗的奴隸,如果說AI Labs爲中台乃是騰訊發展至今的慣性使然,顯然這樣的慣性並不止一種。其中比較典型的是騰訊長期坐鎮南山巍然不動,“把半條命交給合作夥伴”的投資擴張邏輯,以及衆所周知的內部賽馬。

在MaaS(model as a service)愈發爲人所重視的當下,大模型如果可以被視作一個產品的話,極大可能是通往新世界的船票。因此在大模型賽道,騰訊想必不會將哥倫布的角色拱手讓人,尤其是模型層,只是在應用層可能會依靠合作夥伴建立生態圈,遠有微信上的豐富應用,近也有QQ上开始內測的midjourney。

至於騰訊爲何選擇QQ生態而非微信生態,可想而知的原因可能是QQ用戶群體相對年輕化,而且在PC端的產品呈現上顯然是QQ更勝一籌。此外,這一選擇也存在強烈的“試水”性質,畢竟midjourney本身還未曾以成熟的產品形式呈現,在QQ之前,僅以API形式接入了discord。

更值得一提的是大模型賽道的賽馬,曾經賽馬跑出的神話實際上早已在算法時代爲頭條系的崛起而破滅,因爲賽馬機制本質上是建立在冗余前提下,通過資源優勢以面找點,重復造輪子,有點類似於數學中的窮舉法。之所以神話破滅,是在於賽馬在保險的同時也讓騰訊喪失了曾經的敏捷,最典型的便是短視頻應用至今只跑出來了視頻號這個全村的希望。

不過,大模型賽道的賽馬說不定還真能行。

因爲大模型訓練非一夕之功,更不是某個強烈需求敏捷能力的垂類。重資產投入、試錯成本高昂的預期以及應用層呈現的千奇百怪很大程度上彌平了賽馬機制的缺陷,一方面是應用多樣化避免了重復造輪子造成的資源浪費,另一方面是大模型特有的知識蒸餾讓試錯不再可怕,即使OpenAI珠玉在前,大家對國內的各家大模型仍抱有寬容的態度,無論是公衆層面還是公司內部。

所幸新一輪的賽馬或許不需要決出個勝負,更重要的是勝負之外的結果。騰訊也應該感謝OpenAI开啓的新時代,一個不再追求短平快,連方向路徑都已昭然若揭的時代,讓缺乏敏捷、缺乏對核心抓手的嗅覺的騰訊重回棋盤之上,與競對一起自天元落子。

只是大模型也並非萬能,最起碼,騰訊組織架構的頑疾以及整體战略上的模糊尚待調整。

如果希望AI Labs是騰訊這艘船的哥倫布,那么拆除組織架構內的部門牆以及重塑對創新的態度將是重中之重。例如光子星球自一位接近騰訊人士處了解到,AI Labs曾出走多位頂尖人才,他們曾經在騰訊內部的創新成果也在出走後落地多個垂直領域,甚至其中不乏龍頭的存在。

如果希望AI Labs這位哥倫布能真的發現新大陸,起碼需要堅定地朝着正確方向前進。這一點恰是騰訊在开啓賽馬之路後丟失的能力,因爲賽馬的本質在於有力卻不知何處使。現在的騰訊能否在賽馬機制的路徑依賴下突破以面找點,以各個BG在應用層積累的數據庫爲基礎,在高效協同之下跑出一個大模型來,我們還在等待這份答卷。

只是留給騰訊的時間可能不多了,隨着夏季到來,今年又恰是厄爾尼諾之年,用電問題將愈發嚴峻,屆時大模型訓練想必會受到不小的影響。

一步慢可能步步慢,賽馬機制在短視頻上的失敗讓曾經的“後發先至”從神話變成遮羞布,大模型將是騰訊能否正視自身問題,向世界證明自己仍具備打硬仗能力的最好機會。畢竟,就算是在騰訊如今最重視的市值管理上,大股東們還在減持套現。

       原文標題 : 騰訊“散裝”大模型



標題:騰訊“散裝”大模型

地址:https://www.utechfun.com/post/221008.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡