騰訊靠什么突圍“百模大战”?

2023-07-12 18:40:17    編輯: robot
導讀 作 者 | 張津京 了解更多金融信息 | BT財經數據通正文共計4371字,預計閱讀時長11分鐘 大模型的“百模大战”,騰訊終於下場。  從6月19日發布自己的行業大模型,到7月16日召开的世界人工...

作 者 | 張津京

了解更多金融信息 | BT財經數據通正文共計4371字,預計閱讀時長11分鐘

大模型的“百模大战”,騰訊終於下場。 

從6月19日發布自己的行業大模型,到7月16日召开的世界人工智能大會,騰訊雲行業大模型率先登場,越來越清晰的事實背後,凸顯着騰訊對於大模型領域的思考。 

尤其是跟BAT其他兩家的選擇不同,騰訊上來首先端出的是行業大模型,而不是通用大模型。這意味着騰訊其實找到了在這個領域放大自身優勢的方式。 

因爲是國內互聯網企業最早點出要推動數字融合,推進產業互聯網發展的平台,騰訊從一开始接觸到大模型,想到的就是如何與產業相結合。 

關鍵,讓人意想不到的是,秉持這個邏輯下場,騰訊其實直奔解決大模型研發方一直糾結的一個問題:那就是大模型該如何保證長期可持續發展。 

只有做到這一點,任何大模型才能談得上有未來。 

1

大模型是用來解決問題的

騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生,在世界互聯網大會產業發展論壇做主題演講時表示,通用大模型有很強的能力,但並不能解決很多企業的具體問題。“企業的大模型應用需要綜合考慮行業專業性、數據安全、持續迭代和綜合成本等因素。基於行業大模型,構建自己的專屬模型,也許是企業更優的選項”。 

這恰恰說出了當下大模型產業發展的一個現實。 

從Open AI發布ChatGPT3.5开始,浮躁成爲這個行業的外顯標籤之一。越來越多的企業开始在這個領域炫技。 

高峰時期,美國硅谷每天會產生幾十個大模型相關的論文,上百個與大模型相關的創業產品DEMO視頻。“每個視頻讓人看得血脈賁張,我們紛紛表示太酷炫了,但是靜下心來,我們對於技術該怎么用一般都沒有答案。”大模型知名研究者,計算機工程碩士李莉認爲,現在很多模型的研究者和應用的制作者,考慮的是如何讓別人記住自己,所以效果特別視覺化。“如果真正放到經濟中,你會發現根本用不上。” 

在她看來,這已成爲行業通病。 

同樣國內大模型的紛至沓來,相關的事情也沒少做。例如讓大模型直接作詩或者用方言將相關的內容讀出來,甚至做成視頻之類,頻繁出現在模型研發方發布會的現場。 

這其實是一種市場推廣行爲,但並不意味着大模型真正要在這個方面實現應用。 

最近Newsweek有一個商業調查顯示,ChatGPT的用戶數量已經比一二月份高峰時期下降了近95%。在統計原因中,“感覺ChatGPT對工作的促進能力沒有想象那么強”,是用戶選擇最多的一個結果。 

“從技術看這個是一個特別正常的結果”,李莉表示類似ChatGPT這樣的通用大模式,其訓練數據來自互聯網所有能找到的相關數據,無論對錯全部輸給模型學習,只在輸出的時候由人工來核實部分結果並標注結果輸出的邊界。“因此,通用大模型往往變成那種看起來像專家的答案,但真正被行業內人士分析就發現似是而非。” 

在她看來,未來大模型發展最快的肯定不是ChatGpt這類通用模型,“產業模型或者細分行業模型有很大機會,因爲只有在專業領域由專業的人員輔助大模型學習專業知識,才能真正爲行業提供需要的人工智能輔助”。 

對此,騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生也表示,通用大模型一般是基於廣泛的公开文獻與網絡信息來訓練的,許多專業知識與行業數據積累不足,導致回答的行業針對性與精准度不夠。“通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業某個場景的需求。”但用戶對企業提供的專業服務,要求高、容錯性低,企業一旦向公衆提供了錯誤信息,可能引起嚴重後果。 

2

TO B才是大模型未來發展核心

其實ChatGPT也不是沒想過要進入行業應用市場,但在理想與現實之間有了一個巨大的鴻溝。 

衆所周知,通用大模型是利用互聯網知識進行培訓的,即所謂通用數據。其中既要花費大量的數據和資金進行訓練,可能效果還不是很好;另一方面又要維持日常運營,相關投入也非常大,讓一般的通用大模型壓力很大。 

OpenAI的創始人在接受硅谷媒體的訪談時,也曾就ChatGPT3.5的邏輯和思維展現能力進行過闡述,然而他並不清楚ChatGPT3.5是如何實現這一功能的。事實上,他們在訓練ChatGPT的過程中,一直在不斷地將微軟必應搜索中的結果和用戶的對話數據輸入其中。 

在訪談的最後,他也承認ChatGPT的出現只是一個美麗的誤會,但他們所能做的就是不斷爲這樣的大模型提供資源,無論是軟件還是硬件都在此列。據觀看了這場訪談的李莉了解,OpenAI在短短三年內就已經燒掉了180億美元,現在又緊急融資了100億美元。這一事實恰恰印證了這一點。

但由於他們在行業上數據搜集能力不強,造成通用模型對於行業應用適用程度較低,沒有想象的好用。 

另一方面,自2018年騰訊啓動930變革以來,中美互聯網技術的發展出現了明顯的路线差異。 

各家互聯網企業以數實融合爲开發產品和技術的基本思路,這體現了中國互聯網企業在滿足制造業和實際生產需求方面更爲緊密的聯系。 

從這一角度來看,中國互聯網企業將在推動社會經濟發展方面具有更清晰明確的角色。 

有趣的是,大模型的成長和訓練需要大量數據的支持。ChatGPT和谷歌Bard等領先的模型都是在通用大模型領域進行訓練的,它們的背後都有搜索引擎帶來的龐大數據支持。然而,盡管這些數據量龐大,但在特定行業的數據量和數據活躍度上,尚未完全滿足用戶的需求。 

這實際上爲中國企業提供了彎道超車的機會。中國龐大的人口基數使其在各個行業擁有比美國甚至世界其他國家更豐富的數據積累。無論是醫療、法律、物流還是細分行業的生產。在國家數據安全法的指導下,這些數據天然地與海外大模型隔離,保證了數據安全。 

因此,這些B端數據被認爲是中國大模型企業的巨大優勢。 

比如,中國已榮升爲全球最大的工業機器人生產國和消費國,全球機器人市場中的75%是由中國的企業所購买。這些購买機器人的企業,通常都將其機器人應用於核心工藝和核心流程中。 

這一現象意味着,如果這些企業希望通過引入人工智能模型以提高管理效率,它們就必須部署自己的私有人工智能模型。他們需要通過訓練自己生產中的數據,以滿足企業的發展需求。 

如果能從中國一线企業採集到絕大多數機器人使用的參數和對應的數據,就能以最快的速度幫助這些企業建立和訓練屬於自己的人工智能模型。 

在這一點上,中國企業具有天然的優勢。 

3

爲什么是騰訊先落子

專屬行業大模型,目前國內騰訊是首先落子的領軍者之一。

在所有人都开始關注行業大模型的時候,在百度、阿裏、科大訊飛等國內大模型开發方都开始轉型行業大模型的時候,爲什么騰訊能最先發布自己的行業大模型呢? 

這可能跟騰訊在國內率先提出互聯網平台要跟產業相結合有關。 

一方面,這幾年騰訊利用互聯網技術和AI技術,在實體經濟和生產一线做了很多嘗試,推動了很多新模式的落地,這已經成爲中國數實融合的樣板。騰訊在其中積累了很多面對行業企業的服務經驗和數據,同時也對行業企業的需求非常清楚,這爲其建立行業大模型提供了良好的基礎。 

另一方面,騰訊專門爲行業大模型打造了自己的技術平台。 

這裏面首先是星脈網絡,這是騰訊雲正式發布新一代HCC高性能計算集群。該集群採用騰訊雲星星海自研服務器,服務器之間採用業界最高的3.2T超高互聯帶寬,爲大模型訓練、自動駕駛、科學計算等提供高性能、高帶寬和低延遲的集群算力。實測顯示,騰訊雲新一代集群的算力性能較前代提升高達3倍,是國內性能最強的大模型計算集群。 

其次是騰訊雲專門爲行業大模型打造的AI 原生(AI Native)向量數據庫。該數據庫能夠被廣泛應用於大模型的訓練、推理和知識庫補充等場景,是國內首個從接入層、計算層、到存儲層提供全生命周期AI化的向量數據庫。 

正是有了這樣的技術基礎,加上騰訊這些年服務行業客戶的經驗和獲得的數據,讓騰訊有了率先推出行業大模型的底氣。 

騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲在人工智能大會期間接受媒體專訪時表示,騰訊希望在每個特定場景裏面100%解決客戶的問題,“而不是找100個產品解決70%到80%的問題”。 

在他看來,騰訊會聚焦找一些特定的行業跟客戶深入打磨解決行業的問題,“比如說文旅行業跟客戶做一些深入探討,比如說OTA領域的客戶在業務流程裏面用大模型的技術,結合自身的業務場景,還有數據相關的東西對大模型進行精調,解決他的問題”。 

關鍵,騰訊雲從產業客戶需求場景出發,基於大模型高性能計算集群,依托騰訊雲TI平台打造模型精選商店,爲客戶提供MaaS一站式服務和“量體裁衣、普惠適用”的行業模型解決方案,全面降低落地門檻,助力客戶構建專屬大模型及智能應用。 

騰訊雲TI平台行業精調解決方案,支持客戶用自己的數據一站式訓練精調,構建自己的專屬大模型。具備五大優勢:提供高質量的行業大模型、完善的平台工具、成熟的流程服務、全面的配套服務、領先的安全能力保障。 

比如騰訊雲升級行業大模型應用場景,行業大模型加持的金融風控解決方案,相比之前有了10倍效率提升。騰訊雲風控大模型融合了騰訊過去20多年黑灰產對抗經驗,和上千個真實業務場景,整體反欺詐效果比傳統模式有20%左右的提升。企業可以基於prompt模式,迭代風控能力,從樣本收集、模型訓練到部署上线,實現全流程零人工參與,建模時間也從2周減少到僅需2天。 

再比如過去的同傳技術,往往需要大量樣本數據進行訓練,尤其涉及一些特別專業領域的翻譯,也需要人工加持進行調優,才能保障翻譯效果。基於行業大模型技術,不再需要百萬級的訓練數據,使用小樣本訓練便也可以獲得不錯的翻譯結果,讓每一次交互翻譯,都對下句的翻譯提升發揮實時作用…… 

換句話說,騰訊既准備好自己的技術基礎,又有行業數據知道行業想要什么,還做了一整套幫助企業落地大模型在自身業務應用的產品,形成了一整套推動大模型行業化的能力。 

當然,騰訊對行業大模型是持开放態度的,他們覺得大模型是需要多分共同努力的結果。吳運聲就表示,大模型時代开放是非常重要的一個特點,“底層的技術變化太快,技術的這些外延的能力會非常廣,這種情況下發揮最大的價值只有开放,通過开放提升讓更多人加入進來,更多行業的專家,各類的角色人員加入進來,我們才能讓這個生態,整個體系更加的健康,產生更多的可能性”。 

對此,騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生也認爲,伴隨着大語言模型的發展,產業和社會也將從數字化、網絡化,走向智能化。“在這個過程中,騰訊始終認爲,人工智能發展的根本目標是落地於產業,服務於人”。 

因爲,只有能真正解決用戶需求、距離場景和數據更近的企業,才能擁有大模型的未來。

文章系作者個人觀點如有疑問及任何意見反饋可直接在評論區留言或發送郵件

       原文標題 : 騰訊靠什么突圍“百模大战”?



標題:騰訊靠什么突圍“百模大战”?

地址:https://www.utechfun.com/post/237095.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡