騰訊的大模型價值觀:實用主義|甲子光年

2023-09-11 19:03:46    編輯: 甲子光年
導讀 落地方能檢驗技術真章。 作者|武靜靜 編輯|慄子 9月7日,在一年一度的騰訊全球數字生態大會上,騰訊自研的通用大語言模型混元大模型正式亮相,並宣布正式通過騰訊雲對外开放。企業用戶可以直接在騰訊雲上調...

落地方能檢驗技術真章。

作者|武靜靜

編輯|慄子

9月7日,在一年一度的騰訊全球數字生態大會上,騰訊自研的通用大語言模型混元大模型正式亮相,並宣布正式通過騰訊雲對外开放。企業用戶可以直接在騰訊雲上調用混元API,或者將混元作爲基底模型構建上層應用。

與市場上很多廠商都在爭先恐後的優先推進對話式大語言模型不同,騰訊在大模型落地探索上有着明顯不一樣的節奏和堅持。

最直接的節奏體感是騰訊的“不着急”——在廠商紛紛搶佔今年三、四月份的第一波大模型時間卡位時,馬化騰直言“騰訊不急於做半成品”。所以直到6月,大衆才第一次正式看到騰訊的行業大模型,彼時,市場上已經在風風火火的上演着“百模大战”。

細究這種“不着急”背後,也許並非是因爲騰訊在战略上“輕視”大模型的機會,而是他們認爲大模型的價值核心不在時間窗口上,而在落地實踐中。畢竟,在馬化騰看來“大模型是互聯網百年不遇的機會,是類似發明電的工業革命一樣的機遇。”

這種更倡導落地的價值觀在當下正逐步成爲行業共識——隨着更多大語言模型對外开放,科技公司除了在不斷打磨模型能力之外,也相繼走進了各行各業,踏上了場景落地探索的新徵程。目前,雲廠商在大模型的產業落地思路上基本已達成共識:MaaS(Model-as-a-Service)模式,落地行業,走在場景中,和客戶一起合作做垂類大模型。

如果大模型的價值核心在場景落地上,騰訊的解題思路是什么?

1.騰訊的選擇:實用主義

不同公司在發展大模型技術上思路不同,選擇的優先級也不同。有的公司更關心技術、參數,把追趕ChatGPT定爲首要目標。有的公司更關心場景閉環,在早期階段就選擇把場景驗證納入技術探索的必經之路上。

騰訊的答案明顯是後者。從6月19日發布行業大模型之初,騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生就強調了騰訊的大模型價值觀:“通用大模型不一定是滿足行業場景需求的最優解。企業需要有針對性的行業大模型,結合自己的數據做訓練或精調,在合理的成本下,打造實用性更高的智能服務。”

騰訊的這種價值可以用四個字來概括——實用主義。這也是騰訊做大模型貫穿始終的一條暗藏的主线。

一方面,實用主義意味着,騰訊雲更關注大模型如何解決場景問題而不僅僅是參數大小。騰訊雲副總裁、騰訊雲智能負責人吳運聲曾直言:“幾億、幾十億、幾百億還是一千多億,我們並不關心模型參數的那個數字,我們更關注的怎么解決客戶的問題,希望用最有效,最低成本的手段去解決客戶的問題。”

另一方面,實用主義意味着,要更關心應該用什么技術組合?如何更有效率的解決問題?吳運聲提到:“就像舉重運動員要舉200斤的槓鈴,但作爲遊泳運動員舉100斤就夠了,作爲體育室,我們提供200斤的槓鈴,但對於不同類型的運動員或者更多普通人,他們沒有必要都要用200斤的槓鈴練習。”

在他看來,在一些行業和具體的領域,數據量本身就沒那么大,用小參數成本低,效果也會更好。“我們希望以最低的成本,最合適的模型,最好的服務去讓客戶真正把技術用起來,解決它在場景中的問題。”吳運聲說。

他認爲這是騰訊雲一直在貫徹的技術實用主義:“從大模型整體思路來看,我們並不特別關注形式,而是注重技術產生的實際價值,以及在客戶業務中的價值體現。我們的核心出發點都是基於此。”

這種經驗和判斷來源於騰訊雲在to B領域的多年深耕——大模型技術需要基於產業場景,與企業數據融合,才能釋放出最大的價值,“智能化的後半場,騰訊雲智能在堅持投入AI技術研發的同時,一直專注於產業實踐,強調技術的務實可行和產品的安全可靠。”吳運聲提到。

對外,所有的技術最終都要面對場景的發問。深度學習之後,上一波AI熱潮的歸向也是如此。過去幾年中,更多AI公司在已經放下“標榜自身有多牛”的身段,轉而走向更落地的方向,尋找真正可規模化的場景。

對內,騰訊雲也一直在踐行落實這種技術實用主義。作爲騰訊雲承擔大量前沿探索工作的關鍵部門,騰訊優圖實驗室也一直在堅持“研究和落地並重”的方針:一方面需要站在科技前沿探索更多的可能性,另一方面需要考慮技術能解決的實際問題,而非純粹的技術至上和論文至上。“研究、落地兩條腿走路,這是優圖從成立的第一天开始就在強調的重點方向。”吳運聲說道。

他認爲,關心落地並不意味着不關注前沿研究。“我們的研究恰恰是以解決在落地中遇到的實際問題爲前提,每年我們也會發布很多論文,但和其他家不同的地方在於,優圖幾乎70%、80%論文原點都是我們在實際場景中遇到的問題。基於問題,我們進行探索研究,最終抽象成學術層面的東西。”

技術要更實用也能顯現出價值,並不是一句空話。

2.實用主義的源頭:一线用戶的需求

實用主義並非是騰訊雲的一家之言,騰訊依靠的是來自一线企業需求的真實反饋。正如湯道生所言:“企業需要的是在實際場景中真正解決了某個問題,而不是在100個場景中解決了70%-80%的問題。”

今年以來,騰訊雲一直泡在一线和用戶溝通具體的需求。騰訊雲副總裁、騰訊雲智能研發負責人吳永堅告訴「甲子光年」,當前,企業客戶對於大模型的技術需求正在逐步變得更理性。“客戶在張开懷抱擁抱技術的同時提出了更多實用性的需求:有人關心大模型技術能夠結合產品上做更定制化;有人希望拓寬大模型更多元的知識來源,也有人希望生成精准的行業知識,准確率要有保障。”他認爲,技術需要結合多種因素組合考量:“安全性、部署、成本等多重因素交織下,再去考慮技術的可達性。”

這些多樣化的需求意味着,單一模型很難滿足所有需求。“我們不會去強調技術有多強,而更側重於產品如何去解決客戶的實際問題。”

基於此,騰訊雲打造了支撐實用主義落地的全套MaaS服務體系,並持續根據用戶需求進行迭代:基於自研的騰訊混元大模型,同時支持業內主流的开源模型應用,從技術底座、平台能力和智能應用三個維度,助力客戶構建專屬大模型和智能應用,推動大模型在產業中的落地應用。

騰訊雲MaaS解決方案,圖片來自騰訊

技術底座層包含算力工具和行業模型。算力方面,包含騰訊雲今年4月發布的專爲大模型訓練設計的新一代HCC高性能計算集群;依托自用的向量引擎(OLAMA)騰訊雲也已經推出向量數據庫(Tencent Cloud VectorDB);以及自研的星脈計算網絡架構。“通過存儲、計算、網絡整體的升級,我們今天實現了訓練一輪萬億參數的模型在4天之內就可以完成,並讓訓練效率得到大幅提升,訓練時間得到保障,訓練成本下降很多。”騰訊雲副總裁、騰訊雲智能負責人、優圖實驗室負責人吳運聲提到。

平台方面,騰訊雲TI平台是騰訊雲大模型能力在行業落地的技術“殺手鐗”:不僅包含此前就有的數據標注、訓練、評估、測試和部署等工具,還有可以進行更優訓練和推理加速“太極Angel”,以及從“業務分析、數據處理、大模型選擇”到“模型評測”的一體化完整方法論。吳運聲稱:“我們對企業在做模型精調過程中的精調、部署等方面的工具做了全棧式打造,可以讓每個想做自己模型的企業,基於TI平台,用騰訊雲的加速框架、基礎算力、开源工具,讓構築行業模型變得更簡單。”

在2023年騰訊全球數字生態大會上,騰訊雲對這套技術底座進行了新的升級:

平台層,一方面,TI平台也全面接入了Llama 2、Falcon、Dolly等主流开源模型,支持系列模型的直接部署調用、應用流程簡單。

工具鏈層,騰訊雲爲客戶提供了多款即插即用的產品,客戶只需加入自己獨有的場景數據進行精調訓練,就可快速嘗試多種大模型,並根據自身業務場景需求,就可以在短時間內精調出專屬的模型方案。

加速方面,升級後太極Angel大模型加速框架,通過異步調度優化、顯存優化、計算優化等方式,相比行業常用方案性能提升30%以上。

應用層,騰訊企點繼續升級了全新一代智能客服,提升了管理端配置能力、知識構建效率,優化C端用戶體驗;同時騰訊企點分析AI助手,覆蓋對話式分析,輔助數據配置、提取智能結論、一鍵生成報告四大場景,該功能正式在9月向大客戶开放內測申請。

這些多樣的技術組合支撐着騰訊雲將大模型落實到千行百業。

3.踐行實用主義,把大模型落地實體經濟

對於眼下的騰訊雲而言,究竟如何真正將實用主義落地真實的場景中?

從战略優先級上來看,當前騰訊雲已經有一套清晰的思考:第一步,錨定標杆客戶第二步,輻射整個上下遊產業鏈的腰部企業。“眼下,我們會挑選若幹個關鍵場景,結合客戶需求做深做透,形成標杆,之後就能夠往腰部覆蓋,开展規模化。”騰訊雲副總裁、騰訊雲智能研發負責人吳永堅告訴「甲子光年」。

其次是重要行業和領域。這個答案從騰訊雲此前的大战略就可以得出——實體經濟。

實體經濟是大模型必爭之地。工信部提出,到2025年,70%的規模以上制造業企業基本實現數字化網絡化。騰訊雲也在2021年進行了全面的調整來持續开拓實體經濟市場。騰訊對自己的角色定位一直是——實體經濟的數字化助手。工業、制造、能源、零售等都是騰訊雲的核心陣地,目前三一重工、富馳高科、國家電網都是其客戶。

騰訊集團副總裁、政企業務總裁李強在分享中稱:“騰訊會堅定的推動大模型走入產業全鏈條。比起聊天、答題、內容生產等,大模型在產業的具體場景應用,對實體經濟將帶來更大價值。”在他看來,機會巨大:“中國擁有智能化落地的豐沃土壤和場景,我國的制造業規模已經連續13年居世界首位。中國信通院預測,到2030年,中國產業智能化的規模會超過10萬億元,智能化還將推動勞動生產率提升20%。”

目前,騰訊雲已經攜手政務等行業的頭部企業,在二十余個行業探索了超50個行業大模型的應用解決方案。以騰訊雲數智人工廠爲例,騰訊雲MaaS能力可以讓數智人分身復刻縮短至24小時,大幅降低成本。在文旅領域推出的文旅大模型,金融領域打造的OCR大模型都是已經在落地的案例。

比如,騰訊雲OCR大模型可以提升非結構化內容識別、理解能力,企業可以通過TI平台對OCR大模型進行精調。這是一種極大的能力躍遷。此前傳統的OCR深度學習模型需要經過檢測、識別、結構化等多個階段,很難突破監測識別難點,且不具備閱讀理解和推理能力,更難以進行標准化,企業的定制成本高昂。新的大模型技術讓這些難題不再是障礙,能夠讓圖像到文字直接生成,使得任務間能力互補,泛化性更強,場景更豐富。

OCR大模型提升了很多場景的工作效率,比如工業質檢場景下,工廠可以讓大模型識別電线規格、零部件規格說明書,物流快遞場景下,物流公司可以讓大模型識別集裝箱規格、電子顯示屏讀數,這種端到端理解圖片的能力,極大的提高了流程效率。

這只是騰訊雲推動大模型在實體經濟的一小步。

更多關於實用主義的探索正在路上。騰訊正持續推動大模型走入產業全鏈條。隨着技術在千行百業的扎根,從田間到產线,從實驗室到便利店,大模型將無處不在。


追加內容

本文作者可以追加內容哦 !



標題:騰訊的大模型價值觀:實用主義|甲子光年

地址:https://www.utechfun.com/post/260913.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡