騰訊雲發力行業大模型,有幾分勝算?

2023-06-26 18:40:37    編輯: robot
導讀 自BERT出現之後,大模型成爲AI領域的主流技術趨勢,業界也因此掀起兩輪熱潮。國內外衆多大廠、創業公司都在爭先推出各自的大模型,字節跳動亦被認爲將在今年年中推出大模型。 如今騰訊也出手了。6月19日...

自BERT出現之後,大模型成爲AI領域的主流技術趨勢,業界也因此掀起兩輪熱潮。國內外衆多大廠、創業公司都在爭先推出各自的大模型,字節跳動亦被認爲將在今年年中推出大模型。

如今騰訊也出手了。6月19日,騰訊雲發布MaaS(模型即服務)能力全景圖,計劃打造一站式行業大模型精選商店,以協助客戶構建專屬大模型及應用。騰訊雲的入場,會給賽道帶來什么?在激烈的競爭中,騰訊雲有幾分勝算?

01

助力大模型落地

目前市面上谷歌、微軟、百度、阿裏等大廠公布的都是一個基礎的通用大模型。與此前諸多公司急切高調推出的通用大模型不同,騰訊將更多的關注放在了面向B端的行業大模型身上。

騰訊雲MaaS的技術底座是一系列的行業大模型,包括金融、政府、文旅、傳媒、教育等。

基於這些基礎模型,騰訊雲的客戶只要加入自己的場景數據,就可以生成契合自身業務需要的專屬模型;同時也可根據自身業務場景需求,“量體裁衣、按需定制”不同參數、不同規格的模型服務。

如在醫療健康領域,騰訊雲可以幫助醫療機構構建和部署自己的疾病預測模型,提高診斷准確率和治療效果;在金融領域,騰訊雲可以幫助銀行和保險公司構建和部署自己的風險評估模型,提高風險控制能力。

騰訊選擇這個思路,也不難理解。通用大模型需要利用大規模數據和先進的機器學習技術來訓練和優化大型神經網絡模型,但由於很多企業的業務數據等都是非常隱私的核心數據,他們根本不會將其放在數據集上進行公开訓練,因此訓練模型的專業、且高質量的數據收集是非常難的。

同時在通用大模型時,需要大量計算資源和漫長的訓練周期。但是並非每家企業都有足夠的資源,讓大模型完成訓練和推理,這對企業來說昂貴且耗時。英偉達曾公布數據顯示,訓練一次大模型,大約100多萬美金。

但大模型在國內落地的需求卻已刻不容緩,爲了解決落地問題,推出更有針對性的行業大模型,並利用數據精調來滿足業務需要,已經成爲國內雲服務商曲线解決當下困境的一種選擇。

中金公司指出,騰訊AI大模型內外兼修,騰訊雲的大模型能力可應用於騰訊會議等SaaS產品當中,將進一步加強產品的優勢及提升變現潛力。

02

大模型落地挑战重重

在行業大模型落地的過程中,仍然有不少困難和挑战需要去解決。

一是計算資源問題。訓練大型模型需要大量的計算資源和存儲資源,與一般服務器相比,GPU服務器的穩定性比較低,大模型訓練需要的GPU經常達到上千張卡。

對於許多企業來說,這可能是一個巨大的負擔,因此尋找更高效的算法和硬件優化是解決這一問題的關鍵。

二是數據質量問題。訓練大型模型需要大量的高質量數據,可現實情況卻是,這些數據往往存在噪聲、缺失值等問題,如果導入的數據質量低,那訓練出來的模型也會有問題。

因此,研究人員需要採用各種方法來解決這些問題,例如數據清洗、去噪等,這也導致數據質量或不准確。

三是大模型的應用問題。當把大模型的能力落到某個實際場景的應用產品上時,由於沒有參照,其實是並不好判斷具體該如何用這些模型的。

雖然大模型在某些領域表現出色,但是它們並不一定適用於所有場景。因此,需要根據具體應用場景選擇合適的模型。

此外,大型模型可能會泄露用戶的敏感信息,如醫療記錄、財務信息等。因此,保護用戶隱私是非常重要的,這需要採取措施確保數據的安全性和隱私性,例如使用加密技術、限制訪問權限等。

總之,大模型的落地面臨着許多挑战,需要克服這些挑战才能實現其潛力。但從邏輯上講,行業大模型一定會是在精度相對較低、容錯率較高的行業先引用,再到精度要求高的地方去。

03

騰訊雲有幾分勝算?

在當前的大模型賽道中,谷歌、微軟、亞馬遜等科技巨頭已經佔據了主導地位,他們擁有龐大的數據集和先進的算法技術,能夠訓練出具有極高准確性和泛化能力的模型。

此外,國內的百度、阿裏巴巴、騰訊等企業也在積極布局大模型賽道,通過自主研發和收購等方式獲取更多的技術和數據資源。

騰訊的優勢主要是其過去積累的龐大的業務數據和算力基礎設施,如今騰訊雲的解決方案,就是基於這些過去的積累,解決大模型應用落地的痛點。

一方面,騰訊旗下有多個不同的業務板塊,多年來在金融、傳媒、文旅、工業等不同領域積累了大量的數據和經驗。以此爲養料,騰訊雲才能構建起一系列針對不同行業的行業大模型,同時針對一些特定的任務進行優化,從而確保使用時僅需少了數據就可以達到較好的精調效果。

另一方面,騰訊雲在大模型算力方面擁有領先優勢。早在今年4月,騰訊雲便發布了面向大模型訓練的新一代HCC高性能計算集群,採用最新一代騰訊雲星海自研服務器,結合多層加速的高性能存儲系統,具備3.2Tbps業界最高互聯帶寬,算力性能提升3倍。

騰訊還有自己的升級框架加速能力太極Angel,是其在人工智能領域的技術積累和創新成果之一,它採用了先進的異步調度優化、顯存優化、計算優化等技術手段,可以顯著提升大模型的訓練和推理速度。

總之,騰訊入場大模型賽道將會對整個行業產生深遠的影響,推動技術的進步和商業的發展。

       原文標題 : 騰訊雲發力行業大模型,有幾分勝算?



標題:騰訊雲發力行業大模型,有幾分勝算?

地址:https://www.utechfun.com/post/230083.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡