在19世紀的淘金熱中,最賺錢的並不是挖金礦的,反而是那些賣鏟子、賣牛仔褲的人。正如賣鏟人在淘金熱中成爲最大贏家,在當今AIGC時代,AI Infra也扮演着類似的角色。
如果用雲計算三層構架做類比,AI Infra與PaaS層級相似,是鏈接算力和應用的中間層基礎設施,包括硬件、軟件、工具鏈和優化方法等,爲大模型應用开發提供一站式模型算力部署和开發工具平台。算力、算法、數據可以看作IaaS層,各種开源和閉源模型則是SaaS在大模型時代的新演變,即MaaS。隨着大模型應用落地的進程不斷加速,AI Infra的價值潛力被進一步釋放。中金數據預測,目前,AI Infra產業處於高速增長的發展早期,未來3-5年內各細分賽道空間或保持30%的高速增長。當大模型進入大規模應用落地時期,提供大模型訓練、部署和應用時所需的基礎設施成爲關鍵一環,AI Infra成爲大模型應用爆發背後“掘金賣鏟”的最佳生意。
中台模式解鎖AI生產力
從ICT產業的演進軌跡來看,三層架構似乎是宿命般的終極圖景。在傳統的本地部署階段,操作系統、數據庫、中間件等基礎軟件通過控制硬件交互、存儲管理數據、網絡通信調度等功能,解決底層硬件系統的復雜性難題,讓上層應用开發者能專注於業務邏輯進行創新。在雲定義一切的時代,也形成了IaaS、PaaS、SaaS協同進化的經典架構,其中PaaS層提供應用开發環境和數據分析管理等服務,爲雲計算加速滲透奠定了堅實基礎。經歷了漫長的蟄伏期後,AIGC按下了人工智能通用化進程的快進鍵,整個產業在狂飆突進的氛圍中急速重構。算力與應用無疑是最耀眼的主角,但二者之間的鴻溝堪比天塹,大模型面臨“懸浮”或“踏空”的風險。
從這個意義上講,AI Infra猶如一座橋,可以承擔類似基礎軟件或PaaS曾經扮演的角色——通過構建新型的軟件棧及綜合服務,賦能算力挖潛、模型優化和應用开發,成爲連接算力與應用的中堅力量。AI Infra涵蓋一切跟开發部署相關的工具和流程。隨着雲計算的不斷發展,又逐漸衍生出了DataOps、ModelOps、DevOps、MLOps、LLMOps等一些XOps的概念。從宏觀的角度來看,所有XOps本質上是爲了开發部署生命周期的提效。比如DataOps是爲IaaS層的存儲和PaaS層的數據處理提效的,DevOps、MLOps實際上是爲PaaS層开發部署提效的,LLMOps是爲MaaS層提效的。事實上,在AIGC風起雲湧之前,關於AI中台的理論與實踐就已如火如荼地展开。
但當時的AI中台更像是“救火隊員”,功能比較龐雜,幹了不少“髒活”、“累活”,卻難以獲得上下遊的認可。大模型爲AI平台化搭建起更寬廣的舞台,也讓AI Infra“掘金賣鏟”的邏輯更具確定性,進而贏得可觀的發展空間。相關機構預測顯示,未來3~5年AI Infra產業將保持30%+的高速增長。就像“三明治”的兩片面包間可以有無數種夾層選擇,身處算力與應用之間的AI Infra同樣不拘一格。從廣義上看,AI Infra涵蓋人工智能基礎框架技術,涉及大模型訓練、部署領域的各種底層設施;狹義而言,基礎軟件棧是AI Infra的核心組成部分,優化算力算法、促進應用落地是其主要目標。AI Infra定義的相對开放爲不同的路徑探索提供了更多可能。基於各自的資源稟賦與市場定位,業界的資深廠商與新興玩家正在積極拓展AI Infra的疆界,不少做法值得借鑑。
AI Infra將是 下一個應用熱點?
相比模型價值,卷AI應用成爲行業共識。李彥宏堅信,基礎模型之上將誕生數以百萬計的應用,它們對於現有業態的改造作用,比從0到1的顛覆作用更大。
如今AI應用的供給在不斷增加,IDC在年初時預測,2024年全球將湧現出超過5億個新應用,這相當於過去40年間出現的應用數總和。最近,視頻生成類模型產品扎堆出現,快手的可靈、字節跳動的即夢、商湯的Vimi集體亮相,此外還有AI搜索產品、AI陪伴類產品等層出不窮。大模型應用爆發趨勢已然確定,根據InfoQ研究中心數據,2030年AGI應用市場規模將達4543.6億元,模型應用層的巨大機會已經吸引了幾乎各行各業的參與。而在大模型應用之下,AI Infra成爲其爆發的隱藏推手。
目前,大模型產業鏈大致可以分爲數據准備、模型構建、模型產品三個層次。在國外,AI大模型的產業鏈比較成熟,形成了數量衆多的AI Infra(架構)公司,但這一塊市場在國內還相對空白。在充滿不確定性的道路上,率先找到清晰的賽道,快速建立顯著的裏程碑尤爲重要。AI Infra市場尚處於混沌期,每個科技巨頭都希望在自己的生態中形成閉環。在國內,巨頭們都有一套自己的訓練架構。比如,華爲的模型採用的是三層架構,其底層屬於通識性大模型,具備超強的魯棒性的泛化性,在這之上是行業大模型和針對具體場景和工作流程的部署模型。這種構架的好處是,當訓練好的大模型部署到垂類行業時,可以不必再重復訓練,成本僅是上一層的5%~7%。阿裏則是爲AI打造了一個統一底座,無論是CV、NLP、還是文生圖大模型都可以放進去這個統一底座中訓練,阿裏訓練M6大模型需要的能耗僅是GPT-3的1%。
百度和騰訊也有相應的布局,百度擁有覆蓋超50億實體的中文知識圖譜,騰訊的熱啓動課程學習可以將萬億大模型的訓練成本降低到冷啓動的八分之一。整體來看,各個大廠之間的側重點雖然有所不同,但主要特點就是降本增效,而能夠實現這一點,很大程度上就是受益於“一手包辦”的閉環訓練體系。反觀國外,成熟的AI產業鏈形成了數量衆多的AI Infra公司。
如果把开發AI應用看成建房子,那么AI Infra就是提供水泥鋼筋的施工隊。AI Infra施工隊的價值點在於它是一個集成平台,將下層的算力芯片層與上層的AI應用層打通,讓开發者實現一鍵調用,並且實現降低算力成本、提升开發效率並且保持模型優秀性能的效果。讓應用更簡單,讓AI落地更便捷,是AI Infra的使命。可以說,AI應用的市場有多大,AI Infra的機會就有多大。AI Infra公司有的專門做數據標注、做數據質量、或者模型架構等。這些企業的專業性,能夠讓他們在某一個單一環節的效率、成本、質量上都要比大廠親自下場做得更好。
比如,數據質量公司Anomalo就是Google Cloud和Notion的供應商,它可以通過ML自動評估和通用化數據質量檢測能力,來實現數據深度觀察和數據質量檢測。這些公司就像汽車行業的Tier 1,通過專業的分工,能夠讓大模型企業不必重復造輪子,而只需要通過整合供應商資源,就能快速地搭建起自己模型構架,從而降低成本。但國內在這一方面並不成熟,原因在於:一方面國內大模型的主要玩家都是大廠,他們都有一套自己的訓練體系,外部供應商幾乎沒有機會進入;另一方面,國內也缺乏足夠龐大的創業生態和中小企業,AI供應商也很難在大廠之外找到生存的空間。
以谷歌爲例,谷歌愿意將自己訓練的數據結果分享給它的數據質量供應商,幫助供應商提高數據處理能力,供應商能力提升之後,又會反過來給谷歌提供更多高質量數據,從而形成一種良性循環。國內AI Infra生態的不足,直接導致的就是大模型創業門檻的拔高。如果將在中國做大模型比喻成喫上一頓熱乎飯,那必須從挖地、種菜开始。目前,在AI 2.0的熱潮中,一個重要的特點就是“兩極化”:最熱門的要么是大模型層、要么就是應用層。而類似AI Infra的中間層,反而是很大的真空地帶,也可能是下一個機遇所在。
鏟子難賣,金礦難挖
盡管在大模型應用爆發的當下,AI Infra層潛藏着巨大的生意。但是對於這些做AI Infra的公司來說,即使他們在自己的專業領域如此強大,在潮水的變化面前依然脆弱。英偉達CUDA生態已經發展了20年,在AI領域,最先進的模型和應用都首先在CUDA上跑起來。每個硬件之間都有不同的接口,CUDA統一了不同接口之間的語言,讓使用者能夠用一套標准語言去使用不同硬件。在模型开發過程中,开發者勢必會趨同於在同一個語言體系中去完成自己的开發。
而這實際上就構成了英偉達CUDA生態厚度。目前,CUDA生態在AI算力市場佔據了90%以上的份額。不過隨着AI模型的標准化,模型之間結構差異變小,不再需要調度多種大小模型,英偉達CUDA生態厚度在變薄。即使如此,英偉達在算力市場也是絕對王者。據業內人士預測,英偉達在接下來的3~5年當中,還會是整個AI硬件提供商中絕對的領頭羊,市場發展佔有率不會低於80%。對AI Infra層的賣鏟廠商來說,外有英偉達守礦人,堵在門口賣門票與鏟子,好不容易找到一條進入金礦的小路,卻發現,裏面的挖礦人已經習慣“徒手”挖礦,不再接受新鏟子。在國內,企業爲軟件付費意愿低,且大多習慣集成式服務。國內SaaS投資已經降到冰點,如果AI Infra層廠商單靠賣硬件或軟件難以實現商業化。
伴隨AI應用的快速發展,未來誰能夠爲多樣化的應用場景提供高效便捷的大模型一站式部署方案,誰就有可能在這場競爭中勝出。而這其中,底層技術、中層平台、上層應用缺一不可,只有讓各方面能力得到更全面、均衡地發展,才能在AI之路上走得更遠、更穩健。放眼未來,人工智能重塑千行百業的進程剛拉开帷幕,Al Infra鋪就的厚雪長坡有助於這個超級賽道行穩致遠。今年,數據基礎設施已在頂層設計中“獨立門戶”,人工智能基礎設施战略地位的躍遷亦不遙遠。
“大模型+機器人”,具身智能將开啓“智械時代”
大模型引領技術浪潮,AI安全治理面臨“大考”
人工智能“頂流”齊聚WAIC 2024,他們都做了什么?
“元年”之後,生成式AI將走向何方?
何許人也?敢把大模型價格“打骨折”?
造完“大模型”,“具身智能”將引領AI下一個浪潮?
【科技雲報道原創】
轉載請注明“科技雲報道”並附本文鏈接
原文標題 : 大模型的“掘金賣鏟”生意,AI Infra的最佳機會來了?
標題:大模型的“掘金賣鏟”生意,AI Infra的最佳機會來了?
地址:https://www.utechfun.com/post/411946.html