導讀 自2022年底以來,隨着ChatGPT橫空出世並迭代升級,全球各國、各行各業面對AI大模型似乎都FOMO了(FearofMissingOut,錯失恐懼症),動作頻頻生怕錯失機遇。然而迄今爲止,在轟轟...
自2022年底以來,隨着ChatGPT橫空出世並迭代升級,全球各國、各行各業面對AI大模型似乎都FOMO了(FearofMissingOut,錯失恐懼症),動作頻頻生怕錯失機遇。
然而迄今爲止,在轟轟烈烈的“煉大模型”過程中,除了英偉達賺得盆滿鉢滿外,其他玩家都還沒找到穩定且持續的商業模式。相反,隨着參數規模的日益膨脹,模型訓練的算力开支越來越高,大投入卻看不到產出的情況下,新的“焦慮症”又蔓延开來。
在大模型“軍備競賽”最激烈的美國,資本市場近乎進入“癲狂”狀態。這兩年來,美股市場只要跟AI相關的股票都漲瘋了。蘋果一個AI進展發布會,隔天市值就上漲2142億美元;以微軟爲首的美股“Big7”的市值,更是達到史無前例的14萬億,佔據標普500的32%,紙面市值與實際價值倒掛,“癲狂”程度史無前例。投行分析師們开始焦慮一個比互聯網泡沫更大的AI泡沫即將到來。
在中國互聯網圈,巨頭們焦慮與美國的差距的同時,开始不斷壓低每Token的價格,提前开啓簡單粗暴的價格战。其中,字節跳動豆包大模型將通用模型pro-128k版的推理輸入價格定在0.005元/千tokens,較行業銳降95.8%;阿裏通義千問將主力模型Qwen-Long的API輸入價格降至0.0005元/千Tokens,直降97%;百度甚至宣布將文心大模型的兩款主力模型ENIRESpeed和ENIRELite全面免費。
一方面是AGI的崇高理想,另一邊是ROI的殘酷現實,面對AI大模型這班开往未來的列車,不“上車”不行,“上車”後找不到好位置、堅持不到終點也不行,到底該何去何從?
在中國政企行業,一群富有遠見的先行者將通用大模型與特定行業的專業知識相結合,打造屬於自己的專屬大模型,以加速行業AI應用落地,真正兌現大模型的價值,爲業界走出AI大模型“焦慮症”找到了“最優解”!
中國大模型擺脫“焦慮症”,破局之路在行業
從全球“大模型之爭”开啓之初,“中美在AI領域差距有多大”就一直都是公衆關注的熱點議題,從1~2年到8~10年不等。
必須承認,我國在算力、算法和數據領域其實並不具備優勢:高端算力卡被英偉達卡脖子無法供應,短時間內自有制程和設計又無法跟上;算法領域,雖然模型數量衆多,但大多數是基於國外开源架構優化,缺乏自主性和領先性;數據領域,我們的开放數據和國外不在一個數量級上,中文語料嚴重不足。
這些差距是短期內難以抹平的,這時候,縮短差距的正確打开方式,自然不是以己之短博人之長。
從另一個角度看,我國有全球唯一的全工業門類、最多的金融消費人群以及最大規模的政務和城市體系,產生了豐富的場景和私有數據,這些都成爲發展行業大模型的天然土壤。因此,比拼應用成爲中國大模型破局的一條有效路徑,通過大模型賦能一個個行業細分場景,最終形成战略突圍。
以差異化優勢入局,可以預見,今天率先擁抱大模型的行業企業和組織,面對的將是一個劃時代的重大战略機遇。
政企行業大模型挑战重重,工程化能力是“勝負手”
當然,站在新時代的起點,政企行業打造大模型,依然是挑战重重,因爲大模型的應用本身就是一個復雜的系統工程,除了單點技術的持續突破外,更需要基於場景和需求匹配合適的技術,通過全鏈路、多技術融合的系統性創新整體推進。
首先,大模型不是孤立的技術,必須重視軟硬件基礎設施的協同發展。除了大模型本身,我們還需要關注其背後的技術生態系統,包括开發工具、計算架構以及硬件設施如算力、存儲和網絡。在設計和驗證過程中,必須考慮性能、可靠性、可維護性和兼容性,確保系統的高效和穩定運行。
第二,行業大模型需要AI-Native的基礎設施。一般企業可以直接選擇公有雲享受雲上的充沛算力,但對於政府、金融、電力等大型政企而言,爲了滿足安全合規要求,混合雲才是更優選,即先借公有雲的超大算力和數據訓練基礎大模型,再在私有雲裏結合私有數據二次訓練得到企業專屬大模型,最後在邊緣雲推理實現場景化應用。
第三,大模型需要建立AI开發工作流,促進模型確定性交付。大模型的开發是一個復雜的系統工程,需要跨團隊協作和迭代开發。爲了提高开發效率和質量,需要建立一站式的AI开發工作流,實現標准化和自動化,減少开發過程中的不確定性。
第四,大模型需要重視數據工程,打造優質數據集。高質量的數據是大模型成功的關鍵。目前中文數據集與英文存在差距,需要通過建立數據工程能力,優化數據的供應、流動和使用,爲大模型高質量供數。
第五,行業大模型不適合孤軍作战,需要着力培育產業生態。生態是發展大模型不可或缺的一環,這需要政府和行業頭部企業從技術生態、數據生態、模型生態和應用生態四個層面,去構建AI時代开放、可閉環、有質量的生態體系。
最後,大模型不是一錘子买賣,需要持續運營與優化。大模型運營和建設同樣重要,持續的運營和優化對於大模型平台的長期價值至關重要,這要求企業建立適合的流程、組織結構和人才隊伍,不斷優化現有場景並探索新的應用領域。
一言以蔽之,行業大模型考驗的不是單項能力,而是全流程融會貫通的工程化能力。
先行者邁出堅實步伐,行業大模型未來可期
綜上不難看出,盡管當前大模型在技術和價格上卷得如火如荼,但其兌現價值的“主航道”在行業,真正的賽點在於落地。在行業大模型的大賽道上,不盲目追求堆算力、堆參數量,而是聚焦技術與場景的深度融合,踏踏實實積累工程化能力,幫助行業大模型落地才是關鍵。從這個層面講,AIforindustries的華爲雲與政企行業先行者的聯合創新實踐,可謂走在了正確的道路上。
去年,華爲雲就率先發布業界首個大模型混合雲華爲雲Stack。在近期的華爲开發者大會上,華爲雲更進一步發布大模型混合雲十大創新技術,包括多樣性算力調度、算子加速、雲邊協同等等。既有根技術研發實力,又有業界最全的AI大模型全套工具鏈和軟硬件產品,華爲雲Stack一套組合拳下來,行業大模型的焦慮也被治好了大半。
比如,從2022年开始,山東能源集團攜手華爲雲基於混合雲打造全球首個礦山大模型,已在煤礦領域9個專業40多個場景應用實踐。今年1月,鄂爾多斯與華爲聯合打造內蒙古首個以行業AI大模型爲核心的工業互聯網平台,在煤礦領域提升、主運、安監、防衝、採煤、掘進、輔運、洗選、焦化等9個專業實現了26個場景智能化,達到可視、可管、可溯規範化作業,提升安全生產能力的同時有效提高了生產效率和效益。
更值得注意的是,先行政企的行業大模型不僅是自建自用,更是在牽頭打造示範場景並沉澱經驗,對外輸出向行業賦能。比如,鄂爾多斯工業互聯網平台目前已完成44個AI大模型應用开發,上架270多款商品,爲28家AI企業、16家礦鴻企業共44家應用开發者以及當地300多家礦山生產企業提供了开放可靠的交易平台。
展望未來,相信在華爲雲及產業上下遊各方的共同努力下,依托我國場景豐富的優勢,大模型必將能夠打开更廣闊的行業智能化天地,加速邁向智能世界,釋放更大的經濟和社會效益!
標題:走出AI大模型“焦慮症”,政企行業找到了“最優解”
地址:https://www.utechfun.com/post/389788.html