混沌初开:國產大模型在沸騰中“求索”

2023-05-31 18:40:16    編輯: robot
導讀 “ 畢竟在全球經濟周期性下滑的今天,下一個像AI大模型這么具有想象力的科技商業機會,不知能在何時又會以何種形式出現  內容:koorvoa  編輯:TV.  校對:莽夫  ChatGPT持續狂飆,國...

畢竟在全球經濟周期性下滑的今天,下一個像AI大模型這么具有想象力的科技商業機會,不知能在何時又會以何種形式出現 

內容:koorvoa 

編輯:TV. 

校對:莽夫 

ChatGPT持續狂飆,國內大模型諸神之战同樣愈演愈烈。

百度、阿裏、360等大科技公司相繼推出大模型產品並高速迭代,加快應用落地;智譜AI、瀾舟科技等創新創業公司也進一步拓展在大模型上的布局,加速百億、千億級別大模型自研進度。

中國版ChatGPT之爭的背後,事實上是技術(大模型數據、算力、算法)、資金、人才各個方面的長期較量。誰能在大模型能力上領先,率先應用落地,布局商業化,誰就有可能在AI 2.0時代掌握話語權。

Part.1

創業者們的三大難關:

錢、技術、人才

大模型燒錢是賽道參與者的共識。啓明創投合夥人周志峰在媒體採訪時表示,一家大模型創業公司從起步到發布到第一個較成熟的的模型,完成商業化驗證,至少需要2億美元。

曠視CEO印奇也曾透露,訓練出GPT-3.5至少需要1萬張A100的芯片集群,硬件投入需要20億元。

入局者先備錢。王慧文個人投資5000萬美元成立公司,李开復圈宣布籌組中國版ChatGPT公司“Project AI 2.0”之前,資金就已先到位。此前,李开復相繼減持知乎、美圖套現近1.5億。創業公司瀾舟科技也在今年完成Pre-A+輪融資,融資額達數億元。

融到錢才能活下去。資金成爲依靠風險投資的大模型創業者們首先要解決的問題。盡管在ChatGPT的帶動下,資本機構當前看好這一賽道,但主要以明星項目、明星團隊爲主。當創業者短期內不能明確營利模式和研發成果轉化,市場對於創業公司不會有太多的耐心。

頭部科技公司同樣面臨相似問題。在衆多大廠正在或即將迎來組織架構調整和改革的背景下,除百度將大模型上升爲核心战略外,其余“淺嘗”中的大廠,集團對於大模型的長期投入、業務場景落地和战略定位也會有更嚴苛的考核。

這種情緒上的急迫,主要來自於時間窗口期的壓縮。海外科技巨頭在大模型技術和應用上的不斷突破,留給國內廠商的追趕時間不會太久。

技術能力是影響大模型競爭格局的核心。大模型對於算法、算力和數據的要求都格外高,而互聯網大廠擁有更爲深厚的技術儲備。人才資源上的爭奪也同樣如此。作爲大模型競爭中的重要一環,大廠和資金實力豐厚的企業對於人才擁有更強的吸引力。

杭州未來科技城曾有一家公司招聘AIGC方向算法工程師,年薪最高可達320萬的消息引起熱議。AIGC人才站上高薪風口,AI企業展开新一輪搶人大战。脈脈高聘人才智庫最新調研數據顯示,今年1-2月AIGC人才需求逆勢上漲,崗位數量同比增長31.3%,創下歷史新高。

AI公司對頂級人才的渴望可見一斑。王慧文表示要拿出新公司光年之外75%的股份用於邀請頂級研發人才;王小川通過公开信呼喚中國領軍人物、行業產品經理和遠在美國的同仁加入;李开復邀請全球世界範圍內的人才一起打造世界級的公司…

大模型瘋狂搶人的背後,是AI公司對於當下轉瞬即逝的機會窗口的急迫把握。畢竟在全球經濟周期性下滑的今天,下一個像AI大模型這么具有想象力的科技商業機會,不知能在何時又會以何種形式出現。

Part.2

AI新機會:

通用大模型or應用層垂直模型

擺在國產大模型入局者的機會和選擇有兩個:通用大模型與應用層垂直模型。

大廠更具有开發通用大模型的野心和能力。當前模式主要是以通過提供底層通用平台,吸引更多开發者和合作夥伴一起發展,打造全新AI生態爲主。不僅惠及雲計算業務,主流商業模式也從IaaS(基礎設施即服務)轉向MaaS(模型即服務)。

在具體應用上,阿裏雲通義千問大模型將全面接入阿裏辦公、購物、語音助手等場景,中興通訊、吉利汽車、波司登、掌閱科技等多家企業表示將與阿裏雲在大模型場景展开技術合作。

百度文心一言已經覆蓋政務、金融、媒體、電商零售等場景,在醫藥領域,百度發布GBI-Bot,成首個落地醫藥行業的產品。在汽車領域,長安汽車官宣逸達將成爲國內首款搭載文心一言的量產車型,後續將通過軟件升級的形式搭載至新車。

相比通用大模型,垂直大模型對於算力、算法的要求會低一些。作爲一種全新的生產力,隨着垂直大模型底層能力的不斷突破,必然能實現企業的降本增效,帶來上層應用的迭代和變革。

李彥宏曾直言,“中國的OpenAI不是創業公司的機會,沒有必要再重新發明一遍輪子。”“有了輪子之後,做汽車、飛機,價值可能比輪子大多了。”

一些不具備技術、資金競爭實力的中小型企業和創業者們,在垂直領域積累了大量數據和know-how,選擇以开源或合作大模型+外掛領域知識庫的方式,瞄准應用層垂直模型機會,從細分行業切入解決特定場景的市場需求。

例如深蘭科技已經开發出面向個人數字化的硅基知識大模型,主要用於進行知識的個性化和專業化預訓練。

面向教育領域,學而思正在自研數學大模型,有道發布了基於“子曰”大模型研發的AI口語劇透視頻。面向生物領域,上海人工智能研究院、祥符實驗室、轉化醫學國家科學中心(上海)聯合發布全國首個DNA存儲領域預訓練大模型“ChatDNA”…

通用大模型和垂直模型將構成新的AI行業格局。通用模型大而全,能適應千行百業,擁有更多的商業場景和更大的商業市場。垂直領域模型小而專,可以更精准地服務特定行業和特定人群,更易落地且進行商業化。

但無論是通用大模型還是應用層垂直模型,AI企業都有機會跑出來,在“每個行業都值得用AI重構一遍”的時代變局中。

Part.3

信心之外:

無法回避的殘酷追趕現實

盡管國產大模型研發全面加速,但無論是百度、阿裏這樣的國內科技巨頭,還是信心滿滿的創業者都無法回避的殘酷現實是,自家產品與快速成長和落地OpenAI存在不小差距,即便沒有王小川認爲的OpenAI比國內領先三年之久,但也遠不到“上來就說能超越”,周鴻禕直言不諱,“那才叫吹牛”。

與海外科技巨頭相比,中國大模型廠商在數字基建上面臨着硬件條件的“先天不足”,在數據和算力等方面存在明顯短板。

在算力層面,英偉達A100芯片構成了ChatGPT訓練大模型的算力底座,目前市面上幾乎沒有英偉達GPU產品在AI大模型訓練上的替代品。但由於GPU出口限令,死死卡住了中國AI算力的脖子,中國企業只能使用存量的A100和傳輸速率只有A100三分之二的A800。

大模型實現數量級飛躍離不开GPU算力加持,如果算力跟不上,會導致大模型的差距進一步拉大。

在數據層面,大模型的發展依賴於高質量的訓練數據集,而國外數據集要領先中國很多。目前國內基於中文語義的大模型訓練所需要的中文數據總量不夠,而且質量不高。國外企業可以直接使用各類整理好的公开數據訓練AI,但國內企業還需要付出額外的人力和資金成本來採集、清洗、標注獲得的數據。

不久前,騰訊雲曾聯合上海大學舉辦的人工智能數據標注大賽,被網友調侃“思路清奇”,“1.8萬元买到了120位大學生的40個小時用來做數據標注”,雖在網絡上引起不小爭議,但活動發出短短數小時後便顯示“名額已滿”。

此外,優質中文大模型訓練語料的稀缺也會加大中國大模型和國外大模型的差距。技術差距下,中國大模型廠商正在通過後天努力,奮力追趕,以期“大力出奇跡”。

一方面,中國科技公司加速自研AI訓練芯片,尋找國產替代化方案,以此來解決算力之困。例如超過英偉達A100八成能力的百度昆侖芯片,目前已經更新到第二代,量產幾萬片;第三代則預計於2024年實現量產。

此外,據華爲透露,目前昇騰AI基礎軟硬件平台已孵化和適配了30多個主流大模型,超過一半的中國原生大模型基於昇騰AI孵化。有消息稱,華爲即將推出的昇騰920性能可以達到英偉達H100水平。此消息如果成真,將大大緩解國內日益增長的AI算力需求壓力。

另一方面,政府和企業都在積極尋找破解數據之困的方法。政府層面,數據要素政策頻出,通過建立國家數據局來協調推進數據基礎制度建設,統籌數據資源整合共享和开發利用。同時,各地積極推動數據交易所建設,加速數據自由流通,緩解國內優質數據集不足的問題。

產業層面,越來越多的數據服務商將數據加工處理、數據分析服務等方面幫助企業構建高質量數據集,提高數據質量的同時,加快大模型的研發效率。

國產大模型競賽才剛剛开始,面對這個比移動互聯網還龐大多倍的AI機會,所有參與者都全情投入,盡銳出战,緊抓來之不易、稍縱即逝的窗口期。

即便競爭異常激烈,即便難關重重,但都在朝着更創新的技術、更易落地的應用、更明晰的商業化路徑方向走去。

       原文標題 : 混沌初开:國產大模型在沸騰中“求索”



標題:混沌初开:國產大模型在沸騰中“求索”

地址:https://www.utechfun.com/post/220263.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡