美媒:一些中國大模型已經追平甚至超越美國產品

2024-12-18 18:00:16    編輯: robot
導讀 CNBC報道稱,中國想在AI領域成爲統治者,這種嘗試可能已經獲得回報。一些美國AI業內人士和科技分析人士認爲,中國AI模型已經相當流行,從性能角度看,中國的一些模型與美國產品齊頭並進,甚至超越。由於...

CNBC報道稱,中國想在AI領域成爲統治者,這種嘗試可能已經獲得回報。一些美國AI業內人士和科技分析人士認爲,中國AI模型已經相當流行,從性能角度看,中國的一些模型與美國產品齊頭並進,甚至超越。

由於無法採購美國先進AI芯片,中國只能尋找其它辦法增強AI模型性能,比如依賴开源技術,开發自主軟件和芯片。

OpenAIChatGPT是基於閉源模型开發的,但中國的許多企業選擇了开源LLM。查看HuggingFace平台,下載最多的LLM有許多來自中國企業,其中阿裏巴巴Qwen(通義千問)熱度最高,深度求索的DeepSeek也備受推崇。


阿裏Qwen、DeepSeek等中國大模型受追捧

HuggingFace機器學習工程師TiezhenWang告訴CNBC:“從評測基准看,Qwen的性能極爲出色,這是它快速流行的主要原因。”還有,Qwen的授權模式比較友好,企業使用時法律評估沒有那么復雜。

阿裏巴巴給Qwen分了級,有的參數很多,更強大,但算力要求高,運行成本也高,如果是參數少的小模型,運行成本更低。

TiezhenWang說:“不管你選擇什么規模的模型,Qwen都可能是現今性能最棒的模型之一。”

DeepSeek也成爲耀眼明星,它不久前剛剛推出DeepSeek-R1模型。上個月DeepSeek發布消息稱,R1模型可以與OpenAIo1模型競爭。

中國企業宣稱,它們的模型可以與MetaLlama开源模型競爭,也與OpenAI等閉源模型一樣好。

LuxCapital合夥人GraceIsford說:“2023年,我觀察到中國對开源AI的貢獻不斷增加,中國模型的性能很強,成本低,吞吐量高。”

不只是中國企業支持开源LLM,Meta和歐洲創業公司Mistral也有开源版AI模型。隨着中美科技競爭加劇,开源模型還有一個優勢:中國企業可以將自己的模型推向全球。

全球咨詢公司DGAGroup的合夥人PaulTriolo說:“中國企業當然希望自己的模型能在中國之外使用,所以中國企業看重开源模型,希望借开源成爲AI領域的全球性玩家。”

中國企業認爲LLM會是未來科技生態系統的核心

雖然全球都在熱炒AI模型,但是到底應該在模型之上开發什么應用?未來誰會主導全球互聯網版圖?現在還充滿爭論。

GraceIsford說:“如果你認爲前沿基本AI模型是必需,那就應該思考這些模型的用途,比如用於前沿科學、工程技術。”

樂觀者將AI模型比作操作系統,它和Windows、Android、iOS一樣重要,有可能會主導市場,就像科技企業主導手機和PC一樣。

英國倫敦大學國王學院學者XinSun認爲:“中國企業認爲LLM會是未來科技生態系統的核心。”

XinSun還說:“未來的商業模型有賴於开發者加入生態系統,要基於LLM开發新的應用,要通過各種手段吸引用戶、數據並獲得利潤,遠不只是引導用戶使用雲服務那么簡單。”

中國構建獨立於英偉達高性能AI芯片之外的基礎設施

訓練AI模型需要海量數據,運行時需要強大算力。英偉達已經成爲AI芯片的壟斷者,許多頭部AI企業也用英偉達芯片訓練模型,但中國是個例外。

雖然美國百般阻撓,禁止英偉達高端AI芯片流入中國,但中國企業仍然不斷推出先進AI模型。

PaulTriolo說:“目前大多中國科技平台都擁有充足的算力,完全可以繼續優化模型。首先,中國企業囤積了大量英偉達GPU;其次,中國有自己的GPU,它們來自華爲等企業。”

實際上,中國科技企業正在开發英偉達芯片的替代品,華爲是領導者,百度、阿裏巴巴也在投資半導體設計。

PaulTriolo認爲:“在未來的日子裏,中國與美國先進硬件的差距還會拉大,特別是明年,因爲明年英偉達將會推出Blackwell系統,美國會嚴格禁止Blackwell流向中國。”

GraceIsford認爲,中國一直在向本國AI基礎設施進行投資,它獨立於英偉達高性能AI芯片之外。“不管美國有沒有禁止英偉達AI芯片在中國銷售,中國都會繼續投資,繼續打造自己的基礎設施,繼續开發、訓練AI模型。”

標題:美媒:一些中國大模型已經追平甚至超越美國產品

地址:https://www.utechfun.com/post/455772.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡