導讀 CNBC報道稱,中國想在AI領域成爲統治者,這種嘗試可能已經獲得回報。一些美國AI業內人士和科技分析人士認爲,中國AI模型已經相當流行,從性能角度看,中國的一些模型與美國產品齊頭並進,甚至超越。由於...
CNBC報道稱,中國想在AI領域成爲統治者,這種嘗試可能已經獲得回報。一些美國AI業內人士和科技分析人士認爲,中國AI模型已經相當流行,從性能角度看,中國的一些模型與美國產品齊頭並進,甚至超越。
由於無法採購美國先進AI芯片,中國只能尋找其它辦法增強AI模型性能,比如依賴开源技術,开發自主軟件和芯片。
OpenAIChatGPT是基於閉源模型开發的,但中國的許多企業選擇了开源LLM。查看HuggingFace平台,下載最多的LLM有許多來自中國企業,其中阿裏巴巴Qwen(通義千問)熱度最高,深度求索的DeepSeek也備受推崇。
阿裏Qwen、DeepSeek等中國大模型受追捧
HuggingFace機器學習工程師TiezhenWang告訴CNBC:“從評測基准看,Qwen的性能極爲出色,這是它快速流行的主要原因。”還有,Qwen的授權模式比較友好,企業使用時法律評估沒有那么復雜。
阿裏巴巴給Qwen分了級,有的參數很多,更強大,但算力要求高,運行成本也高,如果是參數少的小模型,運行成本更低。
TiezhenWang說:“不管你選擇什么規模的模型,Qwen都可能是現今性能最棒的模型之一。”
DeepSeek也成爲耀眼明星,它不久前剛剛推出DeepSeek-R1模型。上個月DeepSeek發布消息稱,R1模型可以與OpenAIo1模型競爭。
中國企業宣稱,它們的模型可以與MetaLlama开源模型競爭,也與OpenAI等閉源模型一樣好。
LuxCapital合夥人GraceIsford說:“2023年,我觀察到中國對开源AI的貢獻不斷增加,中國模型的性能很強,成本低,吞吐量高。”
不只是中國企業支持开源LLM,Meta和歐洲創業公司Mistral也有开源版AI模型。隨着中美科技競爭加劇,开源模型還有一個優勢:中國企業可以將自己的模型推向全球。
全球咨詢公司DGAGroup的合夥人PaulTriolo說:“中國企業當然希望自己的模型能在中國之外使用,所以中國企業看重开源模型,希望借开源成爲AI領域的全球性玩家。”
中國企業認爲LLM會是未來科技生態系統的核心
雖然全球都在熱炒AI模型,但是到底應該在模型之上开發什么應用?未來誰會主導全球互聯網版圖?現在還充滿爭論。
GraceIsford說:“如果你認爲前沿基本AI模型是必需,那就應該思考這些模型的用途,比如用於前沿科學、工程技術。”
樂觀者將AI模型比作操作系統,它和Windows、Android、iOS一樣重要,有可能會主導市場,就像科技企業主導手機和PC一樣。
英國倫敦大學國王學院學者XinSun認爲:“中國企業認爲LLM會是未來科技生態系統的核心。”
XinSun還說:“未來的商業模型有賴於开發者加入生態系統,要基於LLM开發新的應用,要通過各種手段吸引用戶、數據並獲得利潤,遠不只是引導用戶使用雲服務那么簡單。”
中國構建獨立於英偉達高性能AI芯片之外的基礎設施
訓練AI模型需要海量數據,運行時需要強大算力。英偉達已經成爲AI芯片的壟斷者,許多頭部AI企業也用英偉達芯片訓練模型,但中國是個例外。
雖然美國百般阻撓,禁止英偉達高端AI芯片流入中國,但中國企業仍然不斷推出先進AI模型。
PaulTriolo說:“目前大多中國科技平台都擁有充足的算力,完全可以繼續優化模型。首先,中國企業囤積了大量英偉達GPU;其次,中國有自己的GPU,它們來自華爲等企業。”
實際上,中國科技企業正在开發英偉達芯片的替代品,華爲是領導者,百度、阿裏巴巴也在投資半導體設計。
PaulTriolo認爲:“在未來的日子裏,中國與美國先進硬件的差距還會拉大,特別是明年,因爲明年英偉達將會推出Blackwell系統,美國會嚴格禁止Blackwell流向中國。”
GraceIsford認爲,中國一直在向本國AI基礎設施進行投資,它獨立於英偉達高性能AI芯片之外。“不管美國有沒有禁止英偉達AI芯片在中國銷售,中國都會繼續投資,繼續打造自己的基礎設施,繼續开發、訓練AI模型。”
標題:美媒:一些中國大模型已經追平甚至超越美國產品
地址:https://www.utechfun.com/post/455772.html