突遭下架，“國服最強”开源模型將何去何從？

2024-09-18 18:40:26 編輯： robot

導讀阿裏通義千問QwenLM代碼在GitHub下架引發信任危機，在开閉源方向選擇上，阿裏雲積極开源，但仍面臨變現難題。大模型價格战爆發，技術與市場需求脫節，商業化充滿不確定性。 @科技新知原創作者丨...

阿裏通義千問QwenLM代碼在GitHub下架引發信任危機，在开閉源方向選擇上，阿裏雲積極开源，但仍面臨變現難題。大模型價格战爆發，技術與市場需求脫節，商業化充滿不確定性。

@科技新知原創

作者丨余寐編輯丨蕨影

2024年下半年，國產AI大模型並不好過。

近期，AI代碼類應用cursor發布，因其強大的編程功能，一時風頭無兩；緊接着openAI又於9月12日發布了最新模型chatGPT o1，在邏輯推理和編程能力上又提升到一個全新級別，可以說擁有了真正的通用推理能力，國際AI領域的競爭日益激烈。

同樣在9月，號稱“國服最強”的开源大模型通義千問QwenLM全系列代碼在github（全球最大的开源代碼托管平台之一）被下架，包括开源新王Qwen2.0在內的項目在訪問時全部404。不僅引發了從業者對开源模型穩定性的信任危機，也暴露出國產大模型在商業化道路上的困境。

Part.1

下架風波，回應敷衍

“團隊沒有跑路，就是github org被無端端flag，所以你們看不到內容，我們已經在聯系官方目前也不知道原因。”

阿裏高級算法專家，通義千問團隊負責人林俊暘在事件發生後迅速在社交平台闢謠。

但這樣的回應並沒有讓AI相關從業者們滿意。在此之前，他們中的一些人剛經歷過Runway從HuggingFace上刪庫跑路的風波。Runway以Stable Diffusion系列聞名，一夜之間把自家开源模型清空，讓無數正在使用該模型的开發者陷入停擺。

雖然目前github上QwenLM模型代碼已經恢復，但對於事件的原因，通義千問團隊並沒有再做出任何回應。對於开源模型的項目，是否會再次受制於類似事故，從業者們更加茫然和悲觀。

开源是阿裏通義大模型的重要战略。

阿裏雲CTO周靖人曾在公开論壇表示：“开發者的反饋和开源社區的生態支持，是通義大模型技術進步的重要助力。”

大模型的訓練和迭代成本極高，絕大多數的AI开發者和中小型企業無法負擔。從這角度上來看，通義大模型的「全模態、全尺寸」开源战略，長期沉澱的良好口碑爲其贏得了一衆鐵粉。

每有开源動作都會被熱切的开發者們早早蹲守。截止2023年10月，阿裏雲旗下开源社區“魔塔”已有超過2300個模型，开發者超過280萬，模型下載數破億。阿裏最新推出的开源模型QWen2系列更是風靡全球，其中Qwen2-72B更是在發布後短短兩個小時，就衝上了Huggingface开源大模型排行榜之首，隨後又衛冕全球最權威的开源模型測試榜單之首。而阿裏最新季度業績披露，通義千問开源模型下載量已突破2000萬。

通義大模型的开源之舉，打破了海外閉源大模型對國內开發者們的制約。就像阿裏雲CTO周靖人所說，“阿裏雲的初衷不是把模型攥在自己手上去商業化，而是幫助开發者，开源的策略與阿裏雲的初心完全一致。”在他看來，要在AI創新技術與模型層出不窮的當下，开源是“最佳也是唯一的途徑”。

Part.2

开源VS閉源，誰是贏家？

在大模型時代开啓之時，开源和閉源就一直爭論不休。

百度創始人李彥宏就曾在今年4月舉行的百度AI开發者大會上宣稱“开源模型會越來越落後。”隨後，李彥宏在內部講話中也對开源模型的局限性表達了明確的看法——雖然开源模型獲取和使用便利，但商業化應用中卻往往遭遇GPU使用率低、推理成本高等問題。而互聯網圈另外一位大佬周鴻禕則表示:“我一直相信开源的力量。”

拋开行業大佬之間的口水战，开源和閉源，兩種截然不同的开發方式在當今的大模型發展中各有千秋。

從陣營上看，开源模型如meta的Llama系列、斯坦福的Alpaca、國內的阿裏通義大模型等展現了社區驅動的快速進步和創新。而以OpenAI的GPT系列、Anthropic 的Claude大模型、百度的文心大模型、華爲的盤古大模型等都選擇了閉源的形式，保持着技術領先和商業應用的優勢。

开源模式促進了大模型技術的共享與創新，而閉源模式則保障了商業利益和技術優勢，爲大模型的商業化提供了支持。

有從業者聲音認爲，從模型側來講，开源模型當前還是稍遜於閉源模型。但隨着更多开源模型的迭代，开源的能力也在快速跟上。比如通義大模型Qwen2.5模型性能已經全面趕超GPT-4 Turbo。

“從模型質量上來看，开源模型由於其代碼的公开性，更容易在社區得到測試和改進；但閉源模型在研發時，模型的數據語料質量、豐富程度以及算力規模，團隊的算法能力和背後強大的資金支持等因素，保證了閉源模型的高質量輸出。”

上述從業者也提到，數據安全對於大模型來說非常重要，訓練時會牽涉到用戶的隱私數據，抓取也可能存在攻擊性數據。开源模型因爲要开放給更多用戶，在安全和隱私方面會更加重視，安全專家可以進行代碼審查，及時發現並修復潛在的安全風險；而閉源模型因爲其代碼不公开，有專業的安全團隊進行安全防護和漏洞修復，可以減少由於外部攻擊導致的安全隱患。在業內人士看來，开源和閉源並非二元對立的關系。

Part.3

通義千問，路在何方？

比起开源和閉源之爭，如何實現商業化才是各家大模型當前急需解決的難題。

縱觀阿裏通義大模型的體系，可以分爲大模型底座和應用端產品模型兩個層面。2022年9月，達摩院發布“通義”大模型系列，打造業界首個AI底座。經過一年多的技術爆發，通義大模型已經從初代升級至2.5版本。爲了滿足不同計算資源需求和應用場景，通義團隊還推出了參數規模從5億到1100億的八款大語言模型，以及包含了多個面向不同應用場景的模型，如Qwen-VL（視覺理解大模型）、Qwen-Audio（音頻理解大模型）等。

除了底層大模型的研發，通義團隊在應用端產品也卯足了勁。在去年10月的阿裏雲雲棲大會上，CTO周靖人一口氣發布了八款產品模型：包括通義靈碼（智能編碼助手）、通義智文（AI閱讀助手）、通義聽悟（AI工作學習助手）、通義星塵（個性化角色創作平台）、通義點金（智能投研助手）、通義曉蜜（智能客服助手）、通義仁心（個人健康助手）、通義法睿（AI法律顧問）。同時，通義千問正式上线了APP，所有用戶都可通過“通義APP”直接體驗最新模型能力；开發者可以通過網頁嵌入、API/SDK調用等方式，將上述所有模型集成到自己的AI應用和服務中。

基於通義大模型的开源屬性，商業化更是一個復雜的挑战。

「科技新知」梳理下來，目前大模型的商業化模式大致可分爲四類。從C端市場來看：一是直接提供API接口，用戶通過按量使用來收費；二是大模型賦能產品帶來的需求與價格增長，如chatGPT、Midjourney等產品的付費使用。從B端市場來看，一是AI功能帶來的流量增長，進而收取廣告費用；二是通過AI對企業內部賦能，幫助企業降本增效，如文心大模型接入百度系產品，幫助產品提效。

目前看來，阿裏似乎是在ToB和ToC的商業化道路上同時摸索前行。2023年4月，阿裏巴巴宣布所有產品未來將接入“通義千問”大模型，進行全面改造。而在企業賦能上，阿裏雲把從飛天雲操作系統、芯片到智算平台的“AI+雲計算”這些AI基礎設施和通義大模型能力向所有企業开放，未來每一個企業既可以調用通義千問的全部能力，也可以結合企業自己的行業知識和應用場景，訓練自己的企業大模型。同時，通義靈碼、通義智文、通義聽悟等在內的八款產品模型，也受到了不少C端用戶的肯定。

變現之路尚未明朗，AI大模型的價格战卻已經打響。今年5月以來，字節、阿裏、百度、智譜AI等多家國內大模型廠商均調整了旗下大模型產品的定價策略，通義千問主力模型Qwen-long，API輸入價格從0.02元/千tokens降至0.0005元/千tokens，直降97%。

這也深層次反應了大模型廠商在技術、市場和战略等多方面的競爭到來。從商業化的角度來說，純粹的價格战能在短期吸引用戶，形成頭部的虹吸效應，但長期選擇上，沒有技術創新作爲支撐，難以形成持久的競爭優勢。

大模型落地應用想象空間巨大，但落地難度同樣不小。例如，將大模型直接應用於具體場景，比如醫療健康或法律咨詢領域時，實際操作的挑战便顯現出來。

在降本增效的大背景下，B端客戶在選擇大模型時也會更加注重成本和收益。如何通過細分市場企業精准定位市場需求，提供針對性解決方案，也是通義大模型在商業化布局中需要深思的。