“智譜AI被迫“多线進軍”的背後折射出,在中國AI創新生態與投資環境中,“快”往往比“深”更受青睞。”
@科技新知 原創
作者丨林書 編輯丨蕨影
在2024年的一個尋常冬日,國產AI再次改變了我們與技術交互的方式。
11月29日,智譜AI在其技術开放日上上演了一幕令人矚目的科技大戲:歷史上首次!AI發出了第一個紅包!
公司CEO張鵬僅僅通過三句語音指令,就讓旗下的智能體AutoGLM跨越微信、支付寶等多個應用,給現場和线上的觀衆發了兩個大紅包。
這一幕背後,折射出的是 AI Agent技術的革命性突破。
當前,傳統的AI助手停留在被動響應和單一場景的交互,而智譜AI的AutoGLM已經能夠主動理解復雜指令,跨應用協同,並精准執行用戶意圖。
除了發紅包這樣的操作外,即使面對多個復雜操作的超長任務,例如訂外賣時橫跨多個APP比價,AutoGLM也能行雲流水般自主執行。
然而這樣的“驚喜”,只是今年智譜在AI方向上結出的衆多”碩果“之一。
今年7月,智譜AI 代碼生成大模型 CodeGeeX 第四代正式發布,支持代碼補全、代碼注釋、代碼修復、代碼翻譯等基礎功能;7月末,智譜AI的視頻生成模型「智譜清影」正式發布,可生成時長 6 秒,清晰度達到 1440×960的視頻。
到了10月,智譜推出並开源端到端語音模型 GLM-4-Voice,與GPT-4o的語音功能一樣, GLM-4-Voice可以進行實時語音對話,同時在情緒表達、多語言等方面實現突破,且可隨時打斷。
由此可見,今年的智譜,在代碼、多模態、Agent等多個方向上,都進行了“突擊”。這種全方位的技術布局,展示了智譜AI在追趕全球AI巨頭的決心。
然而,在這看似全面的進展背後,也不免讓人產生一種冷靜的思考:在體量、資本均不及OpenAI等巨頭的情況下,如此廣泛的技術覆蓋,是否會影響智譜在各個領域的深耕程度?
01
多线進軍的隱憂
從總體上離开,在今年的AI賽道上,身爲“AI六小虎”之一的智譜,雖然布局甚廣,但其在每一條战线上的表現,都相對比較“平均”,其產品方向更趨向於跟隨,而鮮少有獨創性的突破。
以智譜最近發布的旗艦大模型GLM-4-Plus爲例,該模型定位是一種類似OpenAI 的o1那樣的深度推理模型。雖然其在深度推理、長文本處理和指令遵循等方面表現突出,且能夠處理更復雜的數學和邏輯問題,然而,這種“強大”並不意味着絕對的優勢,反而暴露出一些潛在的矛盾。
這樣的矛盾就在於,GLM-4-Plus這種“類o1”的深度推理模型,實質上與智譜本身的生態定位之間,已經發生了錯位。
因爲智譜的定位與OpenAI這類巨頭有所不同,雖然智譜AI確實更偏向於B端市場,但B端市場並非單一結構,而是由不同層級和類型的需求構成。
對高性能深度推理的需求,主要來自科研、高技術行業或特定領域(如編程或科學計算),這些領域的規模相對有限。
智譜AI的B端客戶,則聚焦於更廣泛的行業應用的B端客戶,包括金融、教育、能源,通信等行業,這樣的企業,更需要的是性價比高、易集成且靈活的模型,而非動輒需要高算力支持的深度推理大模型。
如果說,進入高端推理模型的競爭,只是智譜AI在“scaling Law 失效”威脅下,一種展示核心技術實力的必要手段,那么在多模態方向上的布局,則反映了其更深層次的“定位迷失”。
02
力所不及的多模態
智譜AI在2024年發布的多模態語音助手功能,特別是其基於GLM系列的“智譜清言”系統,通過融合實時語音、視頻通話和多模態理解技術,試圖在C端應用領域拓展新的場景。
然而,與科大訊飛的“星火”大模型和字節跳動的“豆包”語音AI相比,智譜AI的表現呈現出一些耐人尋味的矛盾。
科大訊飛已深耕語音領域多年,其語音識別、翻譯和場景化應用(如會議記錄、智能客服)不僅成熟,而且在實際場景中有良好的落地率。字節的“豆包”則依托強大的內容生態,具有將語音AI應用到社交、娛樂和短視頻生成等消費級場景中的潛力。
在生態布局均不如人的情況下,智譜AI的多模態語音助手,卻仍未能體現亮眼的差異,其視頻通話功能雖然支持低延遲,更自然的交互,但智力水平的表現,卻與文本狀態下有着很大差距。與字節的“豆包”、訊飛的”星火都犯了同樣的通病。
除此之外,智譜AI在2024年的文生視頻領域也展現了雄心,通過其最新發布的CogVideoX v1.5模型和开放平台“清影”,提供了從文本生成視頻(T2V)到多模態整合的一系列功能。其技術亮點包括支持5到10秒的高清視頻生成、4K分辨率、多通道輸出(一次性生成多個視頻)等。
然而,平心而論,與字節、快手等大廠的文生視頻大模型相比,“清影”的表現還是太嫩了點。
雖然其主打免費、高清,甚至還在後期加入了AI音效的選項,但從效果上看,其生成的視頻不僅古怪、扭曲,並且還有一些很明顯的運動錯誤。
例如,在輸入提示詞:“一片廣闊的海灘上,一個人形機器人和一只貓在一起散步”後,清影生成的視頻裏,出現了兩個機器人,而非一個,同時它們還像螃蟹一樣,用一種橫着走路的奇怪方式在移動。
更詭異的則是畫面中的貓,走着走着,頭就變成了尾巴,仿佛器官發生了換位。
03
價格战下的無奈
上述提到的種種“博而不精”的現象,反映出的更深層次的問題在於,智譜AI似乎在B端與C端兩個方向上出現了搖擺的情況。
以視頻生成爲例,字節跳動通過其強大的內容生態,將MagicVideo-V2緊密結合到TikTok和抖音等平台,實現了技術與商業的雙向賦能。同樣地,快手也可將視頻生成嵌入自身的短視頻平台。
短視頻賽道,是天然離C端最近,也最具親和力的一條賽道。
而現在的智譜AI,從生態布局來看,其整體战略更偏向於B端市場,服務的客戶包括金融、教育、能源和制造業,這些合作大多集中在需要高技術支持和私有化部署的場景中,如工業流程優化、客戶服務智能化等。
但今年智譜AI的多线布局的策略,似乎表明了其既希望拓展ToB市場,又想在C端打造多模態互動的超級應用,形成一種“兩頭抓”的战略。
在總體資源不及OpenAI,也不及BAT等巨頭的情況下,這一策略的結果最終導致了其資源分散,難以在一個方向上形成突出的競爭優勢。
但實際上,這種多线進軍的策略,透露出的是一種在商業化困境下的“無奈突圍”。
《中國大模型中標項目監測報告》顯示,2024年1-9月份,智譜華章中標的大模型項目達到22個,中標項目披露的中標金額爲2472.3萬元。22個中標項目主要分布在通信、金融、能源、教科等行業,以央國企客戶爲主。
從大模型中標項目數量來看,智譜華章可以跟科大訊飛、百度一樣,位列第一梯隊。但是獲得這些項目的過程中,智譜華章付出的“代價”也不小。
這樣的“代價”,就是卷到極致的價格战。
今年以來,爲了應對同行的價格壓制,智譜AI將模型調用價格降低到行業最低水平,如GLM-4-Flash的價格僅0.06元/百萬tokens;對比之下,OpenAI的GPT-4 Turbo版本爲 10美元/百萬tokens,差距超過千倍。在一年的時間裏,智譜AI從最初的 0.5元/千tokens 降至當前價格,降幅接近1萬倍。
這種激進的降價策略,導致利潤空間進一步被壓縮。於是,作爲大模型廠商的智譜AI,要活下來,只能依靠融資。
過去半年,資本對於國內大模型廠商的態度逐漸冷靜下來。如果大模型廠商想要拿到新一輪融資,最重要的就是要證明自己商業化的能力。
而這樣的“能力”,反映在具體的業務上,就是一個又一個的“技術奇觀”的出現。
過去幾個月,智譜AI接連發布了AI生成視頻模型清影(Ying)、情感語音模型GLM-4-Voice ,以及AI助理工具AutoGLM 等,這無一不是想通過追逐技術熱點,來吸引市場關注的表現。
然而,縱觀整個AI行業來看,即使在大模型商業化困難的瓶頸期,除了“多线出擊”的策略外,相關的AI企業並不是沒有其他選擇的余地。
在大模型尚未在C端取得明顯盈利化的階段,是否有AI企業保持住了自身的定力,專注於特定的方向,並取得了突破行業上限的進展?
答案當然是有的,OpenAI的勁敵——Anthropic就是個很好的例子。
與其他多线布局的大廠相比,Anthropic明確聚焦於機制可解釋性和AI對齊問題。它的研究目標高度集中,例如通過“憲法AI”的理念改進AI的安全性和倫理性,使其模型的行爲更加透明和可控。這種專注不僅增強了其科研資源的深度與質量,也吸引了對該領域有長期投資意愿的資本,包括Sam Bankman-Fried的FTX基金會、Google Cloud等。
Anthropic之所以能做到這點,而智譜AI卻被迫“多线進軍”,背後折射出了一個深層次的現實:在中國的AI創新生態與投資環境中,“快”往往比“深”更受青睞。
這並非簡單的企業選擇問題,而是整個創新生態的產物。
智譜AI等國產大模型廠商普遍“追熱點”困境,本質上是一個“囚徒困境”:每家企業都知道深耕細作的重要性,但在激烈的市場競爭和資本壓力下,不得不選擇更激進的策略。這種現象的背後,是中國技術創新生態尚未形成對“慢變量”的充分理解和尊重。
原文標題 : 智譜AI战略失焦,B端C端難兼顧
標題:智譜AI战略失焦,B端C端難兼顧
地址:https://www.utechfun.com/post/453266.html