別跟馬斯克扯頭花了！“叛徒”Anthropic解決了困擾OpenAI的難題

2024-03-07 18:40:09 編輯： robot

導讀引言 2024年LLM競賽正式拉开，被稱爲OpenAI“最強競爭對手”的大模型公司Anthropic帶着Claude 3系列閃亮登場。而它的對手們，一個正和馬斯克“扯頭花”；另一個因爲G...

引言

2024年LLM競賽正式拉开，被稱爲OpenAI“最強競爭對手”的大模型公司Anthropic帶着Claude 3系列閃亮登場。而它的對手們，一個正和馬斯克“扯頭花”；另一個因爲Gemini政治過分正確而焦頭爛額。

一時間，“全面碾壓GPT-4”“全球最強模型易主”等字眼鋪滿屏幕，似乎一年前由OpenAI开闢的盛世終於轉交給了Anthropic。

別忘了，GPT-4已經是一年前的產物，GPT-5還在路上；谷歌也不是Anthropic的“對手”，是其背後第二大“金主爸爸”。有消息稱，去年12月，谷歌對Anthropic的投資擴大到了20億美元。

而在這場“你追我趕”的遊戲中，還有微軟“小兒子”Mistral AI已經發布的Mistral Large，以及被Meta列爲2024年重點任務的Llama 3等等。只不過，無論是Mistral AI還是Meta目前都是被GPT-4壓着打，只有“脫胎”於OpenAI的Anthropic拿出了可以與之一战的“殺器”。

這也表明了，暫時的排名只是先來後到，今年的LLMs將全面开花，。因此，鋪天蓋地的“Open AI被追平比分”僅僅是Anthropic新品發布的一個噱頭，重點應該放在人工智能公司選擇的商業化路徑上——當Inflection、Character.AI，甚至OpenAI等公司進一步探向to C消費者用例時，Anthropic卻一頭扎向了to B。這條思路在其剛剛發布的Claude 3系列的突出性能、定價策略上均有所體現。

一、“田忌賽馬”式定價，瞄准to B領域

Claude 3系列包含三個模型——Opus、Sonnet、Haiku，性能從高到低。

根據Anthropic公布的技術報告，Opus在知識測試MMLU、推理測試 GPQA、基礎數學測試 GSM8K 等一系列基准測試中，均優於GPT-4。Sonnet的性能與GPT-4不相上下；Haiku則略遜於GPT-4。不過，這項測試中沒有包含剛剛更新的GPT-4 Turbo和Gemini 1.5 Pro。

值得注意的是，MMLU（本科常識）/ GSM8K （小學數學）/ HumanEval （計算機代碼）等指標上已嚴重飽和，幾乎所有的模型都表現相同。真正有區分度的爲MATH（數學問題解答能力）和GPQA（領域專家能力），後者可以體現模型在企業服務方面的能力。

據悉，Claude3 選擇了金融、法律、醫學和哲學作爲專家領域。其中，Opus的GPQA准確率達到了60%，這意味着其能力接近於同一領域且能夠上網的人類博士准確率（65%—75%）。Sonnet達40.4%；Haiku達33.3%。而GPT-4僅爲35.7%。

對此，英偉達資深AI科學家JimFan指出：我建議所有LLM的模型卡都應該效仿這種做法，這樣不同的下遊應用就能知道可以期待什么。

同時，考慮到企業客戶需要處理很多PDF、PPT、流程圖，Claude3 系列在視覺能力、准確性、長文本輸入和安全方面，均有所進步。

例如，在准確性方面，Anthropic 使用了大量復雜的事實問題來針對當前模型中已知的弱點，將答案分爲正確答案、錯誤答案（幻覺）、承認“不知道”。相應地，Claude3 可以表示自己不知道答案，而不是提供不正確的信息。除了更准確的回復，Claude 3甚至還能“引用”，指向參考材料中的精確句子來驗證他們的答案。

在定價策略上，以GPT-4 Turbo的40美元/1M tokens；GPT-3.5 Turbo的2美元/1M tokens爲對比。

最強能力Opus——90美元/1M tokens，適合最尖端的企業和機構。其接近人類的理解能力，適用於需要高度智能和復雜任務處理的場景，如企業自動化、市場分析和制定策略、復雜的數據分析和金融預測、生物醫學研究和开發等。

最高性價比Sonnet——18美元/1M tokens，適合大多數企業客戶規模化使用，消費者客戶也可以負擔。其純文本任務表現與Opus相當，更適用於數據處理、代碼生成、個性化營銷，圖文解析等中等復雜度的工作。

最快速度Haiku——1.5美元/1M tokens，適合消費者客戶使用。其具備近乎即時的響應能力，在大多數純文本任務上表現仍然相當出色，且包含多模態能力（比如視覺），適用於與用戶實時互動、內容管理、物流庫存管理、文本翻譯等工作任務。

綜合來看，Claude 3的高端线Opus比OpenAI（GPT-4 Turbo）更貴，低端线Haiku比OpenAI（GPT-3.5 Turbo）更便宜。

如此一來，成敗似乎集中在了中端线Sonnet上。如果“更少的幻覺”“更專業的領域行家”“更高的性價比” 更吸引企業客戶。那么，GPT-4 Turbo的地位將會變得不尷不尬，直到局勢被GPT-5打破。

目前，用戶可以免費體驗中等性能的Sonnet，最強版Opus僅供Claude Pro付費用戶使用（20美金/月），性能稍弱的Haiku即將推出。

PS：適道在Poe上使用同樣的提示語，讓Opus、Sonnet、GPT-4 Turbo隨機做了一段簡單的新聞翻譯。結果，Sonnet的表現居然最好，甚至翻譯出了縮寫！Opus水平巨中，而GPT-4直接忽略了主語。。。

總之，這一套組合拳下來，正如Anthropic聯合創始人Amodei兄妹所言：“Anthropic更像是一家企業公司，而不是一家消費者公司。”

目前，Claude的客戶包括科技公司Gitlab、Notion、Quora和Salesforce（Anthropic的投資者）；金融巨頭橋水公司（Bridgewater）和企業集團SAP，以及商業研究門戶網站LexisNexis、電信公司SK Telecom和丹娜法伯癌症研究所（Dana-Farber Cancer Institute）。

根據Anthropic高管Eric Pelz的一份聲明：在Claude 3的早期測試用戶中，生產力軟件制造商Asana發現初始響應時間縮短了42%；軟件公司Airtable表示，公司已將Claude 3 Sonnet集成到自己的人工智能工具中，以幫助加快內容創建和數據匯總。

可以預見的是，在Claude 3發布之後，Anthropic的to B商業化之路將更加明晰，並與OpenAI等頭部大模型公司走上不同的道路，盡管最後可能殊途同歸。

二、十字路口的大模型公司

“賺的多，花的多”是頭部大模型公司的真實寫照。事實上，Anthropic的to B之路既是自愿選擇，也是形勢所迫。

截至2023年 12 月，OpenAI的ARR 已超16 億美元，2022年的ARR則爲3000萬美元，增速高到驚人。

雖然尚無數據顯示Anthropic的2023年ARR ，但在2023年10月，Anthropic和投資人洽談時表示到2023年年底，將實現 2 億美元 ARR，每月近 1700 萬美元的營收。另外，根據 Anthropic 最新預測，到2024 年底，其 ARR 將至少達到 8.5 億美元。

確實得益於快速的收入增長，2023年Anthropic 籌集了數十億美元，估值超過 150 億美元。

但根據 Information 報道，有兩位知情人士透露，在支付客戶支持和AI 服務器成本後，2023年12月Anthropic的毛利率在50%—55%，根據Meritech Capital的數據，這遠低於雲軟件公司77%的平均毛利率。

還有一位重要股東預測，Anthropic長期毛利率將在 60%左右，且該毛利率未反映訓練 AI 模型的服務器成本，因爲這些成本是被 Anthropic 納入其研發費用中。

而根據 Sam Altman的說法，每個模型成本可高達1億美元。不過，Altman自己也笑不出來，因爲OpenAI的毛利率可能更低。畢竟 ChatGPT還有免費版，白白花掉一批服務器成本。

上述事實均表明，即便你強如OpenAI，Anthropic，但AI初創公司普遍的利潤率可能比現在的SaaS公司還低。

不過，現在問題還沒顯現，畢竟大模型在風口，投資人更關注其驚人的增速。這些AI初創公司也會以其樂觀的收入預測爲依據，按照未來一年收入的 50—100 倍的估值進行融資。

當然，只要AI創業能保持這種增長勢頭，投資人是可以忽略虧損。直到，你的收入增長掉進30%—40%。一位VC合夥人表示：到那時，如果一家公司的經營現金流爲負，並在短期內沒有將至少10% 的收入轉化爲現金流，就很難吸引新的投資人入局。

根據 Meritech Capital數據，上市軟件公司的中位數是未來收入的 6 倍。也就是說，隨着時間的推移，對於初創公司來說，維持這樣的收入倍數將越來越困難。

具體到Anthropic和OpenAI這對“大冤種”身上，兩家公司的增長和利潤率部分依賴於主要雲服務提供商。

例如，谷歌和亞馬遜向 Anthropic 投了數十億美元，並將 Anthropic 的軟件出售給其雲客戶。目前尚不清楚這些雲廠商在銷售中獲得的提成比例，但如果改成是Anthropic直接向客戶賣模型，利潤率可能會更高。

而微軟雖然用更低的利潤租給OpenAI雲服務器，但OpenAI 必須將直賣給客戶的部分收入返給微軟。而且，當微軟將OpenAI 軟件賣給自己的雲客戶時，也會抽掉大部分收入。

因此，對於上述“冤種”AI創業公司來說，想要拿到高毛利。一方面，通過更新技術，降低運行成本，就像OpenAI已經實現的；另一方面，像Anthropic“田忌賽馬”战略一樣，找准切口，聚焦企業客戶，盡可能創收，並保持高增速。

據 Forbes報道，Anthropic最近以184億美元的估值融資7.5億美元，該公司計劃在未來幾個月內增加代碼解釋、搜索功能和源代碼引用等功能。其創始人Amodei兄妹說：“我們將繼續擴大模型規模，讓它們變得更加智能，同時也繼續努力讓更小、更便宜的模型變得更智能、更高效。一整年都會有不同程度地更新。”

三、大模型公司會否下場做選手？

爲了更深入理解Anthropic的商業化路线，適道節選了一期創始人Dario Amodei訪談中的“商業化”部分，原文如下。

Dwarkesh Patel ：你認爲目前的 AI 產品是否有足夠時間在市場上獲得長期穩定收入？還是隨時可能被更先進的模型取代？或者到時候整個行業格局會變得完全不同？

Dario Amodei ：這取決於對“大規模”的定義。目前已經有幾家公司的年收入1 億—10 億美元，但能否達到每年數百億，甚至萬億級別，則難以預測。因爲這還取決於很多不確定的因素。現在有些公司正在“大規模”應用創新型 AI，但這不能代表剛开始用就一步到位，達到最佳效果。而且，即使有收入也並不完全等於創造了經濟價值，整個產業鏈的協同發展是一個長期過程。

Dwarkesh Patel ：從Anthropic角度來看，如果LLM的進步如此迅速，那么理論上公司的估值應該增長得很快？

Dario Amodei ：即使我們注重模型安全性研究而非直接商業化，在實踐中也能明顯感受到技術水平在以幾何級數上升。對那些將商業化視爲首要目標的公司來說，進步肯定比我們更快。（xswl在內涵OpenAI ）。

雖然我們承認LLM進步神速，但對比整個經濟體系的深度應用過程，技術積累依然處於較低的起點階段。決定未來走向是這二者間的競速——技術本身進步速度、被有效整合和應用，並進入實體經濟體系的速度。這二者都很可能高速發展，但結合順序和微小差異都可能導致相當不同的結果。

Dwarkesh Patel ：科技巨頭可能會在未來 2-3 年投入高達 100 億美元進行模型訓練，這會對 Anthropic 帶來什么樣的影響？

Dario Amodei ：情況1——如果因爲成本問題無法保持前沿地位，那么我們將不會繼續堅持开發最先進的模型。相反，我們會研究如何從前幾代的模型中獲取價值。

情況2——接受被制衡。我認爲這些情況的正面影響可能比它們看起來的要更大。

情況3——當模型訓練到達這種量級後，可能开始會出現新的風險，比如AI 濫用。

總結一下，雖然Dario堅信LLM的能力會得到快速且顯著的提升，但可能受制於社會因素、創新採納效率，最終減緩其被“大規模”應用的速度，無法發揮LLM的真正潛力。

據此，Anthropic的to B之路看起來也更加穩妥。一方面，利用自己的“安全性”長處，切入金融、法律、醫學等領域；另一方面，尋找偏重“技術應用”，可以長期合作的企業客戶，盡可能消除C端消費者採用的不確定性。

說到這裏，我們可以大膽預測一下，如果真如Dario預測的“社會採納速度低於模型發展速度”，那么，未來會否出現一批大模型公司親自下場做應用？尤其在國內。

原文標題 : 別跟馬斯克扯頭花了！“叛徒”Anthropic解決了困擾OpenAI的難題

標題：別跟馬斯克扯頭花了！“叛徒”Anthropic解決了困擾OpenAI的難題

地址：https://www.utechfun.com/post/342382.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤： OpenAI 人工智能馬斯克 OpenAI

上一篇:JFrog 攜手Qwak打造安全的 MLOps 工作流，加速AI應用程序批量化交付

下一篇:2024年空間計算行業研究報告

您現在的位置：首頁人工智能

別跟馬斯克扯頭花了！“叛徒”Anthropic解決了困擾OpenAI的難題

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能