作者|小葳
出品|智能進化論 公衆號:AImatters
2024年3月4日,Anthropic發布旗下最新一代大模型Claude 3系列,引發行業熱議。
在推理、數學、編碼、多語言理解和視覺方面,Claude 3在多個基准測試上樹立了新的標准,性能超越了包括GPT4在內的其他模型,被認爲是通用大模型新皇。
與此同時,亞馬遜雲科技宣布,Claude 3系列將入駐其生成式AI托管服務Amazon Bedrock。亞馬遜雲科技的客戶將可以通過Amazon Bedrock訪問Claude 3系列的三個模型——Claude 3 Opus、Claude 3 Sonnet和Claude 3 Haiku。
Claude 3對於通用大模型發展帶來哪些改變?對於更多想要用好大模型的企業,什么是更好的使用通用大模型的方式?以下是筆者的一些觀察。
圖片來自AI生成
1 衝破一家獨大,Claude3成通用大模型新“卷王”
此次推出的Claude3共有三個模型,性能和價格由低到高爲:Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,也被形象概括爲中杯、大杯、超大杯。
其中,Claude 3 Haiku 主打快速緊湊,即時的響應能力。Claude 3 Sonnet 在智能和速度之間取得了理想的平衡,特別適合企業用例。Claude 3 Opus具有深度推理、高級數學和編碼能力,在高度復雜的任務上具有領先性能。
Claude 3的領先之處體現在基准性能、視覺能力、復雜开放性問題處理能力等。
基准性能方面,Claude 3在多項AI系統常用評估標准,包括本科級別專業知識(MMLU)、研究生級別專家推理(GPQA)、基礎數學(GSM8K),均取得領先業界LLM的性能。
Claude 3的三個模型均具備視覺功能,可以理解不同格式的結構化和非結構化數據,包括圖像、圖表、圖表等。比如,官方演示視頻中,Claude 3 Opus可以在幾分鐘內分析全球經濟、未來美國GDP走勢等。
對於下圖這樣的復雜开放式問題, Claude3能夠理解物體的外觀及其與數學等概念的聯系。
此外,Claude3的三個模型都將至少支持200K token的上下文窗口。在200K token的「大海撈針」(NIAH)測試中,Claude 3 Opus准確率超過99%。Claude 3 Haiku 能夠3秒讀完10k token論文。
筆者認爲,目前大模型發展呈現兩條不同的路徑:
一條路徑,圍繞如何練好大模型。像OpenAI、Anthropic、Google這樣的科技巨頭,有能力和資源在通用基礎大模型賽道競爭。通用基礎大模型的賽道相對同質化,各家都在追求更高更快更強,即更強大更全面的性能。
而且通用大模型的競爭態勢一直是動態變化的,任何一家的領先都是暫時的,榜單隨時可能被刷新和超越。在這種態勢下,任何一家獨大,強者恆強未必對行業、對生態更好。
從這個意義上,Claude3能夠打破OpenAI長期領先的優勢,加速通用大模型卷出更高的智能水平。
另一條路徑,圍繞如何用好大模型。如何用大模型的能力解決不同行業不同場景下的專業問題,才是絕大多數企業最關注的。在這條路徑上,雲計算正發揮着舉足輕重的價值。
2 雲計算,使用基礎大模型的必經之路
目前,AI大模型已經成爲雲計算廠商的第二增長曲线,全球頭部雲計算廠商都將AI大模型作爲下一個十年發展的必爭之地。
如果我們回到企業需求的視角,企業使用基礎大模型至少有以下幾個核心訴求:
首先,數據安全與合規
數據安全合規是企業使用大模型的首要考量,包括數據泄露風險、數據濫用風險、模型安全漏洞等等。比如,很多企業擔心客戶信息、商業祕密和個人身份信息等敏感數據泄露。這些都對提供大模型能力的公有雲廠商提出了更高的要求。
在如何保障大模型安全使用方面,亞馬遜雲科技率先做出了很多探索。比如,Amazon Bedrock 處理的任何客戶內容都會被加密,並靜態存儲在客戶使用的亞馬遜雲科技區域中。客戶可以使用Amazon PrivateLink建立從Amazon Virtual Private Cloud(VPC)到Amazon Bedrock的私有連接,而無需將VPC暴露給互聯網流量。用戶輸入和模型輸出不會與任何模型提供商共享。Amazon Bedrock還提供全面的監控和日志記錄功能。
圖片來自攝圖網
其次,豐富的基礎模型選擇
沒有任何一款大模型可以滿足所有需求。
企業在使用大模型時,一定是博採衆長,多款並用的。筆者觀察到,很多企業在开發垂直領域的企業服務大模型時,底層都接入了不止一個頭部大模型。
在頭部雲廠商中,以亞馬遜雲科技爲例,豐富的基礎模型選擇也是其在大模型賽道的差異化優勢。目前,Amazon Bedrock平台的大模型提供商擴充至7家,包括AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon和Mistral AI。
“回顧2021年,當 Anthropic第一次开始在亞馬遜雲科技上構建時,沒有人能想到Claude系列模型會帶來多大的變革。自Amazon Bedrock於 2023年9月28日全面上线以來的短短幾個月內,已有超過10,000名客戶使用它,其中許多客戶正在使用Claude。”亞馬遜雲科技數據和AI副總裁Swami Sivasubramanian博士表示。
目前,已經有不少頭部企業在雲上使用Claude創建生成式AI應用。比如,全球領先的生物制藥公司輝瑞正通過Amazon Bedrock使用Claude模型,加速創新癌症治療方案的研發。通過運用生成式AI技術,輝瑞能夠大幅縮短收集相關數據和科學內容所需的時間,進而利用這些內容分析趨勢、制定腫瘤學目標並進行驗證,從而提高成功概率。
第三,易用的AI平台和工具集
雲計算廠商並非僅僅提供AI大模型的底層基礎設施和基礎模型接口,更關鍵是提供系統化的AI平台和工具集,幫助企業更好使用大模型進行創新。
比如,Amazon Bedrock推出了豐富的AI功能,包括幫助客戶識別、比較模型的模型評估功能、簡化生成式AI應用構建並利用專有數據提供定制化響應的知識庫功能、模型調優功能、能執行多步驟業務指令的代理功能、實現負責任AI的Guardrails安全功能等。
Claude3的出現,讓生成式AI領域再度風起雲湧。Claude3不僅刷新了基礎大模型的性能,也打破了長期以來通用大模型領域一家獨大的市場格局。
同時,亞馬遜雲科技與Anthropic的強強聯合,不僅能讓更多企業在雲上便捷使用更新更強大的通用大模型,也代表了企業首選在公有雲上使用大模型能力和生成式AI的發展趨勢。
參考資料:
The Claude 3 Model Family: Opus, Sonnet, Haiku
https://www-cdn.anthropic.com/de8ba9b01c9ab7cbabf5c33b80b7bbc618857627/Model_Card_Claude_3.pdf
原文標題 : 大模型新皇Claude 3即將入駐Amazon Bedrock,公有雲成AI創新加速器
標題:大模型新皇Claude 3即將入駐Amazon Bedrock,公有雲成AI創新加速器
地址:https://www.utechfun.com/post/344223.html