大模型價格战繼續!
9月19日,阿裏巴巴2024雲棲大會开幕,發布了一系列重磅的產品。同時,阿裏巴巴官方微信平台今日也發布消息,宣布阿裏雲百煉平台上的三款通義千問主力模型再次降價。其中,Qwen-Turbo的價格低至每百萬輸入tokens0.3元,較之前直降85%,Qwen-Plus和Qwen-Max的輸入價格則分別降價80%和50%。
值得注意的是,Qwen-Plus推理能力與GPT4相比不分伯仲,可以應用於處理復雜任務。降價以後,Qwen-Plus在效果、速度及成本均衡上將更具性價比,同等規模較行業的價格低84%。除此以外,阿裏雲百煉平台還爲所有新用戶免費贈送超5000萬tokens及4500張圖片生成額度。
在三款主力大模型降價的同時,阿裏通義千問還升級了旗艦模型Qwen-Max。據介紹,Qwen-Max性能接近GPT-4o,且通義官網和通義APP的後台模型均已切換爲Qwen-Max,繼續免費爲所有用戶提供服務,用戶也可通過阿裏雲百煉平台調用Qwen-Max的API。自去年4月發布初代通義千問大模型,全新升級的Qwen-Max在理解、數學、代碼、幻覺抵御、指令遵循等方面的能力分別提升46%、75%、102%、35%和105%,模型與人類偏好的對齊水平更是提升了700%以上。
與以百度文心一言爲代表的閉源大模型相比,阿裏通義千問大模型以开源爲特色。據介紹,截至2024年9月中旬,通義千問开源模型累計下載量已突破4000萬,已經成爲僅次於Meta的Llama开源模型的世界級模型群。阿裏雲CTO周靖人發布通義千問新一代开源模型Qwen2.5時介紹,旗艦模型Qwen2.5-72B性能超越Llama405B,繼續穩居“最強开源大模型”位置。
爲了吸引更多的企業用戶,降低大模型使用門檻,今年5月,國內大模型掀起了降價潮。5月21日,阿裏雲發布降價公告,將旗下通義千問的多款商業化及开源模型進行大幅降價。其中,對標GPT-4的商業化模型Qwen-Long的API(應用程序編程接口)輸入價格從0.02元/千tokens降至0.0005元/千tokens,直降97%;輸出價格從0.02元/千tokens降至0.002元/千tokens,直降90%。隨後百度也迅速跟進,宣布兩款主力模型ENIRESpeed、ENIRELite將全面免費。
阿裏通義大模型本輪的繼續降價,表明大模型價格战仍然打得火熱。阿裏巴巴集團CEO、阿裏雲智能集團董事長兼CEO吳泳銘在2024雲棲大會上發表主題演講時指出,過去22個月,AI發展的速度超過任何歷史時期,大模型技術快速迭代,已經具備了文本、語音、視覺的多模態能力,能夠开始完成復雜指令。
他進一步表示,模型的推理成本呈指數級下降,已經遠遠超過摩爾定律。“一年來,通義千問API在阿裏雲百煉上的調用價格下降了97%,百萬tokens調用花費最低已經降到了5毛錢。推理成本是應用爆發的關鍵問題,阿裏雲會努力把成本繼續降下去。”吳泳銘說。
華福證券研報亦表示,定價的持續走低有望帶來更快的商業化落地,進而會衍生出更多的微調及推理等需求,將逐步盤活國內AI應用及國產算力發展。華創證券研報認爲,整體來看,降低成本是推動大模型快進到“價值創造階段”的關鍵要素,更低的成本價格才能真正滿足企業的復雜業務場景需求,充分驗證大模型的應用價值。
來源:證券時報
責編:劉珺宇
海量資訊、精准解讀,盡在新浪財經APP標題:卷瘋了!阿裏宣布:降價85%!
地址:https://www.utechfun.com/post/423602.html