導讀 上證報報導,阿裏巴巴集團的數位技術和智慧骨幹業務阿裏雲 25 日開源通義千問 140 億參數模型 Qwen-14B 及其對話模型 Qwen-14B-Chat,可免費商用。 阿裏雲副總裁、公眾與客戶溝...
上證報報導,阿裏巴巴集團的數位技術和智慧骨幹業務阿裏雲 25 日開源通義千問 140 億參數模型 Qwen-14B 及其對話模型 Qwen-14B-Chat,可免費商用。
阿裏雲副總裁、公眾與客戶溝通部總經理張啟表示,不管是閉源還是開源大模型,自研還是第三方大模型,大規模或小規模參數模型,以及通用或行業、企業專屬大模型,阿裏雲全部歡迎和支援,共同建設一個最大的大模型自由市場;希望所有大模型都能跑在阿裏雲上,跑得更快、更便宜、更安全。也因如此,阿裏雲率先開源7B、14B模型,並將持續開源開放。
據了解,大規模預訓練模型參數量大、訓練成本高,開源大模型可幫助用戶簡化模型訓練和部署過程,使得使用者不必從頭訓練模型,只需下載預訓練好的模型並進行微調,就可快速建構高品質的模型或進行相應的應用開發。目前,7B(70億)參數是開源大模型中最常見的規模,此外,較常見的開源模型尺寸還有13B(130億)、20B(200億)、70B(700億)等。
在此之前,今年8月阿裏雲開源通義千問70億參數基座模型Qwen-7B,一個多月下載量突破100萬。此次最新開源的Qwen-14B是一款支援多種語言的高性能開源模型,相較同類模型使用了更多的高品質數據,整體訓練數據超過3兆Token,使得模型具備更強大的推理、認知、規劃和記憶能力;用戶可從魔搭社區直接下載模型、體驗模型,也可透過阿裏雲靈積平台訪問和調用Qwen-14B和Qwen-14B-Chat。
(本文由 授權轉載;首圖來源:)
關鍵字: , , , ,
標題:阿裏雲開源通義千問 14B 模型,擬共建大模型市場
地址:https://www.utechfun.com/post/268282.html