Mistral AI 發表 Mistral Large 2 模型,程式碼和數學能力勝 Llama 3.1

2024-07-25 18:44:00    編輯: 陳 冠榮
導讀 繼上週攜手 NVIDIA 18 日推出新模型 Mistral NeMo,Mistral AI 24 日發表全新旗艦模型 Mistral Large 2,宣稱在程式碼編寫、數學及推理方面與 OpenA...


繼上週攜手 NVIDIA 18 日推出新模型 Mistral NeMo,Mistral AI 24 日發表全新旗艦模型 Mistral Large 2,宣稱在程式碼編寫、數學及推理方面與 OpenAI、Meta 的最新模型不相上下。

Mistral Large 2 是一款先進的大型語言模型,支援 128K token 上下文長度,以及數十種語言,包括英語、法語、德語、西班牙語、義大利語、中文、日語、韓語、葡萄牙語、荷蘭語、波蘭語、阿拉伯語及印地語等。

Mistral Large 2 精通程式碼編寫,經過超過 80 種程式設計語言的訓練,如 Python、Java、C、C++、JavaScript、Bash、Swift 及 Fortran。它擁有一流的代理能力,可以原生呼叫函數和輸出 JSON,進而實現與外部系統、API 及工具之間無縫交流。此外,Mistral Large 2 擁有先進的推理和數學能力,可成為解決複雜邏輯和計算難題的強大工具。

Mistral AI 投入大量努力來強化模型推理能力,訓練關鍵在於讓模型盡量減少產生「幻覺」,或看上去可信但實際上不正確或不相關的資訊,這是透過微調模型來達成,使模型在回應更加謹慎和明智,確保其提供可靠和準確的輸出。此外,Mistral Large 2 會在找不到解答或沒有足夠的資訊來提供自信答案時承認這一點。

值得一提的是,Mistral Large 2 的發表比起 Meta 新款模型 Llama 3.1 405B 晚了一天。不僅沒讓 Meta 搶走鋒頭,Mistral Large 2 在程式碼編寫和數學性能方面似乎超越 Llama 3.1 405B,而且其 1,230 億參數量不到 Llama 3.1 405B 的三分之一。

Mistral Large 2 已能在 Google Vertex AI、Amazon Bedrock、Microsoft Azure AI Studio 及 IBM watsonx.ai 上取用,開發者也可在 Mistral AI 的 le Plateforme 上使用名為「mistral-large-2407」新模型。

(首圖來源:)

延伸閱讀:

文章看完覺得有幫助,何不給我們一個鼓勵

想請我們喝幾杯咖啡?

每杯咖啡 65 元

x 1
x 3
x 5
x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0


關鍵字: , ,


標題:Mistral AI 發表 Mistral Large 2 模型,程式碼和數學能力勝 Llama 3.1

地址:https://www.utechfun.com/post/402136.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡