Mistral AI 發表 Mistral Large 2 模型，程式碼和數學能力勝 Llama 3.1

2024-07-25 18:44:00 編輯：陳冠榮

導讀繼上週攜手 NVIDIA 18 日推出新模型 Mistral NeMo，Mistral AI 24 日發表全新旗艦模型 Mistral Large 2，宣稱在程式碼編寫、數學及推理方面與 OpenA...

繼上週攜手 NVIDIA 18 日推出新模型 Mistral NeMo，Mistral AI 24 日發表全新旗艦模型 Mistral Large 2，宣稱在程式碼編寫、數學及推理方面與 OpenAI、Meta 的最新模型不相上下。

Mistral Large 2 是一款先進的大型語言模型，支援 128K token 上下文長度，以及數十種語言，包括英語、法語、德語、西班牙語、義大利語、中文、日語、韓語、葡萄牙語、荷蘭語、波蘭語、阿拉伯語及印地語等。

Mistral Large 2 精通程式碼編寫，經過超過 80 種程式設計語言的訓練，如 Python、Java、C、C++、JavaScript、Bash、Swift 及 Fortran。它擁有一流的代理能力，可以原生呼叫函數和輸出 JSON，進而實現與外部系統、API 及工具之間無縫交流。此外，Mistral Large 2 擁有先進的推理和數學能力，可成為解決複雜邏輯和計算難題的強大工具。

Mistral AI 投入大量努力來強化模型推理能力，訓練關鍵在於讓模型盡量減少產生「幻覺」，或看上去可信但實際上不正確或不相關的資訊，這是透過微調模型來達成，使模型在回應更加謹慎和明智，確保其提供可靠和準確的輸出。此外，Mistral Large 2 會在找不到解答或沒有足夠的資訊來提供自信答案時承認這一點。

值得一提的是，Mistral Large 2 的發表比起 Meta 新款模型 Llama 3.1 405B 晚了一天。不僅沒讓 Meta 搶走鋒頭，Mistral Large 2 在程式碼編寫和數學性能方面似乎超越 Llama 3.1 405B，而且其 1,230 億參數量不到 Llama 3.1 405B 的三分之一。

Mistral Large 2 已能在 Google Vertex AI、Amazon Bedrock、Microsoft Azure AI Studio 及 IBM watsonx.ai 上取用，開發者也可在 Mistral AI 的 le Plateforme 上使用名為「mistral-large-2407」新模型。

（首圖來源：）

延伸閱讀：

文章看完覺得有幫助，何不給我們一個鼓勵

想請我們喝幾杯咖啡？

每杯咖啡 65 元

x 1

x 3

x 5

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0 元

留給我們的話

關鍵字: , ,

標題：Mistral AI 發表 Mistral Large 2 模型，程式碼和數學能力勝 Llama 3.1

地址：https://www.utechfun.com/post/402136.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：

上一篇:爲什么網絡可擴展性很重要？

下一篇:美國那斯達克、日股、韓股大跌！中信：台股颱風假後「山雨欲來」

您現在的位置：首頁人工智能