近 10 年來,Google 宣稱一直是 AI 優先的公司。當 ChatGPT 開啟 AI 時代經過一年後,Google 藉由全新 Gemini 模型大步向前,期望能超越 OpenAI 及其 GPT-4 模型。
Google I/O 2023 開發者大會即預告的 Gemini 模型,並未等到 2024 年第一季才現身,6 日由 Google 執行長皮蔡(Sundar Pichai)和 Google DeepMind 執行長哈薩比斯(Demis Hassabis)向世人介紹 Google 目前最強大、最通用的模型,第一版 Gemini 1.0 能夠理解和操作包括文字、圖像、音訊、視訊、程式碼在內不同類型資訊。
Gemini 原生設計成多模態模型,一開始就在不同模態上預訓練,接著透過額外的多模態資料進行微調、提升效能。Gemini 1.0 所受的訓練是同時辨識和理解文字、圖像、音訊等不同資訊,並回答涉及複雜主題的問題,這也讓 Gemini 在解釋、推理如數學和物理這樣複雜的問題時表現出色。
不只如此,Gemini 1.0 能夠理解和解釋世界上常用的程式語言如 Python、Java、C++ 和 Go,並且產生高品質的程式碼。值得一提的是,Google DeepMind 2 年前推出 AI 程式碼生成系統 AlphaCode,現在透過一個專門版本的 Gemini,建立更進階的 AlphaCode 2,不僅擅長程式設計,還能處理與數學、理論電腦科學相關的競技程式設計問題。
Google DeepMind 團隊使用 Google 自行研發、用於加速機器學習的 TPU(Tensor Processing Unit)v4 和 ,有規模地訓練 Gemini 1.0。依照模型大小有 Ultra、Pro、Nano 三種,其中 Gemini Ultra 為規模最大、功能最強大的模型,專為高度複雜任務所設計,Gemini Nano 則是處理裝置上任務最有效率的模型。
▲ 隨著 Gemini 問世,Google 也公開全新 ,幫助加速 Gemini 發展。
Google DeepMind 團隊不斷對 Gemini 模型進行嚴格測試,從理解自然圖像、音訊、視訊再到數學推理,其中發現 Gemini Ultra 在大型語言模型研究和開發廣泛採用的 32 項學術基準測試中,有 30 個取得領先成績。其中 Gemini Ultra 以 90% 的高得分成為第一個在 MMLU(massive multitask language understanding,大規模多任務語言理解)測試裡超越人類專家的模型,而在新的 MMMU 基準測試裡也得到 59.4% 領先分數,兩項測試皆超越 OpenAI 所開發的 GPT-4 模型。
▲ Gemini Ultra 在 MMLU 測試獲得 90% 高分,超越 GPT-4。
截至目前 Google 所有 AI 模型中,Gemini 在偏誤、資料毒性(toxicity)等方面都接受最全面的安全性評估。在網路攻擊、說服能力、自主性等可能存在風險的領域,Google DeepMind 團隊都進行最新研究,也運用 Google Research 的對抗測試技巧,在部署 Gemini 前率先找出關鍵的安全問題。
Google 將在多項產品中導入 Gemini,包括軟體方面的 、以及有關硬體的 。從 12 月 13 日起,開發者和企業客戶可以透過 Google AI Studio 或 Google Cloud Vertex AI 的 Gemini API 使用 Gemini Pro。Android 開發者也能透過 AICore,在開發作業中運用 Gemini Nano。
Seeing some qs on what Gemini *is* (beyond the zodiac :). Best way to understand Gemini’s underlying amazing capabilities is to see them in action, take a look ⬇️
— Sundar Pichai (@sundarpichai)
▲ Google 測試讓多模態的 Gemini 看一系列影像,並推理出所看到的內容。
在 ChatGPT 推出後 Google 內部發出「紅色警戒」(code red),那時起被認為在 AI 競賽急起直追。Gemini 可說是 Google 多年來一直苦心建立的模型,也被外界視為能一舉挑戰 OpenAI 的關鍵利器,我們將在越來越多 Google 產品看見 Gemini 身影,及其驅動的強大功能。
(圖片來源:)
延伸閱讀:
標題:挑戰 OpenAI 關鍵利器終現身!Google 發表 Gemini 模型,Bard、Pixel 8 Pro 率先導入
地址:https://www.utechfun.com/post/300486.html