Google 加緊開發第一個從頭即採多模態(multimodal)的 Gemini 模型,在不同大小模型下都能提供絕佳性能,並有效率地整合其他工具、API,成為 ChatGPT 及其背後模型最具代表性的挑戰者。
國外媒體 The Information 引述知情人士的消息指出,Google 的代表稍早告訴一些雲端客戶和業務合作夥伴,原本預定 11 月之前可使用的全新 Gemini 模型,要延到明年第一季才能實現。
據悉 Gemini 是 Google 第一個能夠處理文字以及圖片、影片等不同資料形式的多模態模型,換句話說,它不僅能以對話方式理解、產生文字內容,對於圖片和影片的內容輸入也能加以處理,這點與 ChatGPT 有所不同。
The Information 先前報導也指出,訓練 Gemini 的 token 量相當於 GPT-4 的兩倍,可使它的內容處理和反應更顯睿智。此外,甚至有研究機構稱,Gemini 每秒浮點運算次數(FLOPS)可望有超越 GPT-4 五倍的表現,帶來強大算力。
Gemini 可望取代目前的 PaLM 2,支援對話式人工智慧 Bard 以及 Google 文件、試算表、簡報、Meet 等企業應用程式的 Duet AI。
這次 Gemini 延後上線對 Google 來說不是時候,雲端業務成長未如市場預期,而競爭對手微軟的成長卻是加速進行。與此同時,微軟投資的 OpenAI 持續強化技術和產品,例如首場開發者大會宣布 GPT-4、GPT-3.5 多項改進,並新推出「GPT」等產品,雖然發生令外界譁然的公司經營問題,但微軟仍掌握關鍵人才和技術,仍以大型語言模型繼續推動各項 AI 服務。
(首圖來源:截圖)
延伸閱讀:
標題:對決 OpenAI 關鍵利器,Google Gemini 模型恐延至明年第一季現身
地址:https://www.utechfun.com/post/294077.html