Gemini 是 Google DeepMind 團隊緊鑼密鼓開發的下一代 AI 模型,據悉是 Google 第一個能夠處理文字、圖片、影片等不同資料形式的多模態模型,預期今年稍晚發表,最快將在秋季揭曉。半導體研究和顧問公司 SemiAnalysis 日前發表文章,認為 Gemini 模型似乎準備好運用強大的算力,來與 OpenAI 的 GPT-4 模型一較高下。
面對 ChatGPT 及其背後的 GPT 系列模型掀起全球 AI 巨浪,Google 這個沉睡的巨人終於醒過來,正以一定的速度加緊產品迭代,SemiAnalysis 稱 Google 今年底預訓練模型的每秒浮點運算次數(FLOPS)可望有超越 GPT-4 五倍的表現,且到明年底之前,AI 產品藍圖將會越來越清晰。
SemiAnalysis 甚至提出一套「GPU-Rich」和「GPU-Poor」的論點,引起業界人士的激烈爭論。
擁有強大的 AI 算力通常意味著掌握許多高階運算晶片,世界上僅少數公司擁有超過 2 萬個 NVIDIA A100 / H100 GPU,包括 OpenAI、Google、Anthropic、Inflection、X、Meta,其研究人員手上的專案能夠使用約莫 100 個至 1,000 個 GPU,相較其他公司擁有更多的運算資源,這幾家公司就是 SemiAnalysis 所稱的「GPU-Rich」,尤其點名 Google 擁有許多 GPU 和龐大算力,有助於推動 Gemini 模型。
另一方面,有些新創公司和開源研究人員正努力使用更少的 GPU 開發 AI 產品,SemiAnalysis 認為他們花費大量時間和精力試圖做一些根本無關緊要的事,比方說,許多研究人員花了無數個小時微調沒有足夠 VRAM 的模型。使用 GPU 的效率相當重要,這些「GPU-Poor」卻忽略這一點。
如今美國、中國在全球 AI 競賽可望持續領先,許多中東國家正在擴大投資基礎設施,為發展 AI 急起直追。相較之下,SemiAnalysis 認為歐洲新創公司和政府支持的超級電腦計畫較無競爭力,因為對算力缺乏大規模投資,選擇當個「GPU-Poor」,還點名幾家 AI 公司如 Hugging Face、Databricks、Together 也是「GPU-Poor」的一分子,儘管他們擁有世界一流的研究人員,仍受限於系統算力。
SemiAnalysis 的論點加上吹捧 Gemini 模型,讓 OpenAI 執行長奧特曼(Sam Altman)很不是滋味,甚至發推嘲諷「Google 竟讓 SemiAnalysis 發布他們內部行銷/招聘圖表」。SemiAnalysis 則以迷因圖反擊,稱相關資料是從 Google 供應商取得的。
incredible google got that semianalysis guy to publish their internal marketing/recruiting chart lol
— Sam Altman (@sama)
ChatGPT 一炮而紅,用戶心目中佔有一席之地,其他公司也紛紛加入大型語言模型的競爭,像是 Meta 的 Llama 2 模型。Google 的 Gemini 模型則來勢洶洶,急欲挑戰 OpenAI 主導的地位,2023 年末的 AI 大戰將為未來發展產生長遠影響。可以肯定的是,大型語言模型推動的 AI 服務,將以各種方式越來越融入生活、工作當中,未來帶來便利、效率。
(首圖來源:截圖)
延伸閱讀:
標題:Google Gemini 新模型來勢洶洶,研調稱遠勝 GPT-4
地址:https://www.utechfun.com/post/257533.html