谷歌Gemini被曝誇大營銷？碾壓GPT4純靠“一張嘴”

2023-12-09 18:40:05 編輯： robot

導讀作者：文子 Gemini對谷歌來說可能走了一大步，但對整個AI領域而言，並沒有說的那么誇張。涉嫌虛假宣傳，交互非實時感知才短短一天時間，谷歌Gemini就被曝涉嫌造假，誇大宣傳。作爲谷歌用來應...

作者：文子

Gemini對谷歌來說可能走了一大步，但對整個AI領域而言，並沒有說的那么誇張。

涉嫌虛假宣傳，交互非實時感知

才短短一天時間，谷歌Gemini就被曝涉嫌造假，誇大宣傳。

作爲谷歌用來應對GPT-4的“殺手鐗”，Gemini一經亮相就有了兩個碩大的標籤：超過人類專家，碾壓GPT-4。隨便單拎一條出來，都是目前其他大模型所不能比擬的成績。

但也有越來越多的人开始質疑它的真實性，彭博社的Parmy Olsen就是第一個質疑視頻造假的人。

就在大家震驚於谷歌發布的6分鐘互動視頻裏，他指出，Gemini所有交互都不是實時感知的，存在後期制作和剪輯配音的成分。隨後這一說法也得到了谷歌官方的證實，承認Gemini的確使用了靜態圖片和多段提示詞拼湊，才能達成這樣的效果。

簡單來說就是，Gemini不能直接看懂一段動作視頻，只能看懂多張圖片。像演示視頻裏人類在玩石頭剪刀布，實際上是把“布”“拳頭”“剪刀”三張照片依次傳給Gemini，然後加上良好的提示詞，才能讓Gemini給出回答，然後再由員工配音念出來。

而且視頻中展示的許多其他功能並不是谷歌獨有的，GPT Plus3也可以做得到，沃頓商學院教授伊森·莫裏克（Ethan Mollick）就用實驗證實了這一點。

雖然從技術原理上來看，能夠讀取圖片和能夠看懂視頻之間，並沒有技術上的鴻溝。但是從產品實現落地的角度看，把讀取圖片約等於能實時看懂視頻，過於強調實時性而壓縮了交互過程中的延遲，這幾乎已經可以理解爲虛假宣傳。而是否需要良好的提示詞工程，更是評價模型能力的關鍵問題。

混淆跑分，GPT4測試標准不一致

從谷歌對Gemini的宣傳信息來看，它聲稱Gemini在32項標准性能指標中，有30 項指標都優於GPT-4，跑出90%的高分，超過GPT-4。但實際上，差距微乎其微，而且這種比較並不公平。

Gemini Ultra的90%得分是基於谷歌研究人員开發的一種基於32個樣本的思維鏈的方法。對於同一個問題，Gemini Ultra會生成32個答案以及這些答案的推理。然後，模型會選擇最常見的答案作爲最終答案。

但GPT-4的86.4%分數是基於行業評估標准5-shot。HuggingFace技術主管Philipp Schmid特意從Gemini的技術報告中提取數據重做計算，在5-shot的標准下，Gemini的得分實爲83.7%，比GPT-4更低。

也就是說只有CoT（思維鏈）達到32個例子時，Gemini Ultra才能達到90分超過GPT-4；當例子數量減少到5個，Gemini Ultra得分就不如GPT-4。難怪連谷歌公司高管在之前都回避了關於該模型比GPT-4 強多少的問題，因爲它們只是“強”在了不同的標准上。

就像谷歌在5月份發布Palm-2的時候，也挑出了兩個優於GPT-4的指標，但是後來這個大模型怎么樣，大家都清楚。

斯坦福大學基礎模型研究中心主任 Percy Liang也談到，雖然Gemini有很好的基准分數，但由於不知道訓練數據的內容，因此很難解釋這些數據。華盛頓大學計算語言學教授 Emily Bender也指出，谷歌宣傳Gemini是一台萬能機器，是一個可用於多種不同用途的通用模型。但是谷歌卻在使用狹隘的基准，來評估它期望用於這些不同用途的模型，這意味着它實際上無法得到徹底評估。

倉促上陣，只爲趁OpenAI動蕩搞事？

今年3月，OpenAI發布GPT人工智能模型，並推出其支持的付費聊天AI機器人ChatGPT，這其實對谷歌來說壓力很大。

畢竟谷歌已經耗費了數年心血，在人工智能領域投入巨資研究，卻沒想到被半路殺出來的OpenAI彎道超車。

所以在4月，谷歌迫於投資方的巨大壓力，將負責人工智能研究的Google Brain，與母公司Alphabet位於倫敦的人工智能研究實驗室DeepMind合並，爲了在今年接下來的時間裏研發Gemini模型來回應GPT-4的挑战。

而在兩周前，OpenAI剛剛重新任命了奧特曼爲首席執行官，並任命了新的董事會成員，勉強給這家初創公司的一段動蕩期畫上了句號。這場內鬥事件也促使一些客戶开始評估其他AI提供商，谷歌選擇在這個時間點推出Gemini的心思不言而喻。

據報道，當OpenAI董事會暫時罷免首席執行官奧特曼，使公司的未來發展受到質疑時，谷歌迅速發起了一場營銷活動，說服OpenAI企業客戶轉向谷歌。現在，隨着Gemini的發布，谷歌也正是在利用這種不確定性。

然而，目前大多數人還是不能完整地體驗Gemini。最強大的對標GPT-4的滿血版Gemini Ultra，還需要等待幾個月才能和公衆見面。據谷歌高管的說法，預計將於明年初上市。而現在推出的版本是爲谷歌基於文本的搜索聊天機器人Bard的後台，爲其提供更高級的推理、規劃和理解能力。

在接下來的幾個月裏，新的Gemini增強版Bard會在170多個國家提供英語版本的首發，不包括歐盟和英國。谷歌負責Bard的副總裁Sissie Hsiao表示，這是因爲公司需要與當地監管機構“接軌”。除此之外，Gemini還有一個名爲Nano的版本，可以直接在設備上運行的，例如谷歌的新款Pixel手機。

谷歌VS OpenAI：瑜亮之爭鹿死誰手？

12月7日，隨着Gemini的高調發布，谷歌市值一晚就增加逾870億美元，增量相當於OpenAI的最新估值。就目前來說，未上市的OpenAI估值在800億至900億美元之間。

要知道，今年以來谷歌的股價已經上漲了逾50%，大幅跑贏了納斯達克綜合指數，但卻落後於一些科技同行，裏面就包括OpenAI最大的投資方微軟。

事實上，谷歌在過去的發展歷史中已經喫過很多次苦頭，推出有缺陷的產品。這對公司發展來說，適得其反。就像今年2月爲了應對ChatGPT急急忙忙推出的Bard，因爲一次小小失誤就導致股價蒸發了高達1000億美元。

哪怕是5月，谷歌宣布在大部分產品中植入生成型人工智能，比如谷歌郵箱和其他軟件，試圖用這個舉動改變市場的看法，但效果卻微乎其微。這也讓谷歌深刻認識到，推出有缺陷的產品帶來的反噬。

但在科技行業，只要足夠強大就足以搶佔市場。早期的手機霸主諾基亞和黑莓就經歷過慘痛教訓，蘋果用功能更強大、更直觀的iPhone搶走了它們的市場。在軟件領域，商業上的成功往往來自於性能最好的系統。

幾乎可以肯定的是，隨着Gemini的發布，谷歌或許有望逐漸扭轉那些不利的局面。摩根大通分析師就表示，“谷歌开始通過結合 Gemini的不同模型版本，來解決投資者對生成式人工智能創新和GenAI模型運行成本過高的擔憂。”

不過如果Gemini Ultra真如谷歌所說那樣在明年1月初發布，那么在頂級人工智能模型的頭部就呆不了太久時間。畢竟在谷歌努力追趕OpenAI的過程中，後者有將近一年的時間來开發新一代人工智能模型GPT-5。

但有一點不能否認，谷歌和OpenAI的這場對決，已是箭在弦上。

原文標題 : 新火種AI|谷歌Gemini被曝誇大營銷？碾壓GPT4純靠“一張嘴”

標題：谷歌Gemini被曝誇大營銷？碾壓GPT4純靠“一張嘴”

地址：https://www.utechfun.com/post/301706.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：新火種 AI 大模型 Gemini

上一篇:【手慢無】七彩虹RTX 4070 Ti顯卡6499元入手

下一篇:哪吒L實車曝光！定位大五座SUV，軸距超2.8米，純電+增程動力

您現在的位置：首頁人工智能

谷歌Gemini被曝誇大營銷？碾壓GPT4純靠“一張嘴”

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能