GPT-4o重磅發布,但AI已經進入泡沫前期

2024-05-21 18:40:18    編輯: robot
導讀 GPT-4o很強,但沒到顛覆世界的程度 前段時間OpenAI發布了GPT-4o(“o”代表“omni”)。簡單來說它可以實現文本、音頻和圖像的任意組合作爲輸入,並生成文本、音頻和圖像輸出的任意組合。...

GPT-4o很強,但沒到顛覆世界的程度

前段時間OpenAI發布了GPT-4o(“o”代表“omni”)。簡單來說它可以實現文本、音頻和圖像的任意組合作爲輸入,並生成文本、音頻和圖像輸出的任意組合。且有諸多驚豔應用。

GPT-4o 的主要升級點在於打通任何文本、音頻和圖像的輸入,相互之間可以直接生成,無需中間轉換;此外 GPT-4o 語音延遲大幅降低,能在 232 毫秒內回應音頻輸入,平均爲 320 毫秒,這與對話中人類的響應時間相似。

GPT-4o 不僅能通過視覺 AI 能力理解攝像頭中發生的事情,同時還能夠將理解的內容通過語音與舊版本 ChatGPT 交互,進行更加豐富有趣的互動。同時還支持中途打斷和對話插入,且具備上下文記憶能力。

而且 GPT-4o 對廣大用戶來說它有個遠超 GPT-4 的優點:免費。體驗 GPT-4 級別的智能、從模型和網絡獲取響應、分析數據並創建圖表、聊一聊你拍的照片、上傳文件以獲取摘要、寫作或分析幫助、使用 GPTs 和 GPT Store、通過 Memory 構建更加有幫助的體驗,這些功能全部可以免費獲得。要知道 GPT-4 Plus 版本就因爲收費貴、付款麻煩,使用門檻高讓絕大部分人望而卻步,能讓更多的人用上便是 GPT-4o 的最大亮點。

但是現在能用上GPT-4o只有GPT-4 Plus版本,其他版本需要後續开放而且免費的GPT-4o次數有限,過了次數會直接轉爲GPT-3.5。

有業內人士認爲,特別是在預告中 OpenAI 公司的 CEO Altman 甚至用上了 " 魔法 " 二字,相比之下 GPT-4 的神通廣大、Sora 那種神筆馬良的既視感,GPT-4o 顯然稱不上魔法。而且從多模態能力方面考察,GPT-4o 的能力並沒有比上代有明顯提升。哪怕是和 GPT 的老對手 Anthropic 的 Claude 3 相比也沒有拉开差距,可以說從模型能力來看 GPT-4o 和 GPT-4 沒有本質區別。

所以GPT-4o的發布更多像是一種搶跑,展現一種領先的姿態,也是維持熱度刺激購买需求的一種方式。

有意思的是,就在GPT-4o發布24小時之後,谷歌也緊跟着發布產品頗有對陣叫板的意味。谷歌CEO桑達爾·皮查伊發布數十款Google和AI 結合產品,堪稱“全家桶”級別,全面圍剿Open AI。其中包括支持200萬token長文本的Gemini 1.5 Pro和 Gemini 1.5 Flash,對標Sora的Veo,开源模型Gemma 2,支持生成式搜索的AI Overviews、第六代TPU等。

谷歌CEO桑達爾·皮查伊

整場开發者大會最大的看點爲,谷歌推出的AI語音助手——Astra,它能夠通過攝像頭識別物體、代碼和各種東西。現場演示視頻中,用戶要求Astra在看到發出聲音的東西時告訴她,助手回答說,它可以看到一個發出聲音的揚聲器。對於一閃而過的蘋果,Astra居然也能夠准確回答出在眼鏡旁邊。除Astra外,谷歌還推出基於Gemini的多款通用AI Agent子系列產品。如音頻的NotebookLM、音樂的Music AI Sandbox、視頻的Veo、圖像的Imagen 3,直接對標OpenAI發布的GPT-4o、Dall-E和Sora。

但問題也跟OpenAI類似,目前還不足以讓开發者構建更加原生和殺手級應用,從推理能力到多模態能力都是如此。兩家更像是你追我趕的算術級競爭,誰也沒有拉开太多,自然就很難貢獻震驚世界的應用。

也難怪馬斯克在看過發布會後表示,GPT-4o的演示讓他感到“不適、尷尬”。Andrej Karpathy大佬也用十分平靜的語氣給出技術總結,得到了馬斯克的附議:他們發布的是一個在同一神經網絡中結合文本-音頻-視頻三種模態並同時處理的模型,僅此而已。

大模型也要“精打細算”

去年生成式AI與大語言模型這一撥科技熱潮在去年席卷了全球科技圈。無論是科技巨頭還是新興獨角獸,都在爭先恐後研發規模更大、性能更強的模型,進而引發了圍繞AI芯片的軍備競賽,並讓身爲AI軍火商的英偉達比前一年多賺了340億美元。

但今年的情況已經顯然沒有那么樂觀,務實謹慎的風格傳遍了科技圈。科技媒體The Information報道稱,「包括微軟、亞馬遜和Google在內的雲廠商和其他銷售該技術(指生成式AI)的公司,正在降低自己的預期」。一些人已經在擔憂生成式AI吹出來的泡泡會不會已經太大了,它是未來,但可能不是現在,就像互聯網如今已經是一門萬億美元級別的生意,但並不妨礙千禧年時吹出的互聯網泡泡的爆炸結局。

關於OpenAI公司去年的營收,目前有兩種說法,The Information稱其2023年最後一個月的年化收入是16億美元,而《金融時報》給出的數字是20億美元。這個收入水平在AI行業絕對是第一梯隊,但是跟微軟每年提供給OpenAI公司不低於10億美元的費用相比,仍然不算多,更何況Sam Altman雄心勃勃計劃7萬億美元自建芯片工廠打造軟硬一體呢?或許上市能解決OpenAI的投資難題,但是作爲非營利性組織的OpenAI轉爲正常的私人盈利公司尚存在諸多問題,短期來看並不現實。

一大批剛剛在2023年晉升爲獨角獸的美國生成式AI公司,已經落入理想難以兌現的窘境。曾經在AI獨角獸上排名前3的初創公司Inflection兩位聯合創始人跳槽微軟,因爲挖走了Inflection大部分員工,包括其創始人,微軟同意向Inflection支付約6.5億美元,以獲得其模型授權,並補償Inflection的投資人。

排名僅次於Inflection的另一家AI獨角獸Cohere也被傳出融資困境。這家公司自去年12月就开始尋求以60億美元估值融資5億美元,迄今沒有確定交易,而它上一輪融資還停留在去年6月。按照大模型的燒錢速度,這些無法自我造血的獨角獸原本每半年甚至每個季度都要有新的融資才能爲繼。

更爲尷尬的是這些公司並沒有明顯推出強於GPT-4的大模型,雖然宣傳上都是“各種領先”但實際體驗下來差距不小。而且這些公司基本不具備盈利能力,成爲資本棄兒,缺少後續輸血也就不難理解了。

金沙江主管合夥人朱嘯虎認爲,大模型是很差的商業模式。問題是技術沒有差異點,而且每一代技術比如3.5可能就要幾千萬美金,4.0可能要幾億美金,5.0可能要幾十億美金,每一代模型你都要重新去砸錢,而且你變現周期可能就兩三年,這比發電廠還要差。

 

比如發電廠,在投了基建以後,基本上不需要再投入很多錢,但大模型是要每兩三年就要砸更多的錢去升級,而且變現的周期可能就兩三年。說實話這個商業模式是非常差的商業模式。

所以不管國內外AI投資都已經進入了要認真考慮成本收益的階段,如果AI已經進入終局那么行業第二第三將變得價值極低,現階段OpenAI領導者的地位仍然牢不可破,對於初創公司來說可能隨時在“死亡邊緣”。

去年的“宮鬥”仍沒有結束

去年 11 月,Ilya 與另外三名董事會成員一道,迫使該公司高調的首席執行官 Sam Altman 辭職,但後來他表示後悔。據報道,雙方爭論的焦點是對 OpenAI 方向的分歧:Ilya 對 Altman 以犧牲安全工作爲代價而急於推出人工智能產品感到沮喪。Altman 在被趕下台的五天後就回到了 OpenAI,重申了自己的控制權,並繼續推動越來越強大的技術,這讓他的一些批評者感到擔憂。Ilya 仍然是 OpenAI 的員工,但他再也沒有回去工作。

Sam Altman(左)Ilya Sutskever(右)

今年5月17日,在公司聯合創始人兼首席科學家伊利亞·蘇茨克沃(Ilya Sutskever)周二宣布離職後幾個小時,其超級對齊團隊負責人之一詹·萊克(Jan Leike)也在社交平台X上發帖宣布辭職。

OpenAI超級對齊負責人Jan Leike,自曝離職的真正原因,以及更多內幕。一來算力不夠用,承諾給超級對齊團隊的20%缺斤少兩,導致團隊逆流而行,但也越來越困難。二來安全不重視,對AGI的安全治理問題,優先級不如推出“閃亮的產品”。

Jan Leike

這裏先解釋一下“對齊”是什么意思,由於GPT大模型的生成是黑盒機制產生內容是隨機可控性弱的,難免產生不符合人類價值觀的東西。所以他們在構建一個能與人類水平相媲美的自動對齊研究器,盡可能將相關工作交由自動系統完成,同時確保人工智能系統的行爲與人類價值觀和目標保持一致。

離开的也不只是對齊團隊的人,OpenAI前工程負責人,曾領導過ChatGPT, GPT-4, DALL·E和APIs上线的Evan Morikawa也宣布離开,將與前波士頓動力高級機器人學家Andy Barry和Deep Mind研究科學家Pete Florence 和 Andy Zeng共同开展一個全新項目,並認爲“這是在全球範圍內實現 AGI 所必需的”。

有網友表示這聽起來像是OpenAI想繼續燒錢商業化,而不是確保前進步驟的安全。他們想成爲大亨,而不是英雄。

對Jan Leike的長文开炮,奧特曼當然是不會就此作罷的了。很快他便發文“反擊”:“我非常感謝 Jan Leike 對 OpenAI 對齊研究和安全文化的貢獻,也非常難過看到他離开。他說得對,我們還有很多事情要做,我們承諾會做到。我會在接下來的幾天裏發一篇更長的文章。”不出意外的話,未來幾天還會像去年一樣,小作文反轉不斷。至於真相是什么,或許只有躬身其中的少數人知道,是非曲直其實對網友來說並不太重要。

重要的是此次“離職潮”表明了去年以來的內部矛盾並沒有消弭,反而是隱藏轉移爆發。歸根結底的來說,Ilya Sutskever跟Sam Altman之爭主要是技術原教旨主義者和市場激進派之間的矛盾。Jan Leike表示:“我相信,我們應該將更多的帶寬花在爲下一代模型做准備上,關注安全、監控、對抗性穩健性、超級對齊、保密性、社會影響等相關話題。這些問題很難解決,我擔心我們還沒有走上正軌。”

但Sam Altman一直以來在強調AI會如何顛覆世界創造出令人驚訝的產品,在瘋狂地積累芯片甚至要自建芯片廠,來加速技術的發展。筆者認爲兩者之爭是幾乎所有AI從業者都要考慮的事情,技術當然可以促進社會生產力發展,但也會帶來一系列安全問題和風險。

Sam Altman未必真的是唯利是圖一心只想賺錢,他所說的重視AI安全不一定是謊言。但作爲管理者要考慮公司的長久運營,能兼顧是最好不能兼顧那就需要有優先級。目前AI對齊所需算力並不小而且對齊之後的AI性能下降明顯,這可能是Sam Altman無法給對齊團隊滿意安排的重要原因之一。當然真實情況可能更復雜,但邁向下一個時代的科技生產力,如果沒有足夠的商業利益一切都會是空談。

如果OpenAI完全放棄對齊或者不重視,那對未來的GPT-5來說將是巨大的風險,商業化被迫戛然而止也有可能。總之,我們希望出現一個更好更开放的OpenAI,而不是把問題都丟給社會。

中國大模型也無需自卑

近一個月國產大模型讓市場產生了正在追平美國的印象,很多亮點也來自初創企業。月之暗面將上下文長度擴展至200萬token;Minimax出海陪聊應用Talkie日活接近 Character.AI;發布了Vidu的生數科技,提出U-ViT架構比Sora還早;开源模型DeepSeek在保證性能的前提下,讓成本降至1塊錢百萬token輸入。

有些文章說國內AI都在卷價格只有國外在卷功能,其實並不客觀。推理需求已經真實存在了。去年底發布以來,阿裏巴巴近1.7萬中小外貿商家訂購了AI生意助手,發布了上百萬商品,搜索量提升近四成。字節跳動將豆包大模型接入了抖音、飛書等業務,日均處理1200億token文本,但沒有公布參數等細節,可能是因爲與Tiktok用了類似的推薦算法。百度文心大模型日處理文本2500億token,日均調用量爲去年底的4倍。騰訊已經把混元大模型用在了會議、讀書與遊戲客服上;AI支持的廣告服務的點擊率與交易量也在上升。

开源大模型通義千問已經火到國外去了,有太多外國人在討論和使用(通義千問)Qwen大模型。

通義發布1100億參數开源模型Qwen1.5-110B,該模型在MMLU、TheoremQA、GPQA等基准測評中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B衝上榜首,再度證明通義开源系列業界最強的競爭力。

或許有人會質疑跑分成績,但是面向C端主打全功能免費的通義,卻是真香了。同時通義千問 APP 還升級爲「通義 APP」,集成文生圖、智能編碼、文檔解析、音視頻理解、視覺生成等全棧能力,想成爲用戶的「全能 AI 助手」。

寫在最後

無論是OpenAI還是國內的AI企業,都離不开金融資本和產業資本的運作,過於排斥商業化並不是好事,但也應該有底线取得安全與效益的平衡,只有這樣才能實現科技創造美好未來。歷史上的重大技術進步往往伴隨着金融泡沫,這是新技術推廣的自然組成部分。AI有泡沫並不可怕,可怕的是技術的基石不牢,難以解決現實中的種種問題,最終難以落地變成“全都是泡沫”。

參考資料:

OpenAI重磅發布GPT-4o 來源:Founder Park

GPT-4o搶先測 來源:DoNews

GPT-4o很好但最大亮點只有免費 來源:ZAKER

大模型的泡沫來了嗎?來源:NewNewThing

中美巨頭的AI差距 來源:未盡研究

OpenAI保護人類的團隊分崩離析 來源:硅星人Pro

OpenAI的元老科學家都跑光了 來源:AI前线

Ilya離开OpenAI內幕曝光 來源:量子位

通義千問2.5正式發布 來源:阿裏雲

       原文標題 : GPT-4o重磅發布,但AI已經進入泡沫前期



標題:GPT-4o重磅發布,但AI已經進入泡沫前期

地址:https://www.utechfun.com/post/373839.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡