今年以來,最重磅的消息就是OpenAI發布文生視頻模型Sora,其之於視頻大模型的意義絲毫不亞於ChatGPT之於文本模型領域的意義。
文生視頻模型Sora的出現,意味着OpenAI實現了對生成式AI主流模型的全面覆蓋,其中包括文本模型GPT、文生圖模型DALL·E、文生視頻模型Sora。
然而,這並不是OpenAI故事的全部。近期,隨着越來越多信息的披露,OpenAI試圖壟斷AI產業的野心暴露無疑。
據WSJ報道,OpenAI正在持續探索進入芯片制造的可能,並拋出了一個5萬億到7萬億美元的超級融資計劃。與此同時,OpenAI也在加速對AI核心應用場景的產品研發,其中包括一款搜索產品和兩款革命性的Agent軟件。
這意味着,OpenAI正在向基礎設施層和AI應用層同時發力,試圖通喫整個生成式AI的軟硬件基礎設施,進而壟斷整個AI產業。
/ 01 / 通喫上下遊的野心
人們總把OpenAI簡單當作模型層公司。但現在這個看法要改改了。種種跡象顯示,OpenAI正在向基礎設施層和AI應用層同時發力。
在基礎設施層,Sam Altman拋出了一個增加全球芯片制造能力的項目,並與包括阿拉伯聯合酋長國政府在內的不同投資者談判,計劃募資金額高達5萬億到7萬億美元。
事實上,Altman這一計劃由來已久,自去年10月开始就不斷有OpenAI准備投資芯片的消息傳出,Altman本人也同包括G42、軟銀、英特爾、台積電和三星電子等公司談判過合作。
除了往基礎設施層走,OpenAI也在加速對AI核心應用場景的產品研發。根據媒體報道,據了解 OpenAI 計劃的知情人士透露,OpenAI一直計劃开發一款網絡搜索產品,這項產品將得到Bing支持。
與此同時,OpenAI還在开發兩款革命性的Agent軟件。其中一款能夠有效接管客戶的設備來自動執行復雜的任務。例如,把文檔中的數據傳輸到電子表格中進行分析,或者自動填寫費用報告並將其輸入會計軟件,或者根據一定的預算制定行程或預訂機票。
上個月,OpenAI員工本·紐豪斯在X上發布了一則招聘信息,爲自己的團隊招聘,方向是利用最新模型的特性,开發一款可能會改變行業格局的新產品。對於產品具體情況,他沒有詳細說明。但OpenAI的產品副總裁彼得·韋林德在X上評論說,紐豪斯所說的產品將會改變一切。
無論是Agent還是AI搜索工具,都被認爲是當下AI應用探索最成功的場景之一,前者的代表產品是AutoGPT,後者的代表產品是Perplexity。其中,Perplexity 已經融資 1 億美元,最近投資者對它的估值爲 5.2 億美元。據 The Information 報道,截至上個月,這家初創公司每年從產品訂閱中獲得約 800 萬美元常規收入。
盡管谷歌、Meta等公司在芯片和AI產品也都有動作,但遠遠沒有OpenAI這么活躍。而之所以OpenAI花這么多力氣往上下遊走,很重要的一個原因就是對AI產業終局的押注。
/ 02 / 押注AI產業終局
表面上看,OpenAI去造芯片,是因爲購买AI芯片的成本太高了。但說到底,OpenAI還是不想被卡脖子。
現在提升模型智能水平只有一個路徑,就是 Scaling Law。在肉眼可見的未來,仍然看不到Scaling Law的盡頭。而且即使不开發任何新的模型,OpenAI 離“用 GPT-4 服務所有人”的目標仍然很遠。這意味着,在可見的未來,算力都是一個巨大的瓶頸。
這可不光是錢的事情。算力成本的下降速度,決定了AI在很多場景裏的落地。這一點和當初的互聯網很像,移動互聯網應用大規模爆發,起於從3G到4G的所帶來的流量成本大幅下降。
而現在算力成本的下降,很大程度上取決於芯片廠商。盡管H100相比A100性能有明顯提升,但並沒有像模型訓練算力需求那樣有明顯數量級的增長。這也意味着,算力成本已經成爲OpenAI通往AGI的最大阻礙。
拋开卡脖子的因素外,在AGI終局裏,算力本身也足夠“性感”。在這一輪AI熱潮的驅動下,英偉達的市值已經一舉超越了亞馬遜與谷歌。
與布局芯片類似於,OpenAI做AI應用產品也出於類似的考慮。從歷史中看,軟件行業的最終贏家是直接掌控用戶和數據資產的平台型應用,“只掌握技術”在互聯網世界裏被證明並沒有價值。
這個邏輯放在生成式AI也同樣適用。正如此前月之暗面楊植麟所說:
“現在‘喫’的是 Base Model 的 Scaling Law,未來可能會去“喫”用戶這個數據源的 Scaling Law。歷史上基本所有的互聯網產品要跑出來,最終都要靠用戶數據的 Scale。今天 MidJourney 已經能看到一些跡象,它通過“喫”用戶的Scaling Law 可以勝過 Base Model 的Scale up,但如果只看語言模型和文本,Base Model 的scaling 效果仍然遠遠超過用戶的。“
按照楊植麟的說法,AI大模型智能水平驅動力從基礎數據的Scaling Law轉移到用戶的Scaling Law,只是個時間問題。在這種情況下,應用層公司既是模型層的下遊客戶,也是數據提供者。只有掌握用戶的公司,才真正意味着掌控模型。
/ 03 / OpenAI的終局思維
如果你足夠了解OpenAI,就會對這家公司的目標印象深刻。從創業开始,這家公司的目標只有一個,就是 all in AGI,一切研究圍繞着探索通往 AGI 的路徑。你能看到,無論是OpenAI還是掌舵人Sam Altman,他們在行爲上都有着極強終局思維的烙印。
之所以OpenAI能跑通從文本、圖片到視頻的所有 AGI 技術棧,而且在很多領域都展現出了遠超行業的能力,恰恰離不开OpenAI基於終局思維建立的方法論。
作爲Scaling Law這一暴力美學的堅定支持者,爲了最大程度地發揮Scaling Law的價值,OpenAI做了三件事情:良好且通用的數據表示,良好且通用的數據標注,良好且通用的算法。
根據加州大學伯克利分校 (UC Berkeley) 計算機科學 PHD、知乎作者 SIY.Z的分析:
在GPT中,良好且通用的數據表示,是 tokenizer 帶來的 embedding。良好且通用的數據標注是文本清理和去重的一套方法(因爲自然語言訓練是 unsupervised training,數據本身就是標注)。良好且通用的算法就是大家熟知的 transformers + autoregressive loss。
在Sora中,良好且通用的數據表示,是 video compress network 帶來的 visual patch。良好且通用的數據標注是 OpenAI 自己的標注器給視頻詳細的描述(很可能是 GPT-vision)。良好且通用的算法也是大家熟知的 transformers + diffusion。
以上的種種調整,爲GPT和Sora的成功打下了基礎。而如今,這樣的思維也從技術探索也延伸到了業務布局。
就拿做芯片這事來說,很多人覺得奧特曼提出的7萬億是天方夜譚,但如果放到終局思維的路徑裏,其實也就能夠理解了。
現在全球每年的GDP大約在100萬億美元,7萬億也就佔7%而已。要知道,人腦的能量开銷佔每天人體耗能的 20%以上,因此最終 AI 相關的算力开銷或許也應該達到類似的比例才合理。全球 70 億人分 7 萬億美元,平攤下來人均也就 1000 美元,只有1 部蘋果手機或筆記本電腦的價錢,但你從中獲得的生產力提升可能翻倍都不止。
以終局思維出發,進行業務布局,讓OpenAI將AI產業的競爭拉高到一個新的維度,而不僅僅取決於模型的智能水平。但這事也會帶來一個問題:OpenAI將面臨比互聯網巨頭更嚴厲的壟斷監管。
如果OpenAI這條路能跑通,意味着AI產業將比互聯網更加壟斷。原因很簡單,當算力、算法和數據三者的價值全被OpenAI拿走的,很多人工智能產業鏈上的公司會死掉。
在互聯網時代,由於信息流動方式的問題,導致數據最終聚集在了少數互聯網巨頭的手裏,他們通過廣告這個精妙的商業模式,把財富聚集在自己手裏,壟斷开始出現。
生成式AI所帶來的技術變革本有望打破這一切。但OpenAI的AGI野心,很有可能讓長成一個吸血的怪獸,壟斷所有的知識來靠此收費,在壟斷這件事上不僅沒有減少,甚至換了新方法變本加厲上演。
從長遠看,OpenAI喫掉AI絕大部分蛋糕的故事固然性感,但對於AI行業乃至整個世界來說,未必是一件好事。
原文標題 : 野心曝光!7億美元造芯片、开發革命性產品,OpenAI想要“壟斷”整個AI
標題:野心曝光!7億美元造芯片、开發革命性產品,OpenAI想要“壟斷”整個AI
地址:https://www.utechfun.com/post/341327.html