2024年最能搞事的巨頭,依然是OpenAI。
先是創始人兼CEO奧特曼,透露預計籌集7萬億美元,用來提高全球芯片制造能力。
7萬億美元,都能把蘋果、微軟、谷歌一起打包买走了。
相比天文數字,更讓人震驚的是OpenAI的另一件事。
2月16日凌晨,它的首個文生視頻模型Sora正式亮相,並發布了幾段AI生成的視頻,最長60秒。
AI視頻,從此達到了以假亂真的程度。
看到這些視頻,普通人直呼“現實,不存在了”,同行們則全萎了。
明星AI公司Stability AI,原本也發布了一個新的視頻模型,但看到Sora的視頻後,官方火速刪除了自家推文。
另外一家公司Runway,創始人感慨:過去要幹一年的活,現在被它幾天、幾小時就幹完了。
馬斯克則到處留言“人類愿賭服輸(gg humans)”。
央視也被驚動,有多個頻道都對Sora進行了全天候報道。
對於Sora,目前全程高興的只有兩種人。
一個是老色批,他們已經快進到“MR頭顯+AI創作劇情”的聯想了。
一個自然是OpenAI,再次逼瘋同行後,其估值達到800億美元,還可能飆升。
只能生成60秒視頻的Sora,憑啥這么值錢?
發布2個小時,讓對手損失上億
在AI生成視頻的領域,OpenAI不是第一個喫螃蟹的。
不一樣的是,之前的AI視頻公司,它們做的AI生成視頻,基本只有幾秒,而且模糊不清,還有明顯的違和感。
比如去年,AI生成的一個外國男明星喫意大利面的視頻,一眼假。
所以不少大佬都說在AI生成視頻方面,我們還有很長的路要走。
但它的商業價值,沒能人否認。
此前業內最知名的Runway,最多只能生成18秒的視頻,但憑這手功夫,Runway參與了奧斯卡獲獎影片《瞬息全宇宙》的制作,估值一度達到15億美元。
還有一家去年底成立的創業公司Pika,靠其文生視頻大模型轟動一時。這家只有4個人的公司,半年時間完成了三輪融資,估值飆升到2.5億美元。
只是沒想到,橫空出世的Sora,一夜攪沒了所有人的美夢。
Runway的CEO第一時間在網上說了兩個字:“Game On(競爭开始了).”
另一家AI視頻公司Stability的CEO甘拜下風:“奧特曼真是個魔術師。”
美國圖片供應商Shutterstock,被跨界打擊,在Sora發布的2小時,其市值損失了約7000萬美元。
更慘的是谷歌,秒變科技界的汪峰。
因爲就在Sora發布的同一天,谷歌也重磅發布了新一代多模態大模型Gemini 1.5 Pro,在性能上完全秒殺OpenAI的GPT-4 Turbo。
這本該是谷歌揚眉吐氣的一天,卻被Sora搶走了所有頭條。
能讓所有公司黯然失色,Sora太顛覆了。
別人還在用AI費勁地生成4秒動圖,Sora隨意生成60秒的高清大片。
其他AI生成視頻充滿山寨感,Sora甚至能生成電影級別的場景,以假亂真
連“同一場景”下的多機位視頻,Sora都整出來了。
無論是視頻時長、畫面精細度,還是細節完整性,不論是一鏡到底還是多機位無縫切換,Sora的表現都可以用碾壓對手來形容。
有人用相同的提示詞,對比Sora和其他同類產品生成的視頻,差距一目了然。
更關鍵的是,使用Sora的門檻極低。
從官方發布的宣傳視頻看,你只需要輸入“構成元素、環境、行爲及發生順序、視頻風格”等提示詞,就能生成不同風格的高清、連貫、具有豐富運鏡和轉場的60秒視頻。
所以,用它生成其他風格的虛擬視頻也很容易,比如3D或動漫風。
同時還能根據要求,直接生成不同尺寸的視頻,適配不同設備的屏幕。
說不定很快,人人都能有個導演夢。
Sora價值千億的底氣,不是祕密
其實Sora還有很多明顯的弱點。
OpenAI指出,它可能難以准確模擬復雜場景的物理原理,並且可能無法理解因果關系。
比如這個視頻裏,老人吹蠟燭前後,火苗沒有絲毫變化,不合常理。
酒杯摔碎,但是液體的流動和玻璃的破裂關系,也不合理。
一個人在跑步機上倒着跑步,更不合理。
對於AI來說,現實世界裏再簡單、再自然的現象,它可能都需要學習才能理解和還原。
去年很火的“AI繪畫”,一开始也有類似毛病。
讓它畫一幅“在地上睡”的圖,呈現出的可能是“地板+枕頭+人頭”,以爲把腦袋放在枕頭上就是睡覺。
還有人發現,AI繪畫總是不能讓人物老老實實地喫拉面。用什么工具喫面,一口喫幾根,AI都需要學習。
但AI繪畫技術很快迭代,不再智障,反而成了工作利器。
一名做插畫設計相關工作的人表示,用了AI繪畫後,工作更高效了,“現在甲方給我一個主題,我可以同時給他生成七八張圖。”
現在還有明顯硬傷的Sora,也有快速迭代的能力。
這主要得益於它理解長文的能力,這也是OpenAI本來就有的殺手鐗。
比如在輸入端,OpenAI利用GPT,先將用戶輸入的提示詞進行精准的詳盡擴寫,然後再將擴寫後的提示詞交給Sora,讓Sora能更好地遵循提示詞來生成精准的視頻。
所以相比以往的AI視頻生成,只能死板地翻譯文案,接着生成死板的視頻,Sora不光能理解文案,還能基於文案自行發揮,讓視頻變得更自然、更精彩。
就好像這個視頻,在完成主題的前提下,Sora又自動進行了多次鏡頭轉換。
有了更好的理解能力,才能有更好的邏輯能力。
因此,在理解和掌握了更多現實世界的現象以及規律後,Sora生成的視頻會越來越接近真實。
行駛中的列車窗外偶遇遮擋,車內人物倒影的短暫出現,十分驚豔。
也可以來一段好萊塢大片質感的電影預告片。
近景視角下,鏡頭細節拉滿。
這也是爲什么,OpenAI把Sora定義爲“世界模擬器”。
除了接近真實,Sora還能實現人類的非現實腦洞。舉個例子,根據提示詞“一個杯子裏兩艘海盜船战鬥的逼真近距離視頻”,它生成了這樣的視頻。
難怪很多網友直呼要失業了,影視、廣告、遊戲等很多行業都會被衝擊。
不少人還認爲,連抖音、TikTok等短視頻平台也要有危機感了。
畢竟AI生成視頻一旦踏入正軌,輸出源源不斷,再加上AI還能更好地理解人類的成癮機制,如果OpenAI推出自己的短視頻平台,很可能成爲一方霸主。
OpenAI可能存在的野心,越來越嚇人了。
從巨虧到狂賺,
它爲何成了巨頭的噩夢?
作爲近兩年的科技界頂流,有段時間,OpenAI並不被看好。
在其創立的前幾年,OpenAI毫無盈利能力,全靠金主爸爸養活。
以至於曾有商業報告稱,OpenAI僅運行其人工智能服務ChatGPT每天就要花費約70萬美元,OpenAI目前正處於燒錢的狀態,若不加速自身商業化進程,很有可能在2024年底不得不申請破產。
但OpenAI用行動表示:不是不會賺錢,只是還不想賺錢。
去年下半年开始,OpenAI加速商業化。創始人介紹,截至去年11月,有92%的財富500強公司在使用OpenAI的產品。整個2023年,OpenAI的收入突破了20億美元。
與此同時,其最著名的產品ChatGPT,周用戶量達到了1億。
隨之而來的是它水漲船高的估值,從去年年初的300億美元暴漲到如今的800億美元,在創業公司裏僅次於字節跳動和SpaceX。
不過,比起賺錢能力和飆升的估值,OpenAI身上還有更讓巨頭忌憚的特質。
那就是开創風口的能力。
過去14個月,OpenAI始終是風口中的頂流。
從AI聊天,到AI繪畫,再到AI生成視頻,OpenAI的每次亮相似乎都在打臉巨頭。
ChatGPT剛一亮相,嚇得谷歌緊急推出AI加持的搜索引擎Bard,結果出師不利,當天股價大跌7.4%,市值蒸發1024億美元。
Sora只是發出幾段AI視頻,搶走了所有科技版頭條,讓已經耕耘良久的同行自慚形穢。周鴻禕還在微博發長文表示,Sora意味着AGI實現將從10年縮短到1年。
如今火熱的生成式AI市場,可以說離不开OpenAI的一步步推波助瀾。
一個創業公司,搶先开創風口、放大市場,隱隱有成爲新巨頭的跡象,足以成爲當下所有巨頭的噩夢。
但與其眼紅OpenAI不斷开創風口,巨頭們更該做的是反思。
前搜狗CEO王小川曾評論說:“OpenAI的成功,首先是技術理想主義的勝利。中國需要自己的OpenAI,就需要技術理想主義。大廠受自己的業務牽引,追逐資本熱點的創業公司更動作變形。”
其實不論國內外,這個問題都存在。
在發展中,技術和創新的重要性不知不覺退居到了第二位,一切動作變成了爲收入服務。
OpenAI就像曾經的影子,提醒它們必須想起久違的拼勁。
從ChatGPT到Sora,在AI的衝擊面前,許多行業裏的普通人都开始有危機感,巨頭也別妄想能繼續躺平。
圖片來源於網絡,侵權請聯系刪除
標題:公然“造假”,卻被央視吹爆!毀三觀的AI產品,憑啥價值千億?
地址:https://www.utechfun.com/post/335577.html