Openai發布的Sora,送給A股800億开年紅包

2024-02-23 18:40:30    編輯: robot
導讀 貝克街探案官 作者 魯鎮西 普通人如何把握技術迭代帶來的行業變革紅利 沒想到今年第一個引爆科技圈的消息,還沒等復工就刷了屏,復工後又直接推動相關企業市值爆拉,A股25家相關企業市值共計增長888.4...

貝克街探案官

作者

魯鎮西

普通人如何把握技術迭代帶來的行業變革紅利

沒想到今年第一個引爆科技圈的消息,還沒等復工就刷了屏,復工後又直接推動相關企業市值爆拉,A股25家相關企業市值共計增長888.42億元,兩個交易日平均漲幅26.94%。

   

2 月 16 日凌晨,OpenAI 發布首個文生視頻模型 Sora,是OpenAI繼ChatGPT之後,推出的另一款具備顛覆行業能力的AI應用,Sora能夠僅僅根據提示詞,生成60s的連貫視頻,遠超行業目前大概只有平均“4s”的視頻生成長度。

“平均4s”的長度指代非常明顯,就是Runway和PIKA。也曾短暫引爆過A股文生視頻的炒作,但無論是強度還是持續性,都遠不如Sora。

在Sora問世之前,Runway和PIKA被視爲文生視頻領域的龍頭,但在sora生產的視頻出現後,業界普遍認爲Sora可以吊打Runway和PIKA。

Pika創始人郭文景曾在接受採訪時表示,“視頻現在沒有很好的算法,它不是一個規模化的問題,不是說現在大家的GPU不夠多,很多時候其實是算法上還沒有很好的一個思路。”並認爲Sora的發布“是一個很振奮人心的消息,我們已經在籌備直接衝,將直接對標Sora。”

和Runway和PIKA相比,Sora產出的視頻時間更長,連貫性更好,其他模型產出的視頻甚至還有卡頓、場景突變等問題;在此基礎上,Sora的視覺細節更豐富,且清晰度更高。對比Sora和runway的視頻不難發現,Sora的視頻內容更符合常人對“視頻”的理解,而runway的視頻內容更像是“GIF”動圖。  

業內普遍認爲,Sora的出現,預示着一個全新的視覺敘事時代的到來,它能夠依據客戶的文本提示,將人們的想象力轉化爲生動的動態畫面。Sora作爲一款通用的視覺數據模型,其卓越之處在於能夠生成跨越不同持續時間、縱橫比和分辨率的視頻和圖像,甚至包括生成長達一分鐘的高清視頻。

從成片來看,假以時日,伴隨熟練運用Sora的工程師、自媒體人越來越多,電影業恐將在此次技術變革中迎來一次大洗牌,畢竟每一部影視作品成片之前都要先有個好劇本,好劇本問世後,用Sora就可以實現視頻輸出了。   

但就目前而言,實現這個目標爲時尚早,因爲整個Sora產業鏈正處於萌芽期,國內目前尚未有一家公司可以與之抗衡,就連字節都直言“Boximator”目前還無法作爲完善的產品落地,令人略有欣慰的是,已經湧現出大批企業試圖搭上Sora的快車。

這也不禁讓人想起ChatGPT發布後,大量企業跟進推出“自研大模型”,並不斷呼嚎趕超OpenAI,結果人家這次直接來個降維,借着推出Sora繼續AI應用市場遙遙領先。

01

Sora是否難以復制

Sora採用了Transformer架構,和ChatGPT不同的是,大語言模型通過token將各種形式的文本代碼、數學和自然語言統一起來,Sora則通過視覺包(patchs)實現了類似的效果。

Sora和ChatGPT最大的區別,就是Sora爲擴散模型,它接受輸入的噪聲包(以及如文本提示等條件性輸入信息),然後被訓練去預測原始的“幹淨”包。

重要的是,Sora是一個基於擴散的轉換器模型,這種模型已經在多個領域展現了顯著的擴展性,包括語言建模、計算機視覺以及圖像生成等領域。擴散轉換器在視頻生成領域同樣具有巨大的潛力,不同訓練階段下,使用相同種子和輸入的視頻樣本對比,結果證明了隨着訓練量的增加,樣本質量有着明顯的提高。

Sora研究員專門訓練了一個網絡,專門負責降低視覺數據的維度。這個網絡接收原始視頻作爲輸入,並輸出經過壓縮的潛在表示。Sora模型就是在這個壓縮後的潛在空間中接受訓練,並最終生成視頻。此外,研究員還設計了一個解碼器模型,它可以將生成的潛在表示重新映射回像素空間,從而生成可視的視頻或圖像。   

當給定一個壓縮後的輸入視頻時,從中提取出一系列的時空包,這些包被用作轉換token。這一方案不僅適用於視頻,因爲視頻本質上就是由連續幀構成的,所以圖像也可以看作是單幀的視頻。

通過這種基於包的表示方式,Sora能夠跨越不同分辨率、持續時間和縱橫比的視頻和圖像進行訓練。在推理階段,研究員只需在適當大小的網格中安排隨機初始化的包,就可以控制生成視頻的大小和分辨率。

僅從原理層面來看,推出Sora這種文生視頻大模型並不難,但國產廠商在推出進度上紛紛落後於OpenAI,此前曾有消息稱字節推出了Boximator,它可以通過文本精准控制生成視頻中人物或物體的動作。

對此,字節跳動相關人士回應稱,Boximator是視頻生成領域控制對象運動的技術方法研究項目,目前還無法作爲完善的產品落地,距離國外領先的視頻生成模型在畫面質量、保真率、視頻時長等方面還有很大差距。

其他發布公告的企業,要么是想要介入這個賽道,要么就是可以爲該行業提供硬件設備支持,因爲A股市場中沒有文生視頻的企業,所以退而求其次,找到了一家文生圖產品獲得市場認可的企業炒作,即因賽集團,該公司的InsightGPT的文生圖功能已在時尚珠寶和快消兩個賽道的營銷領域商用,並且具有一定市場認可度。

其他的則是一些算力租賃公司獲得市場爆炒,至於想要切入這個行業的公司就更多了,不勝枚舉。   

02

Sora商用,會切走誰的蛋糕

Sora之所以會引起市場轟動,主要是因爲其“文生視頻”的功能直接讓影視從業人員集體焦慮。

北京天工異彩影視科技有限公司的副總裁兼CTO周輝公开表示,Sora生成的視頻質量足夠震撼,可以縮短電影拍攝周期。

其實周輝的表達還是保守了,只要Sora工程師足夠多,硬件設備不受限,整個影視業的演員都可以省了,動輒過億的演員費用也可以省下,那現在已經成名的影視劇明星,想要上鏡就要另謀出路,當然制作方也可以獲得已成名演員的授權後上鏡。

同時場地租賃、置景等費用也會隨之下降,這也給了很多非專業團體在影視業一展身手的機會,換言之,今天是影視業最容易的一天,以後每一天都比今天難上加難,值得注意的是,這一邏輯對視頻依賴較大的廣告業也通用。

除此之外,國內剛起步的科幻電影可發揮空間也將瞬間提升。之前一直說《三體》影視化不成功,是因爲很多場景制作困難,而Sora的出現,可以有效解決這個問題,C 內容的專家化也將創造新的風格與形式,增強影視內容的吸引力與豐富度。用人方面,特效師因爲具備基礎的工作邏輯,培訓周期也比其他沒有經驗的人群更短。

但在Sora工程師大規模入局之前,短期Sora還是一個工具性產品,某種程度上幫助影視制作方降本增效。    

除影視行業外,遊戲行業也將借助Sora產生巨大變革,Sora對於物理世界的理解和模擬可以與遊戲場景开發高度適配,Sora可以幫助遊戲开發者創立角色或背景故事。OpenAI也在Sora技術報告中提出,Sora能夠模擬如視頻遊戲的數字化過程,根據官方視頻演示,Sora能在控制《Minecraft》遊戲角色進行基本操作的同時,高質量動態渲染遊戲世界。

可以預見,Sora未來將可能被應用生成遊戲動畫和場景等,增加遊戲情感故事背景提高可玩性,遊戲开發者的成本也將隨之降低。簡言之,又會有部分人因此面臨崗位變動。

03

學會使用AI工具

這種背景下,不會使用AI工具的從業者將會伴隨科技進步,被時代無情淘汰,而掌握AI工具的外行業,跨行也不會再體會“翻山越嶺”般的困苦,當今大量自媒體從業者,也有機會進一步落地自己的創意。

至於賣課教別人怎么使用AI工具的機構,誰讓人家先掌握知識呢,“知識就是力量”已經成爲亙古不變的真理,每當科技迭代出現新的生產力工具,都會有相應的課程出現,當年Word的使用也是一門技術,路邊的打印店甚至招了很多年“打字員”,而如今打字員早已經不是一個職業,而是每個打工人都必須掌握的技能。

假以時日,使用AI工具或許也會成爲每個打工人必須掌握的技能,但就目前而言,這仍是一個新興就業崗位,各位也沒必要因爲科技進步而焦慮,畢竟機遇總是伴隨危機出現,機會也是給有准備的人。   

© THE END

本文僅作爲分享學習使用,不構成任何投資建議。

本文由貝克街探案官原創,未經許可,請勿轉載。

       原文標題 : Openai發布的Sora,送給A股800億开年紅包



標題:Openai發布的Sora,送給A股800億开年紅包

地址:https://www.utechfun.com/post/335970.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡