一覺醒來,AI世界又出王炸。
剛剛,人工智能公司OpenAI發布了首個視頻生成大模型產品——Sora。
Sora是什么AI產品?
簡單來講,Sora可以根據提供的文本,自動創建長達60秒的高清視頻。
在AI行業,根據文本自動生成視頻,不算新鮮事。
但是,Sora的問世,之所以被稱爲“王炸”,主要實現了以下幾點突破:
1.多鏡頭,多視角(類比影視業,對攝影師的顛覆)
如何理解這一技術突破,打個比喻:
此前的AI自動生產視頻,好比對同一場景,同時配備了幾個水平參差不齊的攝影師,多個鏡頭拍攝,然後將每個人的鏡頭拼接在一起。
單視頻,單鏡頭,看起來畫面不連貫,風格不統一,違和感強烈。
Sora的出現,如同配備了多個技術高超且水平完全一致的攝影師,同時多鏡頭、多角度拍攝,能保證成品視頻,既能一鏡到底,也可以實現多角度鏡頭切換,並且還能保證場景與主體的完美一致性。
2.長時間,高清還原(類比影視業,對攝影器材的顛覆)
如果說傳統的AI視頻生成,是用傳統卡帶攝影機拍攝視頻。Sora的出現,則是直接替換成了高清數碼攝影機。
首先是大幅提高了視頻長度。
在大多數AI視頻還在一個鏡頭3s時長努力時,Sora直接拉爆至60s,這也意味着AI視頻創作,直接提升至作品級標准。
其次是視頻質量的高清還原。
Sora創作的視頻質量,無論是高清度還是還原度,都可謂極其逼真。
比如人物的眼睛,神情動態之難,往往成爲AI創作的壁壘。Sora的世界裏,人物眼睛直逼真人,幾乎沒有任何AI創作的破綻。
這樣細節直接拉滿的視頻,哪怕是頂級動畫制作公司,制作下來也需要數日時間,而Sora幾分鐘就搞定了。
這就是技術震撼!這就是行業顛覆!
3.世界模型初具雛形(類比影視業,對演員理解劇本能力的顛覆)
傳統的AI視頻生成,只能一板一眼地照本宣科翻譯提供的文案,而Sora的可怕在於它可以开始理解文案,並基於文案自己進行發揮和拓展。
Sora生成的視頻中,可以看到充滿了大量文案沒有描述的細節,這些都代表Sora的大模型中,已經具備了對於現實世界模型的理解與認知。
基於以上,Sora的出現,對傳統AI視頻生成的衝擊,毫不誇張地講,如同鳥槍換炮。一夜之間,引發了無數行業的焦慮。
電影制作公司,視頻動畫公司,美術公司,廣告公司,甚至包括視頻網紅,都在擔心Sora帶來的衝擊。
有人把AI的誕生比喻爲當年的“工業革命”,無論是當年的蒸汽機還是如今的ChatGPT、Sora,本質上還是生產工具帶來生產力的大幅提升。
生產力的提升,帶來的是生產效率的提升,其中必然意味着有些崗位乃至行業面臨淘汰。
從ChatGPT誕生之日起,我們的世界就正式進入了“AI時代”。從ChatGPT到Sora,可以看到AI時代的發展速度遠超人們的理解與想象。
進入AI時代後,每一個人都應該問自己一個問題:我的飯碗,有沒有被AI打破的可能?
盡管Sora的技術極具震撼性,但畢竟剛剛發布,缺點還是很明顯。
Sora目前最大的缺點,還是無法理解現實世界的“因果關系”。
這個因果關系,包含物理上的因果關系,人情世故的因果關系,時間和空間的因果關系。
從某種意義上來看,對因果關系的理解,或許是AI虛擬世界與現實世界最後的一道屏障
標題:剛剛,AI再出王炸!現實世界真的要被顛覆了?
地址:https://www.utechfun.com/post/333072.html