OpenAI首個AI視頻模型Sora的顛覆與爭議

2024-02-18 18:40:03    編輯: robot
導讀 【編輯推薦】有人說,這是影響影視行業和未來技術發展的又一顛覆性事件?,也難怪大家驚呼“現實,不存在了!”不過,Sora和文生圖一樣,普遍存在生成內容不夠精確,所以離真正顛覆影視行業還有很大一段距離。...

【編輯推薦】有人說,這是影響影視行業和未來技術發展的又一顛覆性事件?,也難怪大家驚呼“現實,不存在了!”不過,Sora和文生圖一樣,普遍存在生成內容不夠精確,所以離真正顛覆影視行業還有很大一段距離。可以肯定的是,這些新的工具和產品正在逐漸改變我們的工作和生活方式,一個新的智能世界,正在走來,未來誰能快速掌握這些AI工具和技術的使用,誰才是真正的掌控者。

太炸裂了!2月16日凌晨,OpenAI在社交平台X上宣布,正在开發一款名爲Sora的新模型。

Sora可以做什么?它的主要功能是把文本描述轉化爲視頻,它能夠理解並執行詳細的文本指令,從而生成具有視覺質量和連貫性的視頻。這些視頻可以包含多個角色、動作和場景,還可以根據提示的主題和背景,精准生成影片內容,呈現復雜的攝影機運鏡,影片長度最多爲60秒。除了根據文字產生影片外,它還能夠從靜態圖像生成動畫,或擴展現有視頻。

雖然,目前它尚未對大衆开放使用,不過消息一出,它已經在網絡上引發討論,很多人表示大爲震撼。

來看一組展示,一位時尚女性走在霓虹閃爍的東京街頭;一位20多歲的年輕人正在一片雲上讀書,中國龍慶祝中國新年……其實它的獨特之處在於,它不再是一種創造性工具,更像是一個“數據驅動的物理引擎”。它不僅了解用戶在提示中提出的要求,然後根據你的需求生成圖像,還能確定環境中對象的物理特性,並根據這些計算渲染視頻。

有人說,這是影響影視行業和未來技術發展的又一顛覆性事件?。也難怪大家驚呼,現實,不存在了!

而這些能夠實現背後依靠的是擴散模型,這意味着Sora會從模糊充滿靜態的視頻开始生成,然後再慢慢將其平滑處理成你看到的精美版本。

我們知道之前發布的Midjourney和Stable Diffusio也是擴散模型,但不得不說,Sora制作的視頻比它們更長、更有活力、也更流暢。

Sora感覺像是創建了一個真實的視頻,而Midjourney和Stable Diffusio模型感覺像是人工智能圖像的定格動畫。不過Sora目前還是一個未完成的產品,它可能難以消化復雜的物理或空間細節,進而導致它生成不合邏輯的影片,比如人類在跑步機上跑錯方向、比如可能會生成一個人咬餅幹的視頻,但之後餅幹可能沒有咬痕。並且可能會難以遵循特定的運鏡軌跡。

OpenAI表示該模型缺乏空間意識可能會混淆左右,並且不理解人或物體如何與場景交互。可以看出,Sora和文生圖一樣,普遍存在生成內容不夠精確的問題,所以,從這個角度而言,它離真正顛覆影視行業還有很大一段距離。隨着這兩年人工智能熱潮的持續推進,相關產品也備受爭議。但不得不承認,這些新的工具和產品正在逐漸改變我們的工作和生活方式,一個新的智能世界,正在走來。未來誰能快速掌握這些AI工具和技術,誰才是真正的掌控者。

       原文標題 : OpenAI首個AI視頻模型Sora的顛覆與爭議



標題:OpenAI首個AI視頻模型Sora的顛覆與爭議

地址:https://www.utechfun.com/post/333642.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡