徹底炸了!今天,又一次見證歷史!

2024-02-17 18:10:33    編輯: robot
導讀   來源:中國基金報   中國基金報 泰勒   兄弟姐妹們啊,OpenAI發布新工具Sora,可根據文字生成逼真AI視頻,再一次,震驚了世界!   OpenAI首個視頻生成模型發布   OpenAI...

  來源:中國基金報

  中國基金報 泰勒

  兄弟姐妹們啊,OpenAI發布新工具Sora,可根據文字生成逼真AI視頻,再一次,震驚了世界!

  OpenAI首個視頻生成模型發布

  OpenAI推出了一項新技術,發布了視頻大模型Sora,進化到了可以通過文字描述直接生成高度擬真的視頻,不僅是動畫了。

  可以說,Sora出道即王炸,它能夠根據用戶的一句話生成長達一分鐘的視頻,且視頻流暢度和穩定性皆在水准之上。

  目前官網上已經更新了48個視頻demo,在這些demo中,Sora不僅能准確呈現細節,還能理解物體在物理世界中的存在,並生成具有豐富情感的角色。該模型還可以根據提示、靜止圖像甚至填補現有視頻中的缺失幀來生成視頻。

  Runway Gen 2、Pika等AI視頻工具,都還在突破幾秒內的連貫性,而OpenAI,已經達到了史詩級的紀錄。

  對比AI視頻裏Runway、Pika、Google和Meta這些主流玩家, Sora的特別之處在於:

  1、能夠生成具有多個角色、特定類型動作和主題背景的復雜視頻,時長可達到1分鐘。

  2、可以在單個生成的視頻中創建多個鏡頭,模擬復雜的攝像機運鏡,同時准確地保持角色和視覺風格。

  3、最重要的是,它不僅理解用戶在提示中要求的內容,還能自己理解這些事物在現實世界中的存在方式。

  OpenAI首席執行官奧特曼(Sam Altman)周四在X網站上讓該平台用戶把自己想給Sora的文字描述提交給他。然後,他分享了Sora根據這些描述生成的視頻。

  “我們想向你們展示Sora能做什么,”他在X上寫道,“不用擔心你的要求太細,或是難度太大!”

  有人提出想要“一段海上自行車比賽的視頻,讓各種動物作爲運動員騎自行車,採用無人機拍攝視角”。奧特曼在回復中發布了一段由Sora生成的視頻,視頻中有企鵝、海豚和其他水生生物騎自行車。

  另一段視頻顯示,一位身穿圍裙、面帶微笑的白發女士邀請觀衆進入她的廚房。有人向奧特曼要一段“由一名祖母輩的網紅主持的自制團子烹飪課程,背景是一個質樸的托斯卡納鄉村廚房,並配有電影級的燈光”,之後Sora生成了這段AI視頻。

  OpenAI發布了多個Sora生成的視頻,大家可以感受一下。或許已經很難再分清,AI和現實的界限了。

  “雪後的東京熙熙攘攘。鏡頭穿過繁忙的街道,跟隨着幾位享受着美麗雪景和在附近攤位購物的人們。美麗的櫻花瓣伴隨着雪花在風中飄舞”。

  “一位時尚女性走在充滿溫暖霓虹燈和動畫城市標牌的東京街道上。她穿着黑色皮夾克、紅色長裙和黑色靴子,拎着黑色錢包。她戴着太陽鏡,塗着紅色口紅。她走路自信又隨意。街道潮溼且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去”。

  一位時髦女士漫步在東京街頭,周圍是溫暖閃爍的霓虹燈和動感的城市標志。

  “讓Sora生成一張中國龍年舞龍的視頻”。

  AI想象中的龍年春節,紅旗招展人山人海。

  有緊跟舞龍隊伍擡頭好奇觀望的兒童,還有不少人掏出手機邊跟邊拍,海量人物角色各有各的行爲。

  “穿過東京郊區的火車窗外的倒影”。

  “賽博朋克背景下機器人的生活故事”。

  “幾只巨大的毛茸茸的猛獁象正踏着白雪皚皚的草地走來,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處覆蓋着積雪的樹木和雄偉的雪山,午後的陽光下有縷縷雲彩,太陽高掛在天空中。”距離產生了溫暖的光芒,低攝像頭視角令人驚嘆地捕捉到了大型毛茸茸的哺乳動物,具有美麗的攝影和景深。

  “電影預告片講述了30歲宇航員戴着紅色羊毛針織摩托車頭盔的冒險經歷,藍天、鹽漠,電影風格,35毫米膠片拍攝,色彩鮮豔”。

  “一個華麗的珊瑚礁紙藝世界,到處都是五顏六色的魚和海洋生物”。

  “鏡頭跟隨一輛帶有黑色車頂行李架的白色老式SUV,它在陡峭的山坡上一條被松樹環繞的陡峭土路上加速行駛,輪胎揚起灰塵,陽光照射在SUV上行駛土路,給整個場景投射出溫暖的光芒。土路緩緩地蜿蜒延伸至遠方,看不到其他汽車或車輛。道路兩旁都是紅杉樹,零星散落着一片片綠意。從後面看,這輛車輕松地沿着曲线行駛,看起來就像是在崎嶇的地形上行駛。土路周圍是陡峭的丘陵和山脈,上面是清澈的藍天和縷縷雲彩”。

  網友直呼工作要丟了!

  甚至有人已經开始“悼念”一整個行業!

  Sora目前存在的弱點

  對於Sora目前存在的弱點,OpenAI也不避諱:模型在准確性方面可能會遇到困難,也可能無法理解具體的因果關系實例。

  例如“五只灰狼幼崽在一條偏僻的碎石路上互相嬉戲、追逐”,狼的數量會變化,一些憑空出現或消失。

  該模型還可能混淆提示的空間細節,例如混淆左右,並且可能難以精確描述隨着時間推移發生的事件,例如遵循特定的相機軌跡。

  如提示詞“籃球穿過籃筐然後爆炸”中,籃球沒有正確被籃筐阻擋。

  現在,Sora正面向部分成員开放,以評估關鍵領域的潛在危害或風險。

  OpenAI表示,這項技術仍存在一些缺陷,包括一些空間問題。

  該公司表示,它意識到Sora有可能制造錯誤信息和仇恨內容等。研究人員說,AI驅動的深度僞造已成爲一種風險,可能會在2024年總統大選前給公衆造成困惑。

  OpenAI表示,被選來測試Sora可被濫用方式的專家組將就如何加強對該系統的保護提供反饋意見。

  該公司表示:“我們也在开發有助於檢測誤導性內容的工具,比如檢測分類器,它可以分辨視頻是何時由Sora生成的。”

責任編輯:張迪



標題:徹底炸了!今天,又一次見證歷史!

地址:https://www.utechfun.com/post/333068.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡