專題:OpenAI發布文生視頻模型
雷遞網 雷建平 2月16日
AI正在加速行業變革。OpenAI其正探索視頻數據生成模型的大規模訓練。
AI企業OpenAI今日正式發布視頻生成模型sora,Sora是視覺數據的通用模型,它可以生成不同時長、長寬比和分辨率的視頻和圖像,最多可達一分鐘的高清視頻。
具體來說,Sora在可變持續時間、分辨率和寬高比的視頻和圖像上聯合訓練文本條件擴散模型。Sora利用對視頻和圖像潛在代碼的時空補丁進行操作的變壓器架構。
Sora能夠生成具有多個角色、特定類型的運動以及主體和背景的准確細節的復雜場景。該模型不僅了解用戶在提示中提出的要求,還了解這些東西在物理世界中的存在方式。
該模型對語言有深入的理解,使其能夠准確地解釋提示並生成引人注目的字符來表達充滿活力的情感。Sora還可以在單個生成的視頻中創建多個鏡頭,准確地保留角色和視覺風格。
OpenAI的結果表明,擴展視頻生成模型是構建物理世界通用模擬器的一條有前途的途徑。
比如,一位時尚女性走在充滿溫暖霓虹燈和動畫城市標牌的東京街道上。
她穿着黑色皮夾克、紅色長裙和黑色靴子,拎着黑色錢包。她戴着太陽鏡,塗着紅色口紅。她走路自信而隨意。街道潮溼且反光,在彩色燈光的照射下形成鏡面效果。許多行人走來走去。
比如,與春節喜慶氛圍相關的舞龍表現,現場聚集不少人員,有小孩跟着舞龍隊走,還有不少人掏出手機邊跟邊拍,海量人物角色各有各的行爲。
Sora展示的海龜也是栩栩如生。
比如,幾只巨大的毛茸茸的猛獁象正踏着白雪皚皚的草地走近,它們長長的毛茸茸的皮毛在風中輕輕飄動,遠處覆蓋着積雪的樹木和雄偉的雪山,午後的陽光下有縷縷雲彩,太陽高掛在天空中。”
距離產生了溫暖的光芒,低攝像頭視角令人驚嘆地捕捉到了大型毛茸茸的哺乳動物,具有美麗的攝影和景深。”
比如,動畫場景的特寫鏡頭是一個毛茸茸的小怪物跪在一根融化的紅色蠟燭旁邊。藝術風格是3D和現實的,重點是燈光和紋理。這幅畫的基調是驚奇和好奇,怪物睜大眼睛、張开嘴巴凝視着火焰。它的姿勢和表情傳達出一種天真和俏皮的感覺,就好像它第一次探索周圍的世界一樣。暖色調和戲劇性燈光的使用進一步增強了圖像的舒適氛圍。
OpenAI CEO Sam Altman已經在线接單,稱今天开始爲有限數量的創作者提供訪問權限。“remarkable moment.(非凡的時刻。)”
從目前的效果來看,這對廣告行業、動畫行業、對影視行業可能都會產生一系列的變革。
一位創業者指出,從文字到圖片,再到視頻,每次的驚豔只是因爲這些是人類可以感知的。智能在感知以外的領域更是星辰大海,而且也已經早就在發生了,現在只是給人類做個小表演而已。
一位投資行業人士稱,加速超級個體時代的到來。未來各個領域包括金融、內容、醫療、咨詢等人力資本行業可能都會出現大量solo組織,如何能更好的使用各種軟件,AI工具和創造力將會成爲核心競爭力。
海量資訊、精准解讀,盡在新浪財經APP責任編輯:常靖蕾
標題:OpenAI推視頻生成模型sora:可以假亂真 超級個體時代或加速到來
地址:https://www.utechfun.com/post/332701.html