作者 | 麻吉編輯 | 劉景豐
一年前AI智能湧現的場景又重現。2024开年,Sora就引發了全球科技圈的集體躁動。當地時間2月15日,OpenAI發布最新視頻生成模型Sora。根據OpenAI描述,Sora可根據用戶輸入的簡短文本指令,生成長達1分鐘的高清視頻,並創建具有多個角色、特定類型的運動以及准確的主題和背景細節的復雜場景。讓全球受衆感到驚嘆的,是Sora生成視頻中極具真實感的畫面呈現,甚至還帶着些許電影質感。
圖源:OpenAI網站截圖
在OpenAI發布的一系列不同主題視頻中,不論是戴墨鏡女子走在東京街頭的場景,或是動畫人物的細節塑造,雖然這些內容完全由AI生成,但其中細節呈現出的畫面真實感已經進入一個全新維度。這讓不少網友感嘆,現實的邊界正在數字世界中變得愈發模糊。正如OpenAI 在Sora技術報告的標題中赫然寫道的,“ Sora 這類視頻生成模型是「世界的模擬器」”。
對中國出海企業來說,AI技術推動下內容生產力的大幅提升,也將進一步助力產業升級,並加速企業的全球化步伐。而TikTok平台上,已經开始充斥各種由AI生成的視頻瘋狂吸粉。
去年初,OpenAI發布的大語言模型ChatGPT掀起了一輪人工智能的熱潮。ChatGPT上线後,幾乎所有全球科技大廠都全速投入AI領域,發布了自己的大語言模型,影響着人們日常搜索信息、查找資料的方式發生改變。而文生視頻模型Sora的發布,更直觀地呈現了AI技術正在以何種速度飛速發展。在社交媒體X上一條Sora演示視頻下方,特斯拉創始人馬斯克發表評價說“gg 人類”(gg爲Good Games縮寫,代指“打得好,我認輸”)。他還表示,由人工智能增強的人類,將會在未來幾年之內創作出最傑出的作品。360集團創始人、董事長周鴻禕則表示,Sora的誕生意味着AGI的實現將從10年縮短至1年。“Sora把AI視頻能力推到了一個新的階段,是走向實用化的开始。
視頻生產成本將大幅降低,所需要的技能也將和以前完全不同。以前的技能是如何找到優質的拍攝團隊,場地,以及合適的價格進行產品視頻拍攝,如何協調和溝通。之後的技能是如何寫prompt,如何讓AI把自己的產品不失真的融入到視頻裏,如何讓視頻看起來真實清晰有質感。”Passioncy創始人郭林告訴霞光社。就在近日,OpenAI的TikTok账號上,各種由AI生成的視頻瘋狂吸粉,在短短數天時間內吸粉超10萬,獲得超50萬次點贊。網友們紛紛留言感慨,短視頻創作者是否即將會被AI搶了飯碗,甚至連TikTok平台都會受到影響。雖然Sora還未正式开放給用戶使用,但已經在資本市場掀起波瀾。市場預計,在最新一輪由風投公司ThriveCapital牽頭的融資中,OpenAI的估值有望超過800億美元。作爲對比,去年年初OpenAI發布ChatGPT不久後的估值約爲290億美元。
圖源:Unsplash
而在Sora發布次日,幾家美國科技公司的股價便應聲跌落。據媒體報道,美國電腦軟件公司Adobe股價暴跌超7%;美國圖片庫、圖片素材、圖片音樂和編輯工具供應商Shutterstock跌超5%;幾周前發布了“文生視頻”工具Lumiere的谷歌母公司股價下挫1.58%。一天以內,這三家公司的市值就合計蒸發了近480億美元(折合人民幣近3500億元)。
對不少行業來說,Sora就像是一顆“重磅炸彈”,讓從業者在展望未來時既興奮又感到惶恐不安。其中,影視業首當其衝。在傳統的影視制作過程中,後期及特效制作往往需要投入大量人力、物力和時間,而Sora等AI工具將大大降低這些成本,幫助影視制作公司快速創建出高質量的視頻片段,縮短制作周期。在正舉行的柏林電影節上,Sora就成爲電影人熱議的話題之一。據外媒報道,洛杉磯導演戴夫·克拉克(Dave Clark)認爲,創作者需要接受人工智能技術來制作尚未想象或實現的內容,而不是感到威脅。德國視覺特效工作室Trixter的董事總經理克裏斯蒂娜·卡斯珀斯-羅默(Christina Caspers-Roemer)則表示,像Sora這樣的人工智能工具被證明在工作流程中更高效、更快,但即便如此,電影和電視制作將仍然以人類創作爲基礎。“最終我們的客戶總會回到現實世界。”她說。
從ChatGPT、DALL-E3,再到Sora,AI內容創作已經從圖文席卷至視頻創作領域。而實際上,Sora並不是第一個受到關注的文生視頻大模型。近年,全球科技大廠幾乎無一例外地重金投入人工智能領域,並計劃在未來持續甚至加大投入。在Sora正式亮相以前,大部分全球頭部科技企業就已擁有自己的文生視頻大模型。去年11月,文生視頻模型迎來了一波爆發。11月3日,Runway發布Gen-2更新,支持4K清晰度作品;11月16日,Meta發布文生視頻大模型Emu Video;11月18日,字節跳動發布PixelDance;11月21日,Stability AI發布生成式視頻模型Stable Video Diffusion……今年1月,谷歌也發布了視頻生成模型Lumiere,專門用於將文本轉換爲視頻。目前,Sora仍處於开發早期階段,OpenAI表示,當前的模式仍然存在不少弱點。
Sora可能難以准確模擬復雜場景的物理原理,也可能無法理解因果關系的具體實例。例如,一個人可能咬了一口餅幹,但之後,餅幹上可能沒有咬痕。此外,該模型還可能混淆提示的空間細節,例如混淆左和右,並且可能難以精確描述隨時間發生的事件。而細心的網友也在Sora的演示視頻中發現了不少Bug。“比如在Sora生成的一個視頻中,呈現的是中國農歷新年舞龍的場景,雖然視頻裏龍身上和建築上的文字很像是中國書法撰寫的字體,但實際上並不是中國字,誰也不認識寫的是什么,感覺只是AI臆想出來的中文。另一個視頻裏的貓,動起來的時候有三只前腳。”關注AI行業的一名讀者向霞光社表示。
圖源:OpenAI網站截圖
但即使如此,不論在生成視頻時長、實現單視頻多機位、擁有精准物理規則的真實世界等技術層面,Sora均已實現“碾壓式”領先其他文生視頻模型,推動AI視頻生成進入了一個新的時代。
Sora這樣的生成式AI工具,在降低成本和提高效率方面的顯著優勢,爲內容創作、廣告娛樂等行業帶來了前所未有的發展契機,也讓不同類型的中國出海企業看到了機會。此前,一些企業將ChatGPT應用於多個場景之中,實現降本增效。AMZ123的一項調查數據顯示,2023年,有33%的跨境公司使用ChatGPT,另有將近15%的公司預計將投入使用。如今Sora尚未完全开放使用,但可以想見,通過更精准的生成式人工智能,不論是制作TikTok等平台短視頻,或是爲自己的產品制作介紹視頻和推廣營銷視頻,都將能大大降低成本、提升效率。
“如何通過AI來生產真正能落地的視頻,是大家开始摸索的東西。Sora給行業帶來了顛覆性的影響,誰先用上包括Sora在內的新AI技術,誰就能喫到第一波行業紅利。”Passioncy創始人郭林說,“中國公司出海肯定要充分利用好現有的AI能力。對於中小企業,尤其很多工貿一體企業來說,難度其實是非常高的。這也是我們目前希望提供幫助的一個方向。”一名廣告行業資深從業者也告訴霞光社,她認爲Sora將顛覆旅遊、生活方式和服務行業的內容。隨着視頻制作過程變得更簡單,大品牌廣告和小品牌廣告之間的界限將逐步縮小,而“講故事”等內容創意環節,將再次成爲廣告中最重要的因素。
圖源:Unsplash
而在遊戲出海領域,Share Creators創始人兼CEO Ada Liu認爲,視頻生成帶來的改變將是“跨時代”的。
“在遊戲行業, AI可以幫助生成前期的概念圖,UI icon等。計算機圖形制作的流程非常長,從3D制作,到渲染、合成,每個環節都需要投入大量專業的人員。尤其在風格探索階段,如果直接生產出視頻,相當於直接跳到最後一步,節省了大量的制作時間和成本。”但 Ada Liu同時認爲,AI生成內容想要完全取代人工還存在不少距離。“可能再發展一兩年,能取代2D部分的一些低端批量制作工種。但主美之類定方向的美術人員,是不會被取代的。畢竟一個產品的美術風格需要人來選擇。”Ada表示,Sora的演示視頻效果令人印象深刻,但還是要關注實際上的效果,因爲目前無法試用,只能等等看。
而郭林也認爲,目前AI工具距離產出“真正能落地”的視頻,主要差距仍在於內容真實性,以及工具易用性兩個方面。根據IDC的預測,未來五年內,AIGC對於營銷、軟件測試等行業將帶來巨大影響。到2025年,35%的企業將掌握使用生成式人工智能來开發數字產品和服務。到2026年,生成式AI將承擔42%的傳統營銷瑣碎任務,如搜索引擎優化、內容和網站優化、客戶數據分析、細分、潛在客戶評分以及超級個性化。到2028年,基於生成式AI的工具將能夠編寫80%的軟件測試工作,從而減少對人工測試的需求,提高測試覆蓋率、軟件可用性和代碼質量。可以預見的是,即便AI生成內容仍然面臨道德和濫用方面的潛在風險,但其在創造力和效率方面的無限潛力,將持續吸引全球科技巨頭的加碼投入和爭奪。
原文標題 : 爆火的Sora,摩拳擦掌的出海人
標題:爆火的Sora,摩拳擦掌的出海人
地址:https://www.utechfun.com/post/335467.html