今年初,文生視頻大模型Sora的亮相引發行業高度關注,也在資本市場上掀起浪潮。時隔兩個月,清華團隊打造了一個中國版的Sora——視頻大模型Vidu近日正式發布。近期爭。
01
清華團隊參與打造
Vidu性能強勁
4月27日,在中關村論壇未來人工智能先鋒論壇上,中國首個長時長、高一致性、高動態性視頻大模型Vidu正式發布。據悉,Vidu視頻大模型是由清華大學與生數科技聯合發布的中國首個長時長、高一致性、高動態性視頻大模型。這一模型的發布,標志着中國在視頻大模型技術領域取得了顯著的進展,能夠與國際上的先進模型如Sora相媲美。
據介紹,Vidu模型採用了團隊原創的Diffusion與Transformer融合的架構U-ViT,支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容。
性能方面,Vidu不僅能夠模擬真實物理世界,生成細節復雜且符合真實物理規律的場景,如合理的光影效果和細膩的人物表情,還擁有豐富的想象力,能夠創造出具有深度和復雜性的超現實主義內容。
此外,Vidu能夠生成復雜的動態鏡頭,實現遠景、近景、中景、特寫等不同鏡頭的切換,不再局限於簡單的固定鏡頭。特別值得一提的是,Vidu能夠理解並生成熊貓、龍等特有的中國元素,展現了對中國傳統文化的深刻理解。
同時,Vidu的生成方式是“一步到位”的,文本到視頻的轉換直接且連續,基於單一模型完全端到端生成,不涉及中間的插幀和其他多步驟的處理,這在技術上是一個重要的創新。
02
背後公司生數科技受關注
Vidu背後依托的是一家名爲生數科技的創業公司,該公司核心成員主要來自清華大學人工智能學院,致力於自主研發世界領先的可控多模態通用大模型。生數科技的CEO唐家渝、首席科學家朱軍以及CTO鮑凡,都是在人工智能和擴散模型領域有着深厚研究的專家。
生數科技自成立以來,就備受資本市場的關注,已經完成了三輪融資,融資額達到數億元人民幣。投資方包括啓明創投、智譜AI、BV百度風投、錦秋基金等知名投資機構。公司的快速發展和Vidu模型的成功研發,展示了生數科技在多模態大模型領域的深厚積累和創新能力。
在人工智能領域,生數科技採取的是模型層和應用層並行推進的模式,一方面構建底層通用大模型,提供模型服務能力;另一方面,打造針對圖像生成、視頻生成等場景的垂直應用,服務於遊戲制作、影視後期等內容創作場景。
03
大模型將成未來發展重要一環
大模型技術作爲人工智能領域的一個重要分支,其未來的發展前景十分廣闊,無疑將成爲未來發展的重要一環。隨着技術的不斷進步,其應用場景將進一步拓展,從視頻和圖像生成,到遊戲制作、影視後期等內容創作,大模型技術將爲各行各業帶來革命性的變化,在多個領域發揮更加重要的作用。
首先,大模型技術通過其強大的數據處理和學習能力,正成爲推動人工智能技術創新的關鍵因素。它們能夠處理和學習海量數據,從而在圖像識別、自然語言處理、機器翻譯等多個領域實現前所未有的准確性和效率。
其次,大模型正成爲多行業應用的推動者。大模型的跨領域應用潛力巨大,可以被應用於醫療健康、金融服務、教育培訓、自動駕駛、智能制造等衆多行業。通過提供深度分析和預測,大模型能夠幫助這些行業提高決策質量,優化服務流程,降低成本,並創造新的商業模式。
此外,大模型技術在提高生產效率、降低運營成本、創造新的就業機會等方面的潛力,將對經濟結構產生深遠影響,可能會成爲推動經濟轉型和產業升級的關鍵驅動力。
- End -
原文標題 : 對標Sora!國產視頻大模型Vidu發布
標題:對標Sora!國產視頻大模型Vidu發布
地址:https://www.utechfun.com/post/364546.html