對標Sora！國產視頻大模型Vidu發布

2024-04-29 18:40:09 編輯： robot

導讀今年初，文生視頻大模型Sora的亮相引發行業高度關注，也在資本市場上掀起浪潮。時隔兩個月，清華團隊打造了一個中國版的Sora——視頻大模型Vidu近日正式發布。近期爭。 01 清華團隊參與打造 Vi...

今年初，文生視頻大模型Sora的亮相引發行業高度關注，也在資本市場上掀起浪潮。時隔兩個月，清華團隊打造了一個中國版的Sora——視頻大模型Vidu近日正式發布。近期爭。

清華團隊參與打造

Vidu性能強勁

4月27日，在中關村論壇未來人工智能先鋒論壇上，中國首個長時長、高一致性、高動態性視頻大模型Vidu正式發布。據悉，Vidu視頻大模型是由清華大學與生數科技聯合發布的中國首個長時長、高一致性、高動態性視頻大模型。這一模型的發布，標志着中國在視頻大模型技術領域取得了顯著的進展，能夠與國際上的先進模型如Sora相媲美。

據介紹，Vidu模型採用了團隊原創的Diffusion與Transformer融合的架構U-ViT，支持一鍵生成長達16秒、分辨率高達1080P的高清視頻內容。

性能方面，Vidu不僅能夠模擬真實物理世界，生成細節復雜且符合真實物理規律的場景，如合理的光影效果和細膩的人物表情，還擁有豐富的想象力，能夠創造出具有深度和復雜性的超現實主義內容。

此外，Vidu能夠生成復雜的動態鏡頭，實現遠景、近景、中景、特寫等不同鏡頭的切換，不再局限於簡單的固定鏡頭。特別值得一提的是，Vidu能夠理解並生成熊貓、龍等特有的中國元素，展現了對中國傳統文化的深刻理解。

同時，Vidu的生成方式是“一步到位”的，文本到視頻的轉換直接且連續，基於單一模型完全端到端生成，不涉及中間的插幀和其他多步驟的處理，這在技術上是一個重要的創新。

背後公司生數科技受關注

Vidu背後依托的是一家名爲生數科技的創業公司，該公司核心成員主要來自清華大學人工智能學院，致力於自主研發世界領先的可控多模態通用大模型。生數科技的CEO唐家渝、首席科學家朱軍以及CTO鮑凡，都是在人工智能和擴散模型領域有着深厚研究的專家。

生數科技自成立以來，就備受資本市場的關注，已經完成了三輪融資，融資額達到數億元人民幣。投資方包括啓明創投、智譜AI、BV百度風投、錦秋基金等知名投資機構。公司的快速發展和Vidu模型的成功研發，展示了生數科技在多模態大模型領域的深厚積累和創新能力。

在人工智能領域，生數科技採取的是模型層和應用層並行推進的模式，一方面構建底層通用大模型，提供模型服務能力；另一方面，打造針對圖像生成、視頻生成等場景的垂直應用，服務於遊戲制作、影視後期等內容創作場景。

大模型將成未來發展重要一環

大模型技術作爲人工智能領域的一個重要分支，其未來的發展前景十分廣闊，無疑將成爲未來發展的重要一環。隨着技術的不斷進步，其應用場景將進一步拓展，從視頻和圖像生成，到遊戲制作、影視後期等內容創作，大模型技術將爲各行各業帶來革命性的變化，在多個領域發揮更加重要的作用。

首先，大模型技術通過其強大的數據處理和學習能力，正成爲推動人工智能技術創新的關鍵因素。它們能夠處理和學習海量數據，從而在圖像識別、自然語言處理、機器翻譯等多個領域實現前所未有的准確性和效率。

其次，大模型正成爲多行業應用的推動者。大模型的跨領域應用潛力巨大，可以被應用於醫療健康、金融服務、教育培訓、自動駕駛、智能制造等衆多行業。通過提供深度分析和預測，大模型能夠幫助這些行業提高決策質量，優化服務流程，降低成本，並創造新的商業模式。

此外，大模型技術在提高生產效率、降低運營成本、創造新的就業機會等方面的潛力，將對經濟結構產生深遠影響，可能會成爲推動經濟轉型和產業升級的關鍵驅動力。

- End -

原文標題 : 對標Sora！國產視頻大模型Vidu發布

標題：對標Sora！國產視頻大模型Vidu發布

地址：https://www.utechfun.com/post/364546.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤： Vidu 生數科技

上一篇:年內漲108%，優必選市值衝擊千億，人形機器人賽道前景廣闊

下一篇:對標文生視頻模型Sora，中國挑战者Vidu只差一點

您現在的位置：首頁人工智能

對標Sora！國產視頻大模型Vidu發布

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能