圖片來自視覺中國
藍鯨新聞12月23日訊(記者 武靜靜)昔日自動駕駛明星公司圖森未來在經歷退市等一系列風波後,已經重新選擇了創業航向。
2024年8月,公司首次透露將瞄准AIGC方向,四個月後的12月17日,公司宣布啓用全新品牌CreateAI,並發布了其首個圖生視頻大模型產品“Ruyi”。
目前,Ruyi-Mini-7B版本已經在huggingface上正式开源,用戶可以從下載使用,據了解,“Ruyi”專爲在消費級顯卡(例如 RTX 4090)上運行。
從自動駕駛轉向AIGC,好調頭嗎?
公司爲何從自動駕駛邁向截然不同的視覺大模型賽道?
圖森未來技術負責人在接受藍鯨新聞專訪時告訴藍鯨新聞,此次轉型主要是從公司轉型和業務發展的角度出發。一方面,公司此前在做自動駕駛時已經在AI領域積累了算法、算力和數據經驗;另一方面,聯合創始人陳默在遊戲圈有資源積累,有機會快速將技術落地。
陳默也在此前接受媒體採訪時提到,圖森未來在試圖尋找一條更快能夠依靠現有資源“救活”公司的路,隨着視覺模型技術的不斷推進和公开,AIGC成爲在商業化空間、技術可達性方面都符合條件的一個目前的最佳選擇。
據藍鯨新聞了解,圖森未來做視覺模型的團隊就是此前公司做自動駕駛的團隊,一些技術經驗可以復用。
圖森未來技術負責人談道,AI視覺模型和自動駕駛都依賴於算法、算力和數據這“三駕馬車”來推動技術發展,且兩者都依賴大量的數據進行訓練和優化。而視頻生成技術與自動駕駛中的感知模塊非常相似,兩者都以數據驅動爲主,研發路徑相對較短,依賴的技術基礎也比較清晰。
在他看來, 自動駕駛技術涉及感知、定位、規劃、控制等多個算法模塊,以及軟件系統、硬件設計、車輛結構設計等多個領域。相比之下,視頻模型技術的研發路徑更短,技術面更窄,主要集中在數據處理和模型訓練方面。
“數據的重要性甚至超過算法,”圖森未來技術負責人強調,他提到圖森在自動駕駛領域積累了豐富的數據標注經驗,擁有自建的標注團隊和標注平台,並建立了完整的數據處理流程。 “這些經驗和工具可以直接應用到視頻模型的數據准備階段,從而節省大量時間和成本。”
當然,在很多視覺模型的技術和效果上,圖森還需要從零开始探索。目前,公司視頻模型主要圍繞五大關鍵指標進行:生成質量、一致性、可控性、易用性和成本。
圖森未來技術負責人告訴藍鯨新聞,模型生成質量是首要目標, 確保生成的視頻內容在畫面、動作、細節等方面達到高水平。“公司採取螺旋上升式的研發策略,在保證生成質量和一致性的前提下,逐步提升模型的可控性、易用性和成本效益。”
圖森選擇第三條路:不靠模型賺錢,自己下場做內容
當下,視覺模型領域新進展不斷,當地時間12月9日,美國OpenAI公司正式發布了最新版本的視頻生成大模型Sora-Turbo,它能夠根據文本、圖像或視頻輸入生成新的視頻內容。此外,國內市場,不論是字節、快手等大型科技巨頭,還是創業公司Pika、愛詩科技、生數科技等都在持續有緊鑼密鼓的推進技術和產品迭代。
圖森的入局是否是想在競爭激烈的視覺大模型賽道分一杯羹?
從目前公司的業務進展和採訪中得知,這個答案是否。圖森未來技術負責人告訴藍鯨新聞,更准確的說法是,圖森未來要成爲一家內容公司而非大模型技術公司,和快手等平台以及Pika等創業公司的方向並不相同。
目前,市面上視覺大模型的商業模式無非兩種:一類是Runway、Pika等公司,面向C端用戶,提供付費的視頻生成工具或服務,讓創作者付費自制內容;另一類是面向B端影視文娛以及遊戲等公司,幫助產業降本增效。
圖森未來技術負責人向藍鯨新聞談道,如果定位成純粹的視頻模型公司,to C和to B都存在明顯挑战:
一方面,to C方向,視頻生成工具的目標用戶群是專業創作者,而非普通大衆,收費模式和盈利前景都不明確,且視頻模型需要大量的算力支持,運營成本高,國內市場,很難在短期內依靠收費,吸引用戶並實現盈利。
另一方面,單純面向B端的技術賦能落地挑战巨大,因爲技術公司很難深入了解具體場景的需求,也很難將技術有效地融入到實際的制作流程中,控制內容的質量和風格。
相比很多視頻模型正在將重心瞄准在追求技術的通用性上,圖森選擇了不一樣的第三條路:直接把模型技術开源,不靠模型賺錢,並購入了經典IP,自己下場用大模型做內容。
據藍鯨新聞了解,公司目前有專門的動漫和遊戲團隊已經在开發新項目。
“我們希望打造一家以AI技術驅動的視頻內容創作公司,打造端到端的視頻內容生成鏈條。最終通過優質內容來吸引用戶和實現商業價值。”圖森未來技術負責人說道。“技術只是工具,最終的目標是爲用戶提供內容。”
目前,圖森已經布局動漫、遊戲板塊,其全新品牌CreateAI已經獲著名武俠IP《金庸群俠傳》正版授權,將开發一款大型武俠开放世界RPG遊戲。2024年8月,公司也官宣了和上海三體動漫有限公司達成合作,共同开發《三體》系列的首部動畫長篇電影和視頻遊戲。據悉,公司也會在12月推出 SLG 遊戲工具和遊戲本身。
“我們現在擁有「金庸群俠傳」和「三體」這兩個頂級 IP,我們的目標是在 2027 年實現 10 億美元的收入。”陳默在最近一次接受採訪時說到了圖森在AIGC方向的未來目標。
原文標題 : 鯨對話|圖森未來爲何要從自動駕駛駛轉向AIGC?
標題:鯨對話|圖森未來爲何要從自動駕駛駛轉向AIGC?
地址:https://www.utechfun.com/post/460258.html