即夢對陣可靈,重演抖音反超快手

2024-12-27 18:40:21    編輯: robot
導讀 快手可靈,只是抖音即夢的下一個目標罷了。 撰文|藍洞商業 趙衛衛 年初從抖音 CEO 位置上辭職的張楠,應該度過了一個充實的 2024 年。 在中央美術學院設計學院四層階梯空間裏,張楠這位曾經的藝術...

圖片

快手可靈,只是抖音即夢的下一個目標罷了。

撰文|藍洞商業 趙衛衛

年初從抖音 CEO 位置上辭職的張楠,應該度過了一個充實的 2024 年。

在中央美術學院設計學院四層階梯空間裏,張楠這位曾經的藝術生坐在 C 位,微笑着與一群大學生合影留念,她是評委之一。這是一場 AI 交互創新大賽的分享交流會,主辦方就是張楠如今負責的業務重點:剪映旗下的 AI 產品即夢,這被視作一款可能再造抖音的產品。

幾天之後,張楠公开把即夢定義爲「想象力世界」的相機,而抖音是一個「真實世界」的相機。

要打造想象力的世界,創新的來源更多是年輕的頭腦。抖音的成功離不开年輕的高校學生,他們曾是抖音早期運營團隊關注的重點人群,各種經典的挑战類活動,都是靠着這些年輕的創作者們踊躍參與而不斷傳播开來,但與早年間抖音運營沒什么錢、靠打感情牌不同,如今,即夢 AI 交互創新大賽一等獎是 10 萬元的獎金。

得獎人趙純想並不是學生,而是一個年輕的獨立开發者,此前憑借一款飲食記錄的產品「胃之書」嶄露頭角。而這次獲獎的作品,是一個 AI 視頻生成鏡頭精細控制 UIUX 方案,在展示的 2 分鐘 Demo 中,導入一張《天堂電影院》的經典場景圖,用戶就可以生成一段視頻,實現推拉鏡頭、特寫、窗外鮮花盛开等 AI 創作。

而在即夢面世前三個月,快手可靈已經在國內率先上线了視頻生成大模型,它們同樣沒有忽視高校裏的年輕人,快手可靈與中國美術學院等高校聯合舉辦了 AI 創作大賽,獲得一等獎的三個作品,聚焦生活、廣告和自由發揮主題,分別拿到了獎金 36666 元。

Sora 打开了爲真實世界建模的 AI 大門,即夢和可靈則順着抖音和快手走過的路,用更飽和式投入,以大力出奇跡。

更大的競爭就在不遠的 2025 年,網傳一份對字節跳動 AI 視頻生成產品的調研紀要顯示,「字節希望在其生態內使用 AI 能力,認爲明年各生態將形成競爭閉環。明年五一之前,扣子智能體平台、豆包、抖音和 B 端的能力會形成關聯的生態網,文生視頻將會有更多的體現和使用場景。」

2025 年,在電商廣告、短劇等多個市場,抖音即夢或許將與快手可靈正面交鋒。

高开難高走

「高开低走」與「低开高走」,是現在抖音即夢與快手可靈最大的差別。

QuestMobile 最新數據顯示,即夢上线當天即在抖音平台引發了高漲的討論熱度,可靈 AI 通過熱度的持續積累也在快手站內出現熱度峰值。但一個明顯的不同是,即夢的內容互動量在一個月高开低走,而可靈的內容互動量在一個月內低开高走。

圖片

這是推廣策略、用戶體驗、市場競爭等多種因素共同作用的結果,但一個最直接的原因,可能就是即夢的產品發布較晚,體驗不如預期,用戶深入使用之後,很容易區分與同類產品在生成內容上的質量和穩定性,即便初始階段獲得了大量預熱,目前即夢在熱度上仍不及可靈。

這並非意味着即夢的絕對落後,有 AI 產品深度使用的用戶認爲,當下國產 AI 產品想要用好,就不能單用一個,尤其是在文生視頻創作中,用戶選擇的做法往往是用即夢來做前期的文生圖,然後再用可靈來制作圖生視頻,因爲「即夢的 AI 生圖比較優秀」。

字節調研紀要同樣顯示即夢和可靈之間差距很大,即夢日活用戶在 20 萬-22 萬之間,其中 70% 爲個人或小型 MCN 工作室,大型企業較少,付費用戶 2.5 萬人左右,月訂閱付費均價在 50 元左右;而同期可靈服務用戶超 500 萬,累計付費用戶超 200 萬,付費金額累計約千萬級別。

這種調研紀要難辨虛實,因爲二級市場爆火的「豆包概念股」,字節跳動官方曾對投資者們做出風險提示,以免遭受不必要的投資損失。

而快手可靈之所以「低开高走」,一方面是視頻生成大模型本身的能力更穩定,佔據了先發優勢,另外一面則是營銷策略的成功。「藍洞商業」在《快手可靈,把壓力給到了抖音剪映》中已經提到,當時快手通過海外科技大 V 測試可靈生成的案例,成功營造出其在海外市場火爆的氛圍,進而「出口轉內銷」。

半年過去,目前可靈在海外市場的關注度仍遠高於即夢,社交媒體 X 的關注人數是即夢的 67 倍。

就在張楠出現在火山引擎大會上,發布即夢最新消息的當天,快手又升級了可靈大模型,宣稱在內部評測中比此前 1.5 模型整體效果提升 195% 。而此前一個月的三季度財報會上,創始人程一笑也提到對可靈的憧憬:可靈 AI 的商業化單月流水超千萬人民幣,有信心在明年實現收入規模的快速增長。

「高开低走」的即夢希望成爲一種新的創造和體驗方式,根據調研紀要,明年即夢沒有明確的商業回報目標,但要有商業模式,「盈利要往後放」,明年即夢的重點將是與媒體、影視制作合作等產品形態的落地。

快手又將陷入包圍战

抖音不是第一個做短視頻的,卻在 2018 年开始超越快手,後來居上成爲短視頻賽道的第一。張楠曾總結過崛起的四個關鍵因素:全屏高清、音樂、特效濾鏡、個性化算法推薦技術。

如今,即夢對陣可靈,能否重演抖音對陣快手的故事?

即夢目前只是字節跳動在多模態大模型應用層的一款產品,隸屬於抖音旗下的剪映團隊,背後支撐服務的是字節跳動雲服務的火山引擎。在火山引擎官網的模型廣場上,字節跳動提供 20 個大模型產品,遍布文本、語音和視覺多個類型,此外火山方舟還提供月之暗面和智譜 AI 的產品。

AI 可能成爲字節跳動下一個核心業務支柱,相比之下,快手磁力引擎的官方網站上,很難找到相關大模型商業應用的展示位。

字節跳動在大模型領域的激進姿態,今年早已經通過 C 端的產品豆包展現出來。今年 9 月,移動數據調研機構 Sensor Tower 曾發布全球 AI 應用報告,其顯示了 ChatGPT 是 1-8 月全球下載量最多的 AI 應用,谷歌的 Gemini 排在第四,字節跳動的豆包排名第五,而且是榜單上唯一的中國產品。

這離不开抖音豐沛的流量廣告和投放支持,豆包和 Kimi 在今年的廣告市場上投放競爭激烈,根據廣告情報分析平台 AppGrowing 統計,豆包智能助手 4 月、5 月的投放金額接近 1800 萬元,等到 6 月上旬,投放金額飆升至 1.24 億元,而且在抖音站內限制了 Kimi 在內的大模型廣告投放。

「營銷預算方面,即夢在 12 月預算开始提升,明年第一季度,尤其是春節前後將提到億級別的投入。」字節調研紀要提到。而除了營銷,字節跳動在芯片底層儲備上也不可小覷。英國《金融時報》報道稱,字節跳動採購了約 23 萬片英偉達芯片,已成爲英偉達人工智能芯片的最大中國买家;The Information 也在 9 月份報道稱,字節跳動今年訂購了超過20 萬台 Nvidia H20。

所以基於豆包在國內大模型市場取得的領先地位,未來的看點是,抖音和豆包如何聯動即夢,這也意味着,快手一枝獨秀的可靈,將陷入字節跳動大模型的包圍战。

今年 9 月,對標 OpenAI 的 Sora,字節跳動發布了兩款對標文生視頻工具 PixelDance 和 Seaweed,即夢 AI 已經接入了豆包,其中支撐即夢的就包括能力更優秀的 PixelDance,官方介紹稱,能夠生成高質量的長達兩分鐘的 1080p 分辨率視頻,擅長描繪復雜的運動和物體之間的互動。

目前看,不論是抖音還是快手,AI 生成視頻最主要的落地場景都是趨同的,除了 C 端用戶收費之外,B 端場景一個是服務於短劇等影視制作和後期市場,另外一個則是服務於廣告和電商內容營銷,比如商品素材展示上生成不同的圖片。

在火山引擎大會上,張楠曾展示過兩個即夢創作者的 AI 短片,其中一個就是今年 7 月份上线的科幻短劇《覺醒》,當時在抖音單日點贊破 40 萬;而同一時期,快手的可靈也打造過一部《山海奇鏡之劈波斬浪》,同樣都屬於試水制作。

但實際上,AI 生成視頻對影視制作只是輔助性的,目前階段仍然是小規模制作,要完成大批量的影視後期制作,即夢和可靈都是順着 Sora 類似的 Dit 架構(一種結合了 Transformer 架構的擴散模型,用於圖像和視頻生成任務)在前進,都有很長一段路要走,商業化也尚爲時過早。

當谷歌擊敗Sora

OpenAI 的 Sora 开放使用之後,一系列生成視頻的表現並不符合外界的期待,而谷歌在近期發布的視頻生成器 Veo2,通過一系列測試表明,其有超過 Sora 的更驚豔表現。

尤其是一個最著名的切西紅柿的鏡頭,谷歌的 Veo2 刀子幹淨利落地切开西紅柿,避开了手指,而 Sora 視頻中的刀子卻切开了手,這讓 Sora 再次成爲群嘲的對象,也讓行業人士認爲,Sora 更偏向於運動,而 Veo2 則更注重物理的准確性。

有 AI 行業人士認爲,谷歌之所以能超越 Sora,不光是發現了 Sora 物理准確性的弱點,更在於其利用 YouTube 來訓練其人工智能模型。

字節跳動的技術團隊並非沒有發現 Sora 在物理准確性上的弱點。11 月,豆包大模型團隊曾發布過一篇論文,名爲《從世界模型的角度來看,視頻生成與之相距多遠:基於物理定律的視角》(《How Far is Video Generation from World Model: A Physical Law Perspective》),探究了視頻生成模型能否觀察事物間的相互關系,並從中提煉出一套穩定的物理規律。

「視覺模糊性會導致在細粒度物理建模方面出現顯著的誤差,單純依賴視頻表示不足以進行精確的物理建模。」該論文認爲,視頻生成模型要成爲准確的世界模型還面臨挑战。

而研究這個方向的兩位作者都非常年輕,一位是 95 後,一位是 00 後。如同即夢和可靈,都需要年輕的藝術學院的學生參與打造想象力的世界一樣,爲這個AI想象力世界奠定技術基礎的,同樣來自年輕的頭腦。兩位作者耗費8個月時間,就是爲了找到通往世界模型的一扇大門。

找到瓶頸需要 8 個月,而打破瓶頸可能需要耗費更長的時間。

抖音何時真正即夢?在那份調研紀要中,字節跳動明年的 AI 發展有三條主要路徑,一是豆包大家族生態;二是抖音等產品的全面 AI 化;三是包括即夢在內的多模態模型和世界大模型,而且多模態這一條是重點,「無限支持和投入,因爲這是轉型的重要節點,可以接受較大虧損」。

當谷歌擊敗 Sora,預示着 OpenAI 創造的模型神話將被打破;而快手可靈,只是抖音即夢的下一個目標罷了。

       原文標題 : 即夢對陣可靈,重演抖音反超快手?



標題:即夢對陣可靈,重演抖音反超快手

地址:https://www.utechfun.com/post/460257.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡