即夢對陣可靈，重演抖音反超快手

2024-12-27 18:40:21 編輯： robot

導讀快手可靈，只是抖音即夢的下一個目標罷了。撰文|藍洞商業趙衛衛年初從抖音 CEO 位置上辭職的張楠，應該度過了一個充實的 2024 年。在中央美術學院設計學院四層階梯空間裏，張楠這位曾經的藝術...

快手可靈，只是抖音即夢的下一個目標罷了。

撰文|藍洞商業趙衛衛

年初從抖音 CEO 位置上辭職的張楠，應該度過了一個充實的 2024 年。

在中央美術學院設計學院四層階梯空間裏，張楠這位曾經的藝術生坐在 C 位，微笑着與一群大學生合影留念，她是評委之一。這是一場 AI 交互創新大賽的分享交流會，主辦方就是張楠如今負責的業務重點：剪映旗下的 AI 產品即夢，這被視作一款可能再造抖音的產品。

幾天之後，張楠公开把即夢定義爲「想象力世界」的相機，而抖音是一個「真實世界」的相機。

要打造想象力的世界，創新的來源更多是年輕的頭腦。抖音的成功離不开年輕的高校學生，他們曾是抖音早期運營團隊關注的重點人群，各種經典的挑战類活動，都是靠着這些年輕的創作者們踊躍參與而不斷傳播开來，但與早年間抖音運營沒什么錢、靠打感情牌不同，如今，即夢 AI 交互創新大賽一等獎是 10 萬元的獎金。

得獎人趙純想並不是學生，而是一個年輕的獨立开發者，此前憑借一款飲食記錄的產品「胃之書」嶄露頭角。而這次獲獎的作品，是一個 AI 視頻生成鏡頭精細控制 UIUX 方案，在展示的 2 分鐘 Demo 中，導入一張《天堂電影院》的經典場景圖，用戶就可以生成一段視頻，實現推拉鏡頭、特寫、窗外鮮花盛开等 AI 創作。

而在即夢面世前三個月，快手可靈已經在國內率先上线了視頻生成大模型，它們同樣沒有忽視高校裏的年輕人，快手可靈與中國美術學院等高校聯合舉辦了 AI 創作大賽，獲得一等獎的三個作品，聚焦生活、廣告和自由發揮主題，分別拿到了獎金 36666 元。

Sora 打开了爲真實世界建模的 AI 大門，即夢和可靈則順着抖音和快手走過的路，用更飽和式投入，以大力出奇跡。

更大的競爭就在不遠的 2025 年，網傳一份對字節跳動 AI 視頻生成產品的調研紀要顯示，「字節希望在其生態內使用 AI 能力，認爲明年各生態將形成競爭閉環。明年五一之前，扣子智能體平台、豆包、抖音和 B 端的能力會形成關聯的生態網，文生視頻將會有更多的體現和使用場景。」

2025 年，在電商廣告、短劇等多個市場，抖音即夢或許將與快手可靈正面交鋒。

高开難高走

「高开低走」與「低开高走」，是現在抖音即夢與快手可靈最大的差別。

QuestMobile 最新數據顯示，即夢上线當天即在抖音平台引發了高漲的討論熱度，可靈 AI 通過熱度的持續積累也在快手站內出現熱度峰值。但一個明顯的不同是，即夢的內容互動量在一個月高开低走，而可靈的內容互動量在一個月內低开高走。

這是推廣策略、用戶體驗、市場競爭等多種因素共同作用的結果，但一個最直接的原因，可能就是即夢的產品發布較晚，體驗不如預期，用戶深入使用之後，很容易區分與同類產品在生成內容上的質量和穩定性，即便初始階段獲得了大量預熱，目前即夢在熱度上仍不及可靈。

這並非意味着即夢的絕對落後，有 AI 產品深度使用的用戶認爲，當下國產 AI 產品想要用好，就不能單用一個，尤其是在文生視頻創作中，用戶選擇的做法往往是用即夢來做前期的文生圖，然後再用可靈來制作圖生視頻，因爲「即夢的 AI 生圖比較優秀」。

字節調研紀要同樣顯示即夢和可靈之間差距很大，即夢日活用戶在 20 萬-22 萬之間，其中 70% 爲個人或小型 MCN 工作室，大型企業較少，付費用戶 2.5 萬人左右，月訂閱付費均價在 50 元左右；而同期可靈服務用戶超 500 萬，累計付費用戶超 200 萬，付費金額累計約千萬級別。

這種調研紀要難辨虛實，因爲二級市場爆火的「豆包概念股」，字節跳動官方曾對投資者們做出風險提示，以免遭受不必要的投資損失。

而快手可靈之所以「低开高走」，一方面是視頻生成大模型本身的能力更穩定，佔據了先發優勢，另外一面則是營銷策略的成功。「藍洞商業」在《快手可靈，把壓力給到了抖音剪映》中已經提到，當時快手通過海外科技大 V 測試可靈生成的案例，成功營造出其在海外市場火爆的氛圍，進而「出口轉內銷」。

半年過去，目前可靈在海外市場的關注度仍遠高於即夢，社交媒體 X 的關注人數是即夢的 67 倍。

就在張楠出現在火山引擎大會上，發布即夢最新消息的當天，快手又升級了可靈大模型，宣稱在內部評測中比此前 1.5 模型整體效果提升 195% 。而此前一個月的三季度財報會上，創始人程一笑也提到對可靈的憧憬：可靈 AI 的商業化單月流水超千萬人民幣，有信心在明年實現收入規模的快速增長。

「高开低走」的即夢希望成爲一種新的創造和體驗方式，根據調研紀要，明年即夢沒有明確的商業回報目標，但要有商業模式，「盈利要往後放」，明年即夢的重點將是與媒體、影視制作合作等產品形態的落地。

快手又將陷入包圍战

抖音不是第一個做短視頻的，卻在 2018 年开始超越快手，後來居上成爲短視頻賽道的第一。張楠曾總結過崛起的四個關鍵因素：全屏高清、音樂、特效濾鏡、個性化算法推薦技術。

如今，即夢對陣可靈，能否重演抖音對陣快手的故事？

即夢目前只是字節跳動在多模態大模型應用層的一款產品，隸屬於抖音旗下的剪映團隊，背後支撐服務的是字節跳動雲服務的火山引擎。在火山引擎官網的模型廣場上，字節跳動提供 20 個大模型產品，遍布文本、語音和視覺多個類型，此外火山方舟還提供月之暗面和智譜 AI 的產品。

AI 可能成爲字節跳動下一個核心業務支柱，相比之下，快手磁力引擎的官方網站上，很難找到相關大模型商業應用的展示位。

字節跳動在大模型領域的激進姿態，今年早已經通過 C 端的產品豆包展現出來。今年 9 月，移動數據調研機構 Sensor Tower 曾發布全球 AI 應用報告，其顯示了 ChatGPT 是 1-8 月全球下載量最多的 AI 應用，谷歌的 Gemini 排在第四，字節跳動的豆包排名第五，而且是榜單上唯一的中國產品。

這離不开抖音豐沛的流量廣告和投放支持，豆包和 Kimi 在今年的廣告市場上投放競爭激烈，根據廣告情報分析平台 AppGrowing 統計，豆包智能助手 4 月、5 月的投放金額接近 1800 萬元，等到 6 月上旬，投放金額飆升至 1.24 億元，而且在抖音站內限制了 Kimi 在內的大模型廣告投放。

「營銷預算方面，即夢在 12 月預算开始提升，明年第一季度，尤其是春節前後將提到億級別的投入。」字節調研紀要提到。而除了營銷，字節跳動在芯片底層儲備上也不可小覷。英國《金融時報》報道稱，字節跳動採購了約 23 萬片英偉達芯片，已成爲英偉達人工智能芯片的最大中國买家；The Information 也在 9 月份報道稱，字節跳動今年訂購了超過20 萬台 Nvidia H20。

所以基於豆包在國內大模型市場取得的領先地位，未來的看點是，抖音和豆包如何聯動即夢，這也意味着，快手一枝獨秀的可靈，將陷入字節跳動大模型的包圍战。

今年 9 月，對標 OpenAI 的 Sora，字節跳動發布了兩款對標文生視頻工具 PixelDance 和 Seaweed，即夢 AI 已經接入了豆包，其中支撐即夢的就包括能力更優秀的 PixelDance，官方介紹稱，能夠生成高質量的長達兩分鐘的 1080p 分辨率視頻，擅長描繪復雜的運動和物體之間的互動。

目前看，不論是抖音還是快手，AI 生成視頻最主要的落地場景都是趨同的，除了 C 端用戶收費之外，B 端場景一個是服務於短劇等影視制作和後期市場，另外一個則是服務於廣告和電商內容營銷，比如商品素材展示上生成不同的圖片。

在火山引擎大會上，張楠曾展示過兩個即夢創作者的 AI 短片，其中一個就是今年 7 月份上线的科幻短劇《覺醒》，當時在抖音單日點贊破 40 萬；而同一時期，快手的可靈也打造過一部《山海奇鏡之劈波斬浪》，同樣都屬於試水制作。

但實際上，AI 生成視頻對影視制作只是輔助性的，目前階段仍然是小規模制作，要完成大批量的影視後期制作，即夢和可靈都是順着 Sora 類似的 Dit 架構（一種結合了 Transformer 架構的擴散模型，用於圖像和視頻生成任務）在前進，都有很長一段路要走，商業化也尚爲時過早。

當谷歌擊敗Sora

OpenAI 的 Sora 开放使用之後，一系列生成視頻的表現並不符合外界的期待，而谷歌在近期發布的視頻生成器 Veo2，通過一系列測試表明，其有超過 Sora 的更驚豔表現。

尤其是一個最著名的切西紅柿的鏡頭，谷歌的 Veo2 刀子幹淨利落地切开西紅柿，避开了手指，而 Sora 視頻中的刀子卻切开了手，這讓 Sora 再次成爲群嘲的對象，也讓行業人士認爲，Sora 更偏向於運動，而 Veo2 則更注重物理的准確性。

有 AI 行業人士認爲，谷歌之所以能超越 Sora，不光是發現了 Sora 物理准確性的弱點，更在於其利用 YouTube 來訓練其人工智能模型。

字節跳動的技術團隊並非沒有發現 Sora 在物理准確性上的弱點。11 月，豆包大模型團隊曾發布過一篇論文，名爲《從世界模型的角度來看，視頻生成與之相距多遠：基於物理定律的視角》（《How Far is Video Generation from World Model: A Physical Law Perspective》），探究了視頻生成模型能否觀察事物間的相互關系，並從中提煉出一套穩定的物理規律。

「視覺模糊性會導致在細粒度物理建模方面出現顯著的誤差，單純依賴視頻表示不足以進行精確的物理建模。」該論文認爲，視頻生成模型要成爲准確的世界模型還面臨挑战。

而研究這個方向的兩位作者都非常年輕，一位是 95 後，一位是 00 後。如同即夢和可靈，都需要年輕的藝術學院的學生參與打造想象力的世界一樣，爲這個AI想象力世界奠定技術基礎的，同樣來自年輕的頭腦。兩位作者耗費8個月時間，就是爲了找到通往世界模型的一扇大門。

找到瓶頸需要 8 個月，而打破瓶頸可能需要耗費更長的時間。

抖音何時真正即夢？在那份調研紀要中，字節跳動明年的 AI 發展有三條主要路徑，一是豆包大家族生態；二是抖音等產品的全面 AI 化；三是包括即夢在內的多模態模型和世界大模型，而且多模態這一條是重點，「無限支持和投入，因爲這是轉型的重要節點，可以接受較大虧損」。

當谷歌擊敗 Sora，預示着 OpenAI 創造的模型神話將被打破；而快手可靈，只是抖音即夢的下一個目標罷了。

原文標題 : 即夢對陣可靈，重演抖音反超快手？

標題：即夢對陣可靈，重演抖音反超快手

地址：https://www.utechfun.com/post/460257.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：抖音 Sora 快手

上一篇:xAI完成60億美元C輪融資，拉動特斯拉股價上漲

下一篇:鯨對話｜圖森未來爲何要從自動駕駛駛轉向AIGC？

您現在的位置：首頁人工智能

即夢對陣可靈，重演抖音反超快手

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能