Stable Video Diffusion 發表，可用圖片產生影片

2023-11-26 00:00:00 編輯： Unwire HK

導讀 Stability AI 「Stable Video Diffusion」基於現有 Stable Diffusion 文字到圖像 AI 模型，用圖片產生影片，模型處於「研究預覽」階段，使用者需同意特...

Stability AI 「Stable Video Diffusion」基於現有 Stable Diffusion 文字到圖像 AI 模型，用圖片產生影片，模型處於「研究預覽」階段，使用者需同意特定使用條款，如預期應用（如教育或創意工具、設計和其他藝術過程等）和非預期用途（如對人或事的真實或事實性表達）。

Stable Video Diffusion 有兩種模型：SVD 和 SVD-XT。SVD 能將靜態圖像轉為 14 幀 576×1,024 影片，SVD-XT 使用相同架構，但幀數提高到 24 幀，兩者均能以每秒 3~30 幀速度產生影片。根據白皮書，SVD 和 SVD-XT 最初以數百萬影片的資料庫訓練，然後用數十萬至百萬小型影片庫「微調」。但影片資料庫來源不清楚，可能造成 Stability AI 及用戶使用權的法律和道德挑戰。

儘管如此，Stable Video Diffusion 技術仍有限制，如無法產生靜態或慢動作影片，不能用文字控制，無法清晰渲染文字，也不能正確產生人臉和人物。Stable Video Diffusion 推出也引發擔憂，尤其可能濫用的風險。模型似乎沒有內建內容過濾器，可能拿去製作不當內容。

Stability AI 表示，模型有很高擴展性，並可適用產生物體 360 度圖等。計劃推出一系列基於 SVD 和 SVD-XT 的新模型，以及將文字提示帶上網路的「文字到影片」工具，最終目標似乎是商業化，潛在應用領域有廣告、教育、娛樂等。

（本文由授權轉載；首圖來源：）

關鍵字: , ,

標題：Stable Video Diffusion 發表，可用圖片產生影片

地址：https://www.utechfun.com/post/295811.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：

上一篇:挑戰 Google 翻譯、ChatGPT，DeepL 怎麼在巨頭中造出 320 億元身價？

下一篇:亞馬遜 Alexa 部門裁員數百人！曾是貝佐斯心頭肉，為何面臨裁員命運？

您現在的位置：首頁人工智能

Stable Video Diffusion 發表，可用圖片產生影片

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能