Stability AI 推出「Stable Video Diffusion」: AI 文字生成短片更平更流行

Keith Yim 2023-11-23 17:56 | 科技新知

做圖的 AI : Stability AI 最近預覽了其開發的新型生成式人工智能技術，這項技術能夠根據文字提示創建 Video 短片。要知道 Stablility AI 的 AI 模組是開源的，即是說，未來有多平價的 Text To Video 文字提示變短片的工具！由文字變圖片，變為文字變短片，普及化後又一大突破!

螢幕截圖 2023-11-23 下午5.50.22.jpg

Stable Video DiffusionStability AI，開發了著名的 Stable Diffusion 技術，最近展示了一種新型生成式人工智能（AI）。這種 AI 能夠根據文字提示創建短片，被稱為「穩定視頻擴散」（Stable Video Diffusion）。它由兩種 AI 模型（SVD 和 SVD-XT）組成，能夠以 576 x 1,024 像素的解析度創建影片。用戶可以自定義幀率速度，範圍在每秒 3 到 30 幀之間。視頻的長度取決於選擇的模型；選擇 SVD 時，內容將播放 14 幀，而 SVD-XT 則可以延長到 25 幀。不過，這些影片的播放時間大約只有四秒鐘。

該公司在其 YouTube 頻道上發布了一段展示 Stable Video Diffusion 能力的視頻，其內容質量令人驚訝。例如，「冰龍」演示中，龍的鱗片細節和背景中的山脈都呈現出高度的細緻度。然而，動畫的限制也相當明顯，例如主題只能緩慢地點頭。

這項技術仍處於早期階段，有其限制。據報導，Stable Video Diffusion 無法「實現完美的照片寫實效果」，不能生成「清晰可讀的文字」，並且在處理臉部時也有困難。不過，Stability AI 網站上的另一個演示顯示，其模型能夠造出出沒有明顯缺陷的男性臉部，這可能因情況而異。

僅用於研究目的

目前，這個項目還處於早期階段，尚未準備好進行廣泛發佈，也沒有這樣做的計劃。Stability AI 強調，目前 Stable Video Diffusion 主要「僅用於研究目的」，並不適用於現實世界或商業應用。去年，Stability Diffusion 的模型曾經在網上泄露，導致不法分子利用它創建 Deep Fake 影像，因此開發者對其技術持謹慎態度。

對於有興趣嘗試 Stable Video Diffusion 的人來說，他們可以通過在公司網站上填寫表格進入等待名單。目前尚不清楚何時會允許人們加入，但預覽將包括一個文字到視頻的界面。與此同時，人們可以查閱 AI 的白皮書，了解該項目背後的所有細節。

值得一提的是，該文件提到使用「公開可訪問的視頻數據集」作為部分訓練材料。考慮到 Getty Images 今年早些時候因數據抓取指控而起訴 Stability AI，這一點並不令人意外。看來，該團隊正努力更加謹慎，以免再次惹怒任何人。目前尚無 Stable Video Diffusion 的具體發布日期。不過，幸運的是，市面上還有其他選擇。

來源 : Tech Radar

分區列表

Stability AI 推出「Stable Video Diffusion」: AI 文字生成短片 更平更流行

僅用於研究目的

最新新聞

Stability AI 推出「Stable Video Diffusion」: AI 文字生成短片更平更流行