Stability AI 推出「Stable Video Diffusion」: AI 文字生成短片 更平更流行

Keith Yim 2023-11-23 17:56 | 科技新知
做圖的 AI : Stability AI 最近預覽了其開發的新型生成式人工智能技術,這項技術能夠根據文字提示創建 Video 短片。要知道 Stablility AI 的 AI 模組是開源的,即是說,未來有多平價的 Text To Video 文字提示變短片的工具!由文字變圖片,變為文字變短片,普及化後又一大突破!

螢幕截圖 2023-11-23 下午5.50.22.jpg

Stable Video DiffusionStability AI,開發了著名的 Stable Diffusion 技術,最近展示了一種新型生成式人工智能(AI)。這種 AI 能夠根據文字提示創建短片,被稱為「穩定視頻擴散」(Stable Video Diffusion)。它由兩種 AI 模型(SVD 和 SVD-XT)組成,能夠以 576 x 1,024 像素的解析度創建影片。用戶可以自定義幀率速度,範圍在每秒 3 到 30 幀之間。視頻的長度取決於選擇的模型;選擇 SVD 時,內容將播放 14 幀,而 SVD-XT 則可以延長到 25 幀。不過,這些影片的播放時間大約只有四秒鐘。

該公司在其 YouTube 頻道上發布了一段展示 Stable Video Diffusion 能力的視頻,其內容質量令人驚訝。例如,「冰龍」演示中,龍的鱗片細節和背景中的山脈都呈現出高度的細緻度。然而,動畫的限制也相當明顯,例如主題只能緩慢地點頭。



這項技術仍處於早期階段,有其限制。據報導,Stable Video Diffusion 無法「實現完美的照片寫實效果」,不能生成「清晰可讀的文字」,並且在處理臉部時也有困難。不過,Stability AI 網站上的另一個演示顯示,其模型能夠造出出沒有明顯缺陷的男性臉部,這可能因情況而異。

僅用於研究目的

目前,這個項目還處於早期階段,尚未準備好進行廣泛發佈,也沒有這樣做的計劃。Stability AI 強調,目前 Stable Video Diffusion  主要「僅用於研究目的」,並不適用於現實世界或商業應用。去年,Stability Diffusion 的模型曾經在網上泄露,導致不法分子利用它創建 Deep Fake 影像,因此開發者對其技術持謹慎態度。

對於有興趣嘗試 Stable Video Diffusion 的人來說,他們可以通過在公司網站上填寫表格進入等待名單。目前尚不清楚何時會允許人們加入,但預覽將包括一個文字到視頻的界面。與此同時,人們可以查閱 AI 的白皮書,了解該項目背後的所有細節。

值得一提的是,該文件提到使用「公開可訪問的視頻數據集」作為部分訓練材料。考慮到 Getty Images 今年早些時候因數據抓取指控而起訴 Stability AI,這一點並不令人意外。看來,該團隊正努力更加謹慎,以免再次惹怒任何人。目前尚無 Stable Video Diffusion 的具體發布日期。不過,幸運的是,市面上還有其他選擇。

來源 : Tech Radar

最新新聞