叫板 Sora!Adobe 推出 AI 視頻神器,一句話 P 視頻

愛範兒
2024-10-16

最近 AI 視頻領域異常熱鬧,Adobe 也剛剛加入了這場混戰。

在今年的 Adobe Max 大會上,Adobe 正式推出了自己的 AI 視頻模型——Firefly Video Model,進軍生成式人工智能領域。

Adobe 的首席產品營銷經理 Meagan Keane 表示,Firefly Video Model 的推出旨在簡化加速視頻創作,並且增加視頻的故事講述能力。概括來講,這個模型包含三個有趣且實用的功能:

Generative Extend(生成拓展)

Text-to-Video(文生視頻)

Image-to-Video(圖生視頻)

其中,Generative Extend 已經被集成至 Adobe 所開發的專業視頻編輯軟件 Premiere Pro 當中;Text-to-Video 和 Image-to-Video 則剛剛在 Firefly Web app 中推出 beta 版本。

顧名思義,如果你拍攝的視頻片段太短或缺失某些部分,Generative Extend 可以幫你在視頻片段的開頭或結尾進行“生成式擴展”。

也就是說,假如所需的鏡頭不可用,或者某個鏡頭的剪輯時機過早或過晚,剪輯師只需要拖動該視頻片段的開頭或結尾,Generative Extend 就可以自動填充生成式內容,以保持視頻的連貫、平滑。

▲Generative Extend 的生成式視頻擴展功能演示(圖片來源:Adobe)

這意味着如果視頻創作者在拍攝過程中得到了一個“廢鏡頭”,他可能不再需要回到原場地重新拍攝,而是利用 Generative Extend 直接對原片段進行擴展和修復。

一定程度上講,這確實有助於提高視頻創作效率——當然,是在 Generative Extend 所延伸的片段質量過硬的情況下。

遺憾的是,該功能目前的最大分辨率限制爲 1080p,且片段最長只能擴展兩秒鐘。

因此 Generative Extend 只適合對視頻片段進行微小的調整,即它只能幫助用戶修復某些細節,卻不能代替創作者本身,進行大篇幅的創作。

Generative Extend 還可以幫助用戶拍攝過程中進行調整,糾正在拍攝過程中視線偏移或其他意外產生的移動。

除了視頻之外,Generative Extend 還可以用於音頻的平滑編輯。它可以將視頻中的環境背景音效擴展長達十秒鐘時間,但無法對對話或音樂進行拓展。

▲Generative Extend 的音頻擴展功能示意(圖片來源:Adobe)

如果你想在視頻創作過程中省點力氣,你可以使用 Text-to-Video 功能直接生成。同它的“老前輩”Runway 和 OpenAI 的 Sora 一樣,用戶只需要輸入他們想要生成的視頻的文本描述,它就可以模擬“真實電影”、“3D 動畫”和“定格動畫”等各種風格生成相應的視頻片段。

以下是一些使用 Text-to-Video 功能生成視頻片段,感受一下:

▲提示文本:電影無人機飛越廣闊的紅色火星景觀,它從我們腳下飛馳而過,當太陽昇起時,地平線是紅色的。在鏡頭的結尾,太陽從地平線上升起。(圖片來源:Adobe)

▲提示文本:電影特寫和夜晚街道中央一位老人的肖像細節。燈光氣氛沉悶,充滿戲劇性。顏色等級爲藍色陰影和橙色高光。這個男人有極其逼真的細節皮膚紋理和明顯的毛孔。動作微妙而柔和。相機不動。膠片顆粒。老式變形鏡頭。(圖片來源:Adobe)

▲提示文本:在墨西哥一個美麗、柔和的天井內拍攝的視角。水清澈湛藍,在傍晚的陽光下閃閃發光。顏色是溫暖和神奇的魔幻風格。高品質,電影感。(圖片來源:Adobe)

除了逼真的,電影般的視覺影像,Text-to-Video 還支持生成一些“抽象”的畫面。例如,它可以被用來生成包括火焰、水、漏光和煙霧等元素的視頻,並覆蓋疊加到現有的視頻上,來增加現有內容的視覺深度和趣味性。

▲提示文本:黑色背景上的電影漏光,有機質感,逼真。(圖片來源:Adobe)

▲上述視頻與現有視頻合成後生成的視頻片段(圖片來源:Adobe)

值得一提的是,用 Text-to-Video 生成的視頻片段還可以使用一系列“相機控制”進行進一步細化處理,這些控制能夠模擬真實的相機角度、運動和拍攝距離等。

▲ 相機控制選項(圖片來源:Adobe)

Image-to-Video 功能則更進一步,允許用戶在視頻創作過程中添加“參考圖像”,以生成更加貼近用戶想象的視頻。

視頻創作者可以從一張圖像和照片出發,利用 Image-to-Video 功能直接製作“B-roll”(電影和視頻製作術語,指的是除了主要拍攝內容(A-roll)之外的輔助視頻素材)。

用戶還可以通過上傳視頻的單幀,並由 Image-to-Video 自動補充缺失幀,以此來創建完整的特寫鏡頭。

▲提示文本:花朵在風中搖曳,一隻美麗的蝴蝶落在其中一朵花上。(圖片來源:Adobe)

“衆所周知,視頻不能 P,所以一定是真的。”

然而,Image-to-Video 的“賽博重拍”功能,直接讓這句話變成過去式。它宛如一隻“上帝之手”,可以讓用戶對視頻內容(視頻中的人物動作等)直接進行操作和修改。來看下面的例子:

▲ 原視頻片段(圖片來源:Adobe)

▲修改後的視頻片段,提示文本:一隻戴着手套的宇航員的手進入畫面,並拔掉了其中一根黃色電纜,具有電影感。(圖片來源:Adobe)

目前,Text-to-Video 和 Image-to-Video 功能生成視頻片段的最大長度僅爲五秒鐘,質量最高爲 720p 和每秒 24 幀。視頻生成時間大約爲 90 秒,Adobe 正在開發“渦輪模式”來縮短這一時間。

視頻生成質量的不足表明,用戶還無法用 Firefly Video Model 生成一部完整的電影,暫時只能作爲創作輔助工具來使用。

Adobe 強調,Firefly Video Model 只會在許可內容(如 Adobe Stock)和公共領域內容上對該模型進行訓練,而不會在客戶提供的內容上進行。

此外,使用 Firefly Video Model 創建或編輯的視頻可以內嵌內容憑證,旨在爲創作者和內容出處提供歸屬證明,有助於聲明 AI 使用情況和所有權權益,以保證“商業安全”。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10