叫板 Sora！Adobe 推出 AI 視頻神器，一句話 P 視頻

最近 AI 視頻領域異常熱鬧，Adobe 也啱啱加入了這場混戰。

在今年的 Adobe Max 大會上，Adobe 正式推出了自己的 AI 視頻模型——Firefly Video Model，進軍生成式人工智能領域。

Adobe 的首席產品營銷經理 Meagan Keane 表示，Firefly Video Model 的推出旨在簡化加速視頻創作，並且增加視頻的故事講述能力。概括來講，這個模型包含三個有趣且實用的功能：

Generative Extend（生成拓展）

Text-to-Video（文生視頻）

Image-to-Video（圖生視頻）

其中，Generative Extend 已經被集成至 Adobe 所開發的專業視頻編輯軟件 Premiere Pro 當中；Text-to-Video 和 Image-to-Video 則啱啱在 Firefly Web app 中推出 beta 版本。

顧名思義，如果你拍攝的視頻片段太短或缺失某些部分，Generative Extend 可以幫你在視頻片段的開頭或結尾進行「生成式擴展」。

也就是說，假如所需的鏡頭不可用，或者某個鏡頭的剪輯時機過早或過晚，剪輯師只需要拖動該視頻片段的開頭或結尾，Generative Extend 就可以自動填充生成式內容，以保持視頻的連貫、平滑。

▲Generative Extend 的生成式視頻擴展功能演示（圖片來源：Adobe）

這意味着如果視頻創作者在拍攝過程中得到了一個「廢鏡頭」，他可能不再需要回到原場地重新拍攝，而是利用 Generative Extend 直接對原片段進行擴展和修復。

一定程度上講，這確實有助於提高視頻創作效率——當然，是在 Generative Extend 所延伸的片段質量過硬的情況下。

遺憾的是，該功能目前的最大分辨率限制為 1080p，且片段最長只能擴展兩秒鐘。

因此 Generative Extend 只適合對視頻片段進行微小的調整，即它只能幫助用戶修復某些細節，卻不能代替創作者本身，進行大篇幅的創作。

Generative Extend 還可以幫助用戶拍攝過程中進行調整，糾正在拍攝過程中視線偏移或其他意外產生的移動。

除了視頻之外，Generative Extend 還可以用於音頻的平滑編輯。它可以將視頻中的環境背景音效擴展長達十秒鐘時間，但無法對對話或音樂進行拓展。

▲Generative Extend 的音頻擴展功能示意（圖片來源：Adobe）

如果你想在視頻創作過程中省點力氣，你可以使用 Text-to-Video 功能直接生成。同它的「老前輩」Runway 和 OpenAI 的 Sora 一樣，用戶只需要輸入他們想要生成的視頻的文本描述，它就可以模擬「真實電影」、「3D 動畫」和「定格動畫」等各種風格生成相應的視頻片段。

以下是一些使用 Text-to-Video 功能生成視頻片段，感受一下：

▲提示文本：電影無人機飛越廣闊的紅色火星景觀，它從我們腳下飛馳而過，當太陽升起時，地平線是紅色的。在鏡頭的結尾，太陽從地平線上升起。（圖片來源：Adobe）

▲提示文本：電影特寫和夜晚街道中央一位老人的肖像細節。燈光氣氛沉悶，充滿戲劇性。顏色等級為藍色陰影和橙色高光。這個男人有極其逼真的細節皮膚紋理和明顯的毛孔。動作微妙而柔和。相機不動。膠片顆粒。老式變形鏡頭。（圖片來源：Adobe）

▲提示文本：在墨西哥一個美麗、柔和的天井內拍攝的視角。水清澈湛藍，在傍晚的陽光下閃閃發光。顏色是溫暖和神奇的魔幻風格。高品質，電影感。（圖片來源：Adobe）

除了逼真的，電影般的視覺影像，Text-to-Video 還支持生成一些「抽象」的畫面。例如，它可以被用來生成包括火焰、水、漏光和煙霧等元素的視頻，並覆蓋疊加到現有的視頻上，來增加現有內容的視覺深度和趣味性。

▲提示文本：黑色背景上的電影漏光，有機質感，逼真。（圖片來源：Adobe）

▲上述視頻與現有視頻合成後生成的視頻片段（圖片來源：Adobe）

值得一提的是，用 Text-to-Video 生成的視頻片段還可以使用一系列「相機控制」進行進一步細化處理，這些控制能夠模擬真實的相機角度、運動和拍攝距離等。

▲ 相機控制選項（圖片來源：Adobe）

Image-to-Video 功能則更進一步，允許用戶在視頻創作過程中添加「參考圖像」，以生成更加貼近用戶想象的視頻。

視頻創作者可以從一張圖像和照片出發，利用 Image-to-Video 功能直接製作「B-roll」（電影和視頻製作術語，指的是除了主要拍攝內容（A-roll）之外的輔助視頻素材）。

用戶還可以通過上傳視頻的單幀，並由 Image-to-Video 自動補充缺失幀，以此來創建完整的特寫鏡頭。

▲提示文本：花朵在風中搖曳，一隻美麗的蝴蝶落在其中一朵花上。（圖片來源：Adobe）

「衆所周知，視頻不能 P，所以一定是真的。」

然而，Image-to-Video 的「賽博重拍」功能，直接讓這句話變成過去式。它宛如一隻「上帝之手」，可以讓用戶對視頻內容（視頻中的人物動作等）直接進行操作和修改。來看下面的例子：

▲ 原視頻片段（圖片來源：Adobe）

▲修改後的視頻片段，提示文本：一隻戴着手套的宇航員的手進入畫面，並拔掉了其中一根黃色電纜，具有電影感。（圖片來源：Adobe）

目前，Text-to-Video 和 Image-to-Video 功能生成視頻片段的最大長度僅為五秒鐘，質量最高為 720p 和每秒 24 幀。視頻生成時間大約為 90 秒，Adobe 正在開發「渦輪模式」來縮短這一時間。

視頻生成質量的不足表明，用戶還無法用 Firefly Video Model 生成一部完整的電影，暫時只能作為創作輔助工具來使用。

Adobe 強調，Firefly Video Model 只會在許可內容（如 Adobe Stock）和公共領域內容上對該模型進行訓練，而不會在客戶提供的內容上進行。

此外，使用 Firefly Video Model 創建或編輯的視頻可以內嵌內容憑證，旨在為創作者和內容出處提供歸屬證明，有助於聲明 AI 使用情況和所有權權益，以保證「商業安全」。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

叫板 Sora！Adobe 推出 AI 視頻神器，一句話 P 視頻

熱議股票