財經

YouTube Shorts 導入 AI 虛擬人像與 Gemini Omni 混編，開啟影音互動新章

商商傳媒 2026-05-27 08:57 📖 4 分鐘閱讀

📋 重點摘要

● YouTube Shorts 推出兩項生成式 AI 新功能：個人化虛擬人像系統與 Gemini Omni Flash 混編能力。

● 個人化虛擬人像系統允許創作者生成專屬虛擬人像，並可將其插入其他 Shorts 影片。

● Gemini Omni Flash 功能讓使用者能透過文字提示或參考照片，重新混編現有的 Shorts 內容並生成新音訊。

● 所有 AI 生成內容將自動附帶 AI 生成標示，包括浮水印和數位標籤，以確保內容透明度。

● YouTube 強調揭露 AI 生成內容不影響影片觸及率或營利資格，但持續不揭露將面臨懲處。

#AI #生成式 AI #虛擬人像

相關組織： YouTube Google Google DeepMind

商傳媒｜何映辰／台北報導

YouTube 日前在 Google I/O 2026 開發者大會上，為其短影音平台 Shorts 推出兩項生成式人工智慧新功能：個人化虛擬人像系統與 Gemini Omni Flash 混編能力，預示著短影音創作與互動的新紀元。這兩項功能旨在讓內容創作者以更便捷的方式，擴展其影音內容的製作與運用。

個人化虛擬人像系統允許符合資格的創作者，透過單次臉部與聲音的生物識別錄製，生成「外觀與聲音都像你，安全且可靠」的專屬虛擬人像。這項功能要求創作者年滿 18 歲且為頻道所有者。虛擬人像的建立流程從 YouTube 描述的「安全即時自拍擷取」開始，創作者可透過 YouTube 行動應用程式或 YouTube Create app 進行臉部與聲音的錄製。生成後，創作者可進入 AI 創意工作室，選擇「使用我的虛擬人像製作影片」，並輸入文字提示來描述場景。特別的是，在符合資格的 Shorts 短影音中，還可選擇「將我加入此場景」，將自己的虛擬人像插入到其他創作者現有的短影音中。YouTube 也針對錄製品質提出要求，例如手機需與眼睛同高、畫面置中、光線適中且背景無其他臉孔。

另一項主要更新是 Gemini Omni Flash 混編功能，它賦予使用者利用文字提示、上傳至多三張參考照片，或是由 AI 建議的編輯選項，來重新混編現有的 Shorts 內容。這項功能不僅能轉化短影音的視覺內容，還能根據提示和原始場景背景自動生成新的音訊。Gemini Omni 整合了 Gemini 的推理能力與跨文字、影像和視訊的生成式媒體技術。初期，此功能僅支援英文提示，且推出時將歐洲聯盟與英國排除在外。

為了確保內容的透明度與真實性，所有透過虛擬人像或 Gemini Omni Flash 功能生成的內容，都會自動附帶 AI 生成標示。這包含可見的浮水印以及像 SynthID 和 Coalition for Content Provenance and Authenticity（C2PA）這樣的數位標籤。Google DeepMind 開發的 SynthID 浮水印，即使經過編輯或重新格式化，仍能保留其嵌入式訊號。YouTube 說明，創作者使用平台內建的生成式 AI 工具時，無需額外步驟即可完成揭露。對於涉及選舉、衝突、天災、金融與健康等敏感類別的內容，系統將會顯示更明顯的標示。Google 已於 2025 年 12 月將 SynthID 驗證功能整合至 Gemini app 中，讓使用者得以查證影音內容是否為 Google AI 工具生成或修改。

YouTube 強調，揭露內容為 AI 生成並不會限制影片的觸及率，也不會影響其營利資格。然而，若創作者持續不揭露 AI 內容使用情況，可能會面臨 YouTube 的懲處，包括內容移除或終止其參與 YouTube Partner Program 的資格。此外，創作者仍保有對其作品的控制權，可以隨時停用影片混編功能，若在既有混編作品之後停用，這些衍生作品將會被自動刪除。當混編作品產生時，系統會自動連結回原創作者，確保歸屬。

這些新功能預期將為 YouTube Shorts 帶來更多元的內容創作，特別是在 Shorts 每日觀看次數已達 2,000 億次的基礎上，AI 驅動的創作工具將能有效降低內容製作的門檻與成本，進一步豐富平台生態。同時，YouTube 也宣布整合 Google DeepMind 的 Veo 模型，應用於 Shorts 的 AI 生成影片背景與獨立剪輯功能，並推出「Extend with AI for Shorts」功能，讓創作者能為現有短影音添加最長 8 秒的 AI 生成續作。