商傳媒|何映辰/台北報導

YouTube 日前在 Google I/O 2026 開發者大會上,為其短影音平台 Shorts 推出兩項生成式人工智慧新功能:個人化虛擬人像系統與 Gemini Omni Flash 混編能力,預示著短影音創作與互動的新紀元。這兩項功能旨在讓內容創作者以更便捷的方式,擴展其影音內容的製作與運用。

個人化虛擬人像系統允許符合資格的創作者,透過單次臉部與聲音的生物識別錄製,生成「外觀與聲音都像你,安全且可靠」的專屬虛擬人像。這項功能要求創作者年滿 18 歲且為頻道所有者。虛擬人像的建立流程從 YouTube 描述的「安全即時自拍擷取」開始,創作者可透過 YouTube 行動應用程式或 YouTube Create app 進行臉部與聲音的錄製。生成後,創作者可進入 AI 創意工作室,選擇「使用我的虛擬人像製作影片」,並輸入文字提示來描述場景。特別的是,在符合資格的 Shorts 短影音中,還可選擇「將我加入此場景」,將自己的虛擬人像插入到其他創作者現有的短影音中。YouTube 也針對錄製品質提出要求,例如手機需與眼睛同高、畫面置中、光線適中且背景無其他臉孔。

另一項主要更新是 Gemini Omni Flash 混編功能,它賦予使用者利用文字提示、上傳至多三張參考照片,或是由 AI 建議的編輯選項,來重新混編現有的 Shorts 內容。這項功能不僅能轉化短影音的視覺內容,還能根據提示和原始場景背景自動生成新的音訊。Gemini Omni 整合了 Gemini 的推理能力與跨文字、影像和視訊的生成式媒體技術。初期,此功能僅支援英文提示,且推出時將歐洲聯盟與英國排除在外。

為了確保內容的透明度與真實性,所有透過虛擬人像或 Gemini Omni Flash 功能生成的內容,都會自動附帶 AI 生成標示。這包含可見的浮水印以及像 SynthID 和 Coalition for Content Provenance and Authenticity(C2PA)這樣的數位標籤。Google DeepMind 開發的 SynthID 浮水印,即使經過編輯或重新格式化,仍能保留其嵌入式訊號。YouTube 說明,創作者使用平台內建的生成式 AI 工具時,無需額外步驟即可完成揭露。對於涉及選舉、衝突、天災、金融與健康等敏感類別的內容,系統將會顯示更明顯的標示。Google 已於 2025 年 12 月將 SynthID 驗證功能整合至 Gemini app 中,讓使用者得以查證影音內容是否為 Google AI 工具生成或修改。

YouTube 強調,揭露內容為 AI 生成並不會限制影片的觸及率,也不會影響其營利資格。然而,若創作者持續不揭露 AI 內容使用情況,可能會面臨 YouTube 的懲處,包括內容移除或終止其參與 YouTube Partner Program 的資格。此外,創作者仍保有對其作品的控制權,可以隨時停用影片混編功能,若在既有混編作品之後停用,這些衍生作品將會被自動刪除。當混編作品產生時,系統會自動連結回原創作者,確保歸屬。

這些新功能預期將為 YouTube Shorts 帶來更多元的內容創作,特別是在 Shorts 每日觀看次數已達 2,000 億次的基礎上,AI 驅動的創作工具將能有效降低內容製作的門檻與成本,進一步豐富平台生態。同時,YouTube 也宣布整合 Google DeepMind 的 Veo 模型,應用於 Shorts 的 AI 生成影片背景與獨立剪輯功能,並推出「Extend with AI for Shorts」功能,讓創作者能為現有短影音添加最長 8 秒的 AI 生成續作。