財經

谷歌I/O 2026將展AI雄心：Gemini成作業系統級智能中樞

商商傳媒 2026-05-17 18:46 📖 3 分鐘閱讀

📋 重點摘要

● 谷歌 I/O 2026 將聚焦人工智慧，預計將 Gemini 模型深度整合至作業系統層級。

● Gemini Spark 將扮演 AI 代理角色，能跨應用程式協同作業並自動化重複性任務。

● Gemini Omni 將整合 AI 影片生成與編輯功能，並升級進階 AI 影片生成模型 Veo。

● 谷歌將擴展「Flash」模型系列，以提升模型效率和行動裝置部署能力。

● Gemini 將被嵌入 Android、Chrome、生產力工具及未來的硬體平台，全面改造用戶數位體驗。

#AI #人工智慧 #AI 代理 #Gemini

相關組織： Google

商傳媒｜責任編輯／綜合外電報導

根據《NPowerUser》報導，谷歌（Google）正積極籌備年度盛會 Google I/O 2026，該活動將於台灣時間 5 月 19 日展開，預計成為谷歌有史以來最聚焦人工智慧（AI）的開發者大會。業界傳聞與官方預告皆暗示，谷歌計劃將其 Gemini 模型從單純的聊天機器人，擴展成橫跨應用程式、瀏覽器、Android 裝置及筆記型電腦的全面 AI 操作層。

其中，Gemini Spark 預期將扮演持續運作的 AI 代理角色，能跨應用程式、電子郵件、聊天、瀏覽器及文件中協同作業。這項內部代號為 Remy 的技術，傳聞能主動處理工作流程並自動化重複性任務，例如摘要並回覆電子郵件、管理瀏覽分頁與會話、追蹤跨應用程式的對話，以及協調 Android 與 Chrome 之間的資訊。

在生成式媒體方面，Gemini Omni 可能會將內建的影片生成與編輯功能直接整合至 Gemini 平台。預期這將包含 AI 影片生成、場景重組、AI 輔助編輯、透過提示詞創建電影級內容以及多模態編輯工作流程。此外，谷歌也將同步揭曉其進階 AI 影片生成模型 Veo 的重大升級，旨在改善動態寫實度、場景一致性、提示詞理解、音訊同步，並能生成更長的影片片段。據傳 Veo 將深度整合至 Gemini Omni、YouTube 工具及谷歌更廣泛的創作者生態系統中。

在模型效率方面，谷歌準備擴展其「Flash」模型系列，傳聞中的 Gemini 3.2 Flash 和 Gemini 3.5 Flash 將優先考量更快的反應速度、更低的推論成本、減少延遲，以及針對即時互動進行高效的行動裝置部署。這些 Flash 模型可能成為 Android、Chrome、即時助理、穿戴式裝置和智慧型裝置的理想 AI 層級。同時，亦有消息指出，功能更強大的 Gemini 3.5 Pro 模型將專注於進階推理與程式編寫任務，預期在軟體工程能力、多步驟推理、情境處理、長篇內容輸出及工具使用上有所提升。

谷歌的 AI 策略方向已趨於明朗，主要著重於三大優先事項：開發更快、更有效率的 AI 模型；提供更先進的 AI 生成影片與媒體功能；以及打造能實際採取行動的 AI 代理。這一切都旨在將 Gemini 深度嵌入 Android、Chrome、生產力工具、消費者體驗及未來的硬體平台，例如預計於 2026 年秋季推出的 Gemini Intelligence 筆記型電腦平台 Googlebook。透過這些新技術，谷歌期望 Gemini 能操作應用程式、瀏覽網路、生成媒體、理解長期情境、完成多步驟任務，並在背景持續運作，全面改造用戶數位體驗。