谷歌推出個人AI助理Gemini Spark 月費百美元整合數位生活
谷歌(Google)於週二(5月19日)的年度開發者大會 Google I/O 上,發表了一系列人工智慧(AI)重大進展,其中包含備受矚目的個人AI助理 Gemini Spark,旨在深度整合用戶的數位生活,並透過訂閱制提供服務。這款AI助理將於本週開始向「信任測試者」推出,並預計於下週全面開放給 Google AI Ultra 訂閱用戶。
全新AI助理功能全面升級
Gemini Spark 是一款基於 Gemini 模型運作的雲端AI代理,能夠24小時不間斷地執行任務,深入用戶的數位空間。該助理可連接 Gmail、Google文件(Docs)、Google試算表(Sheets)和 Google簡報(Slides)等谷歌核心服務,執行諸如檢查收件箱特定郵件、建立自動更新的學習指南,以及根據谷歌服務數據草擬電子郵件等複雜功能。此外,Gemini Spark 將透過 MCP(Model Context Protocol)連接器,整合 Adobe、Asana、Box公司、Canva、Dropbox、HubSpot、Intuit、monday.com、潘多拉媒體公司(Pandora)、Spotify 和 Wix.com 等第三方服務。
谷歌強調,Gemini Spark 部署於雲端,即便用戶關閉電腦或手機,仍能持續運作,預計將比其他基於本地設備的AI代理(如 OpenClaw)更具使用者友善性。為了讓使用者能直觀了解 Gemini Spark 的運作進度,一個名為 Android Halo 的新使用者介面空間將於今年稍晚推出。
針對AI代理的交易管理,谷歌也導入了 Agent Payments Protocol 2 (AP2),允許用戶設定AI代理的消費上限、可購買的商品種類以及可使用的商家,並產生交易紀錄以應對退貨或訂單問題,避免AI代理進行非預期的消費。
Gemini 模型家族與搜尋革新
此次大會也揭露了 Gemini 模型家族的最新進展。Gemini 3.5 Flash 已開始向全球數十億用戶推出,並成為 Gemini 應用程式與 Google Search「AI 模式」的預設模型。谷歌表示,Gemini 3.5 Flash 是目前最強大的代理與程式碼模型,速度比部分競爭對手快約四倍。更強大的 Gemini 3.5 Pro 則預計於下個月推出。
在影音創作方面,谷歌推出了全新的 Gemini Omni 模型,使用者可透過文字、圖片、影片、音訊等多種輸入方式,生成高品質影片。Gemini Omni Flash 將於本週起在 YouTube Shorts 和 YouTube Create App 免費提供。所有透過 Omni 生成的影片都將內嵌谷歌的數位浮水印 SynthID,以辨識AI生成內容。OpenAI、Kakao 和 ElevenLabs 等AI公司也已採用 SynthID 技術。
Google Search 亦迎來重大升級。去年推出的「AI模式」查詢量每季翻倍成長,每月用戶已突破十億。此次更新引入「智慧搜尋框」,能適應更長的查詢並提供AI驅動的寫作建議,取代傳統自動完成功能。使用者可透過文字、圖片、影片、文件甚至 Chrome 分頁進行多模態搜尋。
智慧購物與個人助理服務
谷歌新推出的 Universal Cart 則是一個跨商家的「智慧購物車」工具。使用者可在 Google Search、Gemini 聊天介面、YouTube 或 Gmail 中將商品加入購物車,Universal Cart 便會自動尋找優惠、追蹤價格歷史,並在商品補貨時發出通知。這項功能將於今年夏天在美國率先推出,隨後陸續擴展至加拿大、澳洲和英國。
此外,谷歌也發表了一款名為「Daily Brief」的AI驅動個人助理服務,今日起開放美國地區 Google AI Plus、Pro 及 Ultra 訂閱用戶選用。Daily Brief 能整合用戶的電子郵件與日曆,自動歸納當日行程與重點,提供更具實用性的日程總結。谷歌實驗室(Google Labs)副總裁 Josh Woodward 表示,Daily Brief 提供了一個無縫且直觀的 AI 代理入門體驗。
谷歌執行長 皮蔡(Sundar Pichai)表示,公司正邁入「代理化 Gemini 時代」,並強調其在AI開發上已投入數十億美元,預估今年的資本支出將高達1,900億美元。