Google 今(18)日宣布擴展 Gemini 3 家族,推出 Gemini 3 Flash,這款模型結合 Pro 級推理能力與 Flash 的低延遲、低成本特性,即日起於 Gemini App、搜尋服務「AI 模式」與開發者平台全球上線,為日常任務與代理式工作流程帶來重大升級。
你可以用它更快速地看見、聆聽並理解各種類型的資訊。例如,你可以要求 Gemini理解影片與圖片,並在短短幾秒鐘內將內容轉化為實用的行動計畫。
你甚至可以在完全沒有程式設計知識的情況下,僅憑語音就能從零開始構建有趣且實用的App。只需隨時隨地對著Gemini口述想法,它就能在幾分鐘內將你凌亂的思緒轉化為可以運作的應用程式。
只需向 Gemini 3 Flash 描述你的創意,即可在幾分鐘內將其轉化為可運作的原型。(如下圖,翻攝Google/YouTube)
Gemini 3 Flash 現在已成為 Gemini 應用程式的預設模型,取代了 2.5 Flash。這表示全球所有 Gemini 使用者都能免費體驗 Gemini 3。
Gemini 3 Flash 也成為支援全球搜尋裡 AI 模式的預設模型。
Google產品管理資深總經理Tulsee Doshi,代表 Gemini團隊在官方部落格發文指出,上個月,以 Gemini 3 Pro 與 Gemini 3 Deep Think 模式開啟了 Gemini 3 的新篇章,市場反應非常熱烈。自發布以來,Gemini的 API 每日處理量已突破 1 兆個詞元。也看到使用者運用 Gemini 3 進行「直覺式程式開發(vibe coding)」模擬去學習複雜的課題、設計互動遊戲,並理解各種形式的多模態內容。
隨著 Gemini 3 的問世,在複雜的推理、多模態與視覺理解,以及代理式(agentic)與直覺式(vibe)程式開展現了前瞻的效能。Gemini 3 Flash 繼承了這樣的基礎,把 Gemini 3 Pro 等級的推理能力與 Flash 系列的低延遲、高效率與低成本完美結合,不但能提升日常任務的推理品質,更是目前處理代理式工作流程最出色的模型。
即日起,Gemini 3 Flash 將陸續推送到全球數百萬名使用者:
• 開發者: 可透過 Google AI Studio 中的 Gemini API、Gemini CLI,以及全新的代理式開發平台 Google Antigravity 使用。
• 一般使用者: 可透過 Gemini 應用程式,以及搜尋服務中的「AI 模式」使用。
• 企業客戶: 可透過 Vertex AI 與 Gemini Enterprise 使用。
Gemini 3 Flash 證明了模型要達到速度與規模,不需要以犧牲智慧作為代價。它在 GPQA Diamond (90.4%) 和 Humanity’s Last Exam (在不使用工具下為 33.7%) 等博士級推理與知識基準測試中展現了領先效能,足以媲美更大型的前瞻模型,且在多項指標上顯著超越了前代最強的 2.5 模型 Gemini 2.5 Pro。
此外,它在 MMMU Pro 測試中獲得了 81.2% 的優異成績,達到業界領先水準,表現與 Gemini 3 Pro 相當。
Gemini 3 Flash 的設計核心在於極致效率,挑戰了「品質、成本與速度」三者權衡最佳狀態的帕雷托前沿(Pareto frontier)。在處理最高階的思考任務時,Gemini 3 Flash 能調節其思考量:針對複雜案例進行更長時間的思考,但在處理日常任務時,平均使用的詞元數比 2.5 Pro 減少了 30%,同時維持更高的效能與準確度。
Gemini 3 Flash 的強項在於其原始速度,這延續了開發者與消費者喜愛的 Flash 系列特質。它的表現優於 2.5 Pro,速度提升3倍(根據 Artificial Analysis 基準測試),且只需要原來極小比例的成本。Gemini 3 Flash 的定價為每百萬輸入詞元 0.50美元,每百萬輸出詞元 3 美元(音訊輸入維持在每百萬詞元 1美元)。
Gemini 3 Flash 專為疊代開發(iterative development)設計,提供 Gemini 3 Pro 級別的程式設計效能與低延遲——它能在高頻率的工作流程中快速推理並解決任務。在評估程式設計代理能力的基準測試 SWE-bench Verified 中,Gemini 3 Flash 獲得78%的高分,不僅超越 2.5 系列,也超越了 Gemini 3 Pro。對於代理式程式設計、生產級系統以及高靈敏度的互動式應用程式而言,它達到了理想的平衡。
Gemini 3 Flash 在推理、工具呼叫與多模態能力方面的強大表現,非常適合希望進行複雜影片分析、數據擷取與視覺問答的開發者。這意味著它能實現更智慧的應用——例如遊戲內助手或 A/B 測試實驗——這些場景同時需要快速回應與深層推理。
Gemini 3 Flash 在手部追蹤的「拋球解謎遊戲」中實現了多模態推理,提供近乎即時的 AI 輔助。
Gemini 3 Flash 能幾乎即時地構建並進行新的載入狀態旋轉圖示的 A/B 測試,簡化從設計到程式設計的過程。
包括 JetBrains、Bridgewater Associates 與 Figma 在內的企業,已開始運用 Gemini 3 Flash 轉型他們的業務,並表示其推論速度、效率與推理能力足以媲美更大型的模型。
本文由《品觀點》授權提供
