為重塑其在開源人工智慧(AI)領域的領導地位,Google 已於本月2日推出 Gemma 4 模型,該模型不僅以 Apache 2.0 許可證開放,允許無限制的商業使用,更是基於去年11月發布的 Gemini 3 技術打造,旨在強化裝置端的 AI 應用,並藉此重新吸引流向中國開源模型的開發者。
Gemma 4 的問世,被視為 Google 對其過往 AI 開源策略的重大調整。此前,多家美國大型科技公司傾向維持其大型語言模型(LLM)的封閉策略,導致部分開發者生態系統轉向 DeepSeek 和 Qwen 等中國企業的開源模型,特別是歐洲的新創公司,已開始採用這些模型開發企業代理和聊天機器人。Google 此次透過開放 Gemma 4,意圖扭轉局勢,積極布局十億計 Android 裝置的邊緣 AI 代理市場。
Gemma 4 具備多種尺寸,最小的 E2B 模型專為手機或樹莓派(Raspberry Pi)等裝置設計,強調低功耗與高速度,實現近乎零延遲的運行。此外,還有性能更強的 26B MoE 和 31B Dense 模型,後者在 LMSYS Arena 開源模型排行榜上名列第三,31B Dense 模型在 MMLU 評測中取得 85.2% 的高分,顯示其卓越的推理能力。這些模型均能運行於手機、筆記型電腦或伺服器等裝置,支援多模態輸入(包含影像、圖片、音訊與文字),並涵蓋超過140種語言,大幅超越先前的 Gemma 2 版本。
對開發者而言,Gemma 4 提供極大彈性。其 Apache 2.0 許可證確保使用者對數據擁有完全控制權,且模型可用於離線程式碼輔助、智慧代理開發,甚至在邊緣裝置上處理複雜的推理任務。開發者可透過 Google AI Studio、AI Edge Gallery、Hugging Face、Ollama、Nvidia NIM 或 Docker 等多個平台取得 Gemma 4 模型,並利用 Google Colab 或 Vertex AI 等工具進行微調,加速打造私有 AI 代理與各類邊緣 AI 應用。