Google 於 2026 年 4 月 2 日推出了 Gemma 4,這是他們迄今為止最智能的開放模型。Gemma 4 專為高級推理和 Agentic 工作流程而設計,提供了前所未有的智能參數比。自第一代 Gemma 推出以來,開發者已下載 Gemma 超過 4 億次,建立了超過 10 萬個變體的活躍 Gemmaverse 生態系統。Google 密切關注創新者推動 AI 發展的需求,Gemma 4 正是他們的回應:在 Apache 2.0 許可下,廣泛提供突破性功能 [1]。
業界領先的功能與移動優先 AI
Gemma 4 提供了四種多功能尺寸:Effective 2B (E2B)、Effective 4B (E4B)、26B Mixture of Experts (MoE) 和 31B Dense。整個系列超越了簡單的聊天功能,能夠處理複雜的邏輯和 Agentic 工作流程。大型模型在其尺寸下提供了最先進的性能,其中 31B 模型目前在行業標準的 Arena AI 文本排行榜上排名第三,26B 模型排名第六。Gemma 4 在這些方面超越了比其大 20 倍的模型。對於開發者來說,這種新的智能參數比意味著以顯著降低的硬件開銷實現前沿級別的功能 [1]。
在邊緣設備上,E2B 和 E4B 模型重新定義了設備上的實用性,優先考慮多模態功能、低延遲處理和無縫生態系統整合,而不是原始參數數量 [1]。
強大、易用、開放
為了推動下一代開創性研究和產品,Gemma 4 模型經過專門調整,可在各種硬件上高效運行和微調——從全球數十億的 Android 設備,到筆記本電腦 GPU,再到開發者工作站和加速器。通過使用這些高度優化的模型,開發者可以微調 Gemma 4,以在特定任務上實現最先進的性能 [1]。
Gemma 4 的主要特點包括:
- **高級推理:** 能夠進行多步驟規劃和深度邏輯,Gemma 4 在需要數學和指令遵循的基準測試中表現出顯著改進。
- **Agentic 工作流程:** 本地支持函數調用、結構化 JSON 輸出和本地系統指令,使開發者能夠構建與不同工具和 API 交互並可靠執行工作流程的自主代理。
- **代碼生成:** Gemma 4 支持高質量的離線代碼,將開發者的工作站轉變為本地優先的 AI 代碼助手。
- **視覺和音頻:** 所有模型都本地處理視頻和圖像,支持可變分辨率,並在 OCR 和圖表理解等視覺任務中表現出色。此外,E2B 和 E4B 模型還具有用於語音識別和理解的本地音頻輸入。
- **更長的上下文:** 無縫處理長篇內容。邊緣模型具有 128K 的上下文窗口,而較大的模型提供高達 256K,允許開發者在單個提示中傳遞存儲庫或長文檔。
- **140 多種語言:** Gemma 4 經過 140 多種語言的本地訓練,幫助開發者為全球受眾構建包容性、高性能的應用程序 [1]。