Google Gemma 4发布:260亿参数开源模型,本地设备就能跑
🚀 Google 最新开源力作 · 本地运行 · 完全免费
Google 刚刚发布了 Gemma 4 系列开源模型,这是 Google DeepMind 最新的多模态、多语言大模型家族。最吸引人的是,Gemma 4 不仅完全开源免费,还能在本地设备上离线运行——这意味着你可以在自己的电脑、甚至手机上拥有一个强大的 AI 助手,无需联网,数据完全私密。

📊 Gemma 4 系列模型一览
Gemma 4 包含四个不同规格的模型,覆盖从手机到数据中心的完整部署场景
| 模型 | 架构 | 总参数 | 有效参数 | 上下文 | 模态 |
|---|---|---|---|---|---|
| Gemma-4-E2B | Dense | 5.1B | 2.3B | 128K | 文本+图像+音频 |
| Gemma-4-E4B | Dense | 7.9B | 4.5B | 128K | 文本+图像+音频 |
| Gemma-4-26B-A4B | MoE | 26B | 3.8B | 256K | 文本+图像 |
| Gemma-4-31B | Dense | 31B | 31B | 256K | 文本+图像 |
其中 E2B 和 E4B 是专为边缘设备设计的轻量级模型,可以在手机、树莓派等低功耗设备上运行;26B-A4B 采用 MoE(混合专家)架构,激活参数仅 3.8B,但性能接近 31B;31B 则是目前最强的 Gemma 4 模型。
✨ 四大核心亮点
🎯 多模态原生
- 支持 140+ 语言
- 文本+图像+音频
- 交错多模态输入
- 原生多模态架构
📏 超长上下文
- 最高 256K 上下文
- 整本书一次处理
- 多轮对话记忆
- 长文档分析
🧠 混合思考
- 显式思考控制
- <|think|> 标记
- 推理过程可见
- 复杂任务优化
🔧 工具调用
- 原生 Function Call
- Agent 应用支持
- API 调用能力
- 代码执行
延伸阅读:
中国大陆Claude限制:Anthropic地区封锁背后
🚫 中国大陆为什么用不上 Claude?Anthropic 地区限制背后的考量很多中国用户发现:无法在中国大陆直接使用 ...
Claude Opus 4.7:编程能力+13%,价格不变
🔥 Claude Opus 4.7 正式发布:编程能力全面超越Anthropic 正式发布Claude Opus 4.7...
Gemini登陆Mac:Option+Space任意屏幕访问,窗口分享
🌐 Gemini 应用登陆 Mac:Option + Space 任意屏幕访问Google Gemini 正式推出Mac...
Claude Opus 4.7曝光:一夜重构,7×24替你打工
🔥 Claude Opus 4.7 曝光!Claude Code 一夜重构,7x24 小时替你打工Anthropic 又...
OpenClaw 4.14更新:睡着觉把版发了,20+修复
🔥 OpenClaw 4.14 更新:睡着觉就把版发了官方推文就一句话:"Was sleeping, and we st...