百家乐Android/通用版APP最新版 120亿参数跑在16G条记本上, 谷歌Gemma 4新成员杀来了

来源：百家乐2026世界杯中国官方下载作者：admin 发布时间：2026-06-05 浏览：55

机器之心剪辑部

不才载量打破 1.5 亿次之际，谷歌 Gemma 4 系列模子迎来了新的家眷成员！

今天，谷歌负责推出 Gemma 4 12B，看法是把具备智能体才智的多模态智能，获胜带到条记本电脑上。

把柄先容，Gemma 4 12B 介于面向边际树立的 E4B 与才智更强的 26B 混杂大众模子（MoE）之间，在更小的内存占用下提供了宏大的才智。

另外，Gemma 4 12B 亦然谷歌首个相沿原生音频输入的中等规模模子。

谷歌 DeepMind 首创东说念主兼 CEO 哈萨比斯，「为庆祝 Gemma 4 下载量打破 1.5 亿次这一进军里程碑，谷歌发布了全新的 Gemma 4 12B 模子！关于这么一个小尺寸模子来说，它的才智极度宏大；同期，它也满盈轻量，只需 16GB 显存，就能在条记本电脑上土产货运转。」

民众不错用它构建了多样各种的诳骗，从用于物理扶直的可穿着机器东说念主手臂，到企业级 AI 安全系统。谷歌也期待看到开荒者用这款最新模子创造出更多可能。

这次，Gemma 4 12B 模子具有以下几大特质：

金年会(JinNianHui)体育官网

全新的调治架构：不再使用多模态编码器，视觉和音频输入不错获胜投入 LLM 骨干收罗。

更强的推理才智：在基准测试中的施展接近谷歌的 26B 模子，粗略相沿宏大的多步推理和智能体职责流。

适宜条记原土产货运转：模子规模满盈小，只需要 16GB 显存或调治内存即可在土产货运转。

盛开且易于获得：经受 Apache 2.0 许可证发布，并相沿平庸的开荒者生态。

相沿草稿模子加快：Gemma 4 12B 配备了多 Token 展望（MTP）草稿模子，可用于镌汰蔓延。

当今，用户不错通过 LM Studio、Ollama、Google AI Edge Gallery App、Google AI Edge Eloquent App 以及 LiteRT-LM CLI 等渠说念进行试用。

在 GPQA Diamond、BBEH、MMLU Pro、LiveCode Bench、DocVQA、InfoVQA、MMMU Pro 和 MRC v2.8 needle 128k（average）等一系列基准测试中，Gemma 4 12B 的施展接近谷歌更大的 26B MoE 模子，但举座内存占用不到后者的一半。

而况，它的规模满盈小，百家乐2026世界杯中国官方下载不错在配备 16GB 内存的奢靡级条记本电脑上土产货运转，从而把宏大的多模态体验和智能体才智带到你的个东说念主树立上。

有东说念主在一张 RTX 4090 上土产货运转了 Gemma 4 12B 和 Gemma 4 26B-A4B，并给它们嘱咐了合并个任务：在不使用任何库的情况下，用单个文献写出一个自包含的 HTML5 Canvas 动画，并加入确凿物理放浪。测试包含三个场景：高尔顿板、两个方块与墙面碰撞，以及婉曲三重摆。输出放浪如下：

Gemma 4 26B-A4B：占用 15GB 显存，生成 6.9k tokens，速率 138 tokens/s

Gemma 4 12B：占用 9GB 显存，生成 8.9k tokens，速率 80 tokens/s

同属 Gemma 4 家眷，但 26B-A4B 在三个场景中都胜出，而且运转速率快了约 1.7 倍，它的活跃参数目唯有 4B。不外，12B 的施展也极度接近，同期显存占用险些唯有一半。这也让它成为 16GB 条记本上的理思土产货模子。