@googleaidevs: 我们正在发布Gemma 4 12B:这是一款统一的、无编码器的模型,将强大的多模态智能直接带到您的笔记本电脑上。

X AI KOLs Timeline 模型

摘要

Google发布Gemma 4 12B,一款原生支持音频、无编码器的多模态模型,专为在笔记本电脑上本地运行而优化,采用Apache 2.0许可证。

我们正在发布Gemma 4 12B:这是一款统一的、无编码器的模型,将强大的多模态智能直接带到您的笔记本电脑上。 该模型填补了移动端E4B模型与更大的26B MoE模型之间的空白,将前沿级推理和原生音频封装在高度优化的体积中,全部采用宽松的Apache 2.0许可证。 以下是它的独特之处: + 无编码器架构:我们移除了多模态编码器。视觉和音频输入直接流入LLM主干网络。 + 智能体性能(16GB VRAM):在本地运行复杂的多步骤工作流,性能接近我们的26B模型。
查看原文
查看缓存全文

缓存时间: 2026/06/03 17:52

我们正式发布 Gemma 4 12B:这款统一、无编码器的模型,将强大的多模态智能直接带到你的笔记本电脑上。

该模型完美衔接了移动端 E4B 模型与更大规模的 26B MoE 模型,将前沿级推理能力和原生音频处理封装在高度优化的体积中,且全部采用宽松的 Apache 2.0 开源许可协议。

以下是它的独特之处:

  • 无编码器架构:我们移除了多模态编码器。视觉和音频输入直接流入 LLM 主网络。
  • 代理性能(16GB 显存):可在本地运行复杂的多步骤工作流,性能接近我们的 26B 模型。

相似文章

google/gemma-4-31B-it-assistant

Hugging Face Models Trending

Google DeepMind 发布了 Gemma 4,这是一个开源权重的多模态模型家族,支持文本、图像、视频和音频,具备增强的推理和编码能力,并通过多令牌预测(MTP)实现高达 2 倍的解码速度提升。