@googleaidevs: 我们正在发布Gemma 4 12B:这是一款统一的、无编码器的模型,将强大的多模态智能直接带到您的笔记本电脑上。
摘要
Google发布Gemma 4 12B,一款原生支持音频、无编码器的多模态模型,专为在笔记本电脑上本地运行而优化,采用Apache 2.0许可证。
我们正在发布Gemma 4 12B:这是一款统一的、无编码器的模型,将强大的多模态智能直接带到您的笔记本电脑上。
该模型填补了移动端E4B模型与更大的26B MoE模型之间的空白,将前沿级推理和原生音频封装在高度优化的体积中,全部采用宽松的Apache 2.0许可证。
以下是它的独特之处:
+ 无编码器架构:我们移除了多模态编码器。视觉和音频输入直接流入LLM主干网络。
+ 智能体性能(16GB VRAM):在本地运行复杂的多步骤工作流,性能接近我们的26B模型。
查看缓存全文
缓存时间: 2026/06/03 17:52
我们正式发布 Gemma 4 12B:这款统一、无编码器的模型,将强大的多模态智能直接带到你的笔记本电脑上。
该模型完美衔接了移动端 E4B 模型与更大规模的 26B MoE 模型,将前沿级推理能力和原生音频处理封装在高度优化的体积中,且全部采用宽松的 Apache 2.0 开源许可协议。
以下是它的独特之处:
- 无编码器架构:我们移除了多模态编码器。视觉和音频输入直接流入 LLM 主网络。
- 代理性能(16GB 显存):可在本地运行复杂的多步骤工作流,性能接近我们的 26B 模型。
相似文章
@_philschmid:我们刚刚发布了 Gemma 4 12B!这是我们首个具备原生音频输入的中型模型。Gemma 4 12B 是一个统一的、无需编码器的多模态模型。
我们刚刚发布了 Gemma 4 12B,一个中型多模态模型,支持原生音频输入,仅需 16GB 内存,并以 Apache 2.0 许可证发布。
@mtschannen:过去几年,我的研究重点是跨模态统一模型与训练范式。今天我很激动……
谷歌DeepMind研究员宣布发布Gemma 4 12B,一种无编码器的密集模型,可处理文本、图像和音频输入,延续了跨模态统一模型的研究工作。
谷歌新推出的Gemma 4 12B模型旨在任何配备16GB RAM的笔记本电脑上运行
谷歌发布Gemma 4 12B,这是一款紧凑型AI模型,专为仅需16GB RAM的本地笔记本使用而优化,具备多令牌预测以及针对文本、音频和图像的简化多模态能力。
google/gemma-4-31B-it-assistant
Google DeepMind 发布了 Gemma 4,这是一个开源权重的多模态模型家族,支持文本、图像、视频和音频,具备增强的推理和编码能力,并通过多令牌预测(MTP)实现高达 2 倍的解码速度提升。
Gemma 4 发布:前沿多模态智能,端侧可用
Google DeepMind 发布 Gemma 4,这是一系列前沿多模态模型,已在 Hugging Face 上以 Apache 2 协议开源,针对端侧部署进行了优化,并支持多种推理框架。