encoder-free

#encoder-free

Gemma 4 12B 原生无编码器语音输入利用建议？

Reddit r/LocalLLaMA ↗ · 2天前

讨论利用 Gemma 4 12B 的无编码器架构实现原生语音输入，寻找现成的低延迟流式音频摄入解决方案。

0 人收藏 0 人点赞

#encoder-free

Google DeepMind Blog ↗ · 2026-06-09 缓存

Google DeepMind 宣布推出 Gemma 4 12B，一种新颖的无编码器多模态 AI 模型，将视觉和音频直接集成到 LLM 主干中，在配备 16GB RAM 的笔记本电脑上提供高级推理和代理能力，以 Apache 2.0 许可证发布。

0 人收藏 0 人点赞

#encoder-free

Reddit r/singularity ↗ · 2026-06-04

谷歌的Gemma 4 12B引入了无需编码器的多模态架构，可与更大模型竞争，但基准测试对比显示它在大多数任务上落后于Qwen 2.5 9B。文章还涵盖了相关进展，包括开放权重模型的安全风险、Uber对Claude Code的支出上限以及NeurIPS对未校准AI检测器的误用。

0 人收藏 0 人点赞

#encoder-free

X AI KOLs Timeline ↗ · 2026-06-03 缓存

Google 新推出的 Gemma 4 12B 是一个纯解码器 transformer，采用无编码器的多模态输入，在达到强大基准性能的同时，尺寸足够小，可以在廉价 GPU 上本地运行。它采用 Apache 2.0 许可证发布。

0 人收藏 0 人点赞

#encoder-free

X AI KOLs Timeline ↗ · 2026-06-03 缓存

谷歌DeepMind研究员宣布发布Gemma 4 12B，一种无编码器的密集模型，可处理文本、图像和音频输入，延续了跨模态统一模型的研究工作。

0 人收藏 0 人点赞

#encoder-free

Product Hunt ↗ · 2026-06-03

谷歌的 Gemma 4 12B 模型通过无编码器架构实现本地多模态AI。

0 人收藏 0 人点赞

#encoder-free

X AI KOLs Timeline ↗ · 2026-06-03 缓存

Google发布Gemma 4 12B，一款原生支持音频、无编码器的多模态模型，专为在笔记本电脑上本地运行而优化，采用Apache 2.0许可证。

0 人收藏 0 人点赞