dense-model

#dense-model

Bonsai 27B：使用自定义WebGPU内核在浏览器中本地运行的1比特密集型大语言模型

Reddit r/LocalLLaMA ↗ · 2026-07-14

Bonsai 27B是一个1比特密集型大语言模型，通过使用自定义WebGPU内核可以在浏览器中本地运行，实现高效的设备端推理。

0 人收藏 0 人点赞

#dense-model

Qwen3.5 122B 是最好的吗？

Reddit r/LocalLLaMA ↗ · 2026-07-09

一位用户分享了他们在复杂工具调用任务中比较多个大语言模型（Qwen、Gemma）的经验，认为 Qwen3.5 122B 最可靠，同时批评了较小的 MoE 模型不稳定。

0 人收藏 0 人点赞

#dense-model

在MXFP4下，能装入128 GB内存的最大密集模型是什么？

Reddit r/LocalLLaMA ↗ · 2026-07-01

讨论在MXFP4量化下，能装入128 GB内存的最大密集模型。

0 人收藏 0 人点赞

#dense-model

@analogalok: Gemma 4 12B QAT（密集）在8GB显存和120k上下文下实现超过1000 tokens/秒的预填充速度 Gemma 4 12B QAT（密集），TurboQ…

X AI KOLs Following ↗ · 2026-06-18 缓存

Gemma 4 12B QAT（密集）使用TurboQuant在8GB RTX 4060上实现超过1000 tokens/秒的预填充速度，支持120k上下文，实现完整的GPU层卸载。相比之前的方法，预填充速度提升了42%。

0 人收藏 0 人点赞

#dense-model

@analogalok：我的8GB显存游戏本肯定会恨我这么做，但我还是做了。跑了一个31B稠密模型（Gemma 4…

X AI KOLs Timeline ↗ · 2026-06-16 缓存

用户在8GB显存的游戏本上，使用llama.cpp配合MTP推测解码，以约3 tokens/s的速度运行了Gemma 4 31B稠密模型，展示了在消费级硬件上运行31B稠密模型的可行性，并提出了智能体工作流程：快速MoE模型将困难任务路由给这个较慢的稠密模型。

0 人收藏 0 人点赞

#dense-model

@mtschannen：过去几年，我的研究重点是跨模态统一模型与训练范式。今天我很激动……

X AI KOLs Timeline ↗ · 2026-06-03 缓存

谷歌DeepMind研究员宣布发布Gemma 4 12B，一种无编码器的密集模型，可处理文本、图像和音频输入，延续了跨模态统一模型的研究工作。

0 人收藏 0 人点赞

#dense-model

@lmstudio: Gemma 4 12B 来了！一款紧凑的中型 Gemma 模型，可直接在你的笔记本上运行——由 @google 以 Apache 2.0 许可证发布…

X AI KOLs Timeline ↗ · 2026-06-03 缓存

Google 发布了 Gemma 4 12B，这是一款紧凑的中型模型，可在笔记本上运行，采用 Apache 2.0 许可证，现在已在 LM Studio 中可用。

0 人收藏 0 人点赞

#dense-model

3.6-27B 发布：Dense 与 MoE 差距正迅速缩小

Reddit r/LocalLLaMA ↗ · 2026-04-22

最新 3.6-27B 版本显示，MoE 在代码任务及长上下文场景中正快速逼近 Dense 模型，尽管 Dense 整体仍领先。

0 人收藏 0 人点赞

#dense-model

Qwen3.6-27B：27B稠密模型实现旗舰级代码能力

Simon Willison's Blog ↗ · 2026-04-22 缓存

Qwen发布Qwen3.6-27B，这款27B稠密模型号称代码性能达到旗舰水准，甚至超越更大的Qwen3.5-397B-A17B MoE，并展示了令人惊艳的SVG生成演示。

0 人收藏 0 人点赞

#dense-model

Qwen3.6-27B：270亿稠密模型实现旗舰级代码能力

Hacker News Top ↗ · 2026-04-22

阿里巴巴发布270亿参数稠密模型Qwen3.6-27B，带来旗舰级代码生成表现。

0 人收藏 0 人点赞

dense-model

提交意见反馈