dense-model

标签

Cards List
#dense-model

@mtschannen:过去几年,我的研究重点是跨模态统一模型与训练范式。今天我很激动……

X AI KOLs Timeline · 6小时前 缓存

谷歌DeepMind研究员宣布发布Gemma 4 12B,一种无编码器的密集模型,可处理文本、图像和音频输入,延续了跨模态统一模型的研究工作。

0 人收藏 0 人点赞
#dense-model

@lmstudio: Gemma 4 12B 来了!一款紧凑的中型 Gemma 模型,可直接在你的笔记本上运行——由 @google 以 Apache 2.0 许可证发布…

X AI KOLs Timeline · 7小时前 缓存

Google 发布了 Gemma 4 12B,这是一款紧凑的中型模型,可在笔记本上运行,采用 Apache 2.0 许可证,现在已在 LM Studio 中可用。

0 人收藏 0 人点赞
#dense-model

3.6-27B 发布:Dense 与 MoE 差距正迅速缩小

Reddit r/LocalLLaMA · 2026-04-22

最新 3.6-27B 版本显示,MoE 在代码任务及长上下文场景中正快速逼近 Dense 模型,尽管 Dense 整体仍领先。

0 人收藏 0 人点赞
#dense-model

Qwen3.6-27B:27B稠密模型实现旗舰级代码能力

Simon Willison's Blog · 2026-04-22 缓存

Qwen发布Qwen3.6-27B,这款27B稠密模型号称代码性能达到旗舰水准,甚至超越更大的Qwen3.5-397B-A17B MoE,并展示了令人惊艳的SVG生成演示。

0 人收藏 0 人点赞
#dense-model

Qwen3.6-27B:270亿稠密模型实现旗舰级代码能力

Hacker News Top · 2026-04-22

阿里巴巴发布270亿参数稠密模型Qwen3.6-27B,带来旗舰级代码生成表现。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈