config-i

#config-i

@no_stp_on_snek: MiniMax-M3 的 Config-I 量化版本已发布在 MLX 上。2-bit 专家、4-bit 注意力、8-bit 边界与嵌入、f16 路由器。约…

X AI KOLs Following ↗ · 2026-06-16 缓存

发布了 MiniMax-M3 的 Config-I 量化版本，在 MLX 上使用 2-bit 专家和 4-bit 注意力，将 427B MoE 模型从 869GB 减少到约 167GB，但该量化版本未经测试且需要为 mlx_lm 打补丁。

0 人收藏 0 人点赞