标签
Mudler 发布了 Qwen3.6-35B-A3B-Claude-4.7-Opus-Reasoning-Distilled 模型的 APEX-MTP GGUF 量化版本,将多 token 预测头捆绑在一起,用于与 llama.cpp 的自推测解码。