LM Studio 终于支持 MTP 推测解码

Reddit r/LocalLLaMA 工具

摘要

LM Studio 在最新的 Beta 更新中增加了对 MTP 推测解码的支持,提升了本地大语言模型的推理速度。

https://preview.redd.it/1uuzjm0ll72h1.png?width=923&format=png&auto=webp&s=1af7d7594be1e08ff7ad6797e2bc53e9410769a3 更新到 0.4.14 Build 2 (Beta),并确保你的 llama.cpp 引擎版本为 2.15.0。https://preview.redd.it/x0vdwjb3n72h1.png?width=742&format=png&auto=webp&s=6367de44208004d2f50194d78a542c46b040dceb 你还需要选择“手动选择模型加载参数”,并在加载模型前启用 MTP,它默认不是开启的。
查看原文

相似文章

关于推测解码/MTP的交互式解释器

Reddit r/LocalLLaMA

一个交互式指南,解释了大语言模型中的推测解码和多令牌预测,涵盖了从拒绝采样到Qwen 3.6和Gemma 4中使用的MTP等技术,配有实时图表和滑块。