@no_stp_on_snek:首次在我的 llamacpp 分支上测试了 MTP,使用 turbo4 sym。GX10 硬件。使用 MoE 模型:llmfa…

X AI KOLs Following 模型

摘要

在 llamacpp 分支上使用基于 Qwen 的 MoE 模型测试了多 token 预测,相比 fp16 基线获得了 +0.41% 的 PPL 提升。

昨晚首次在我的 llamacpp 分支上测试了 MTP,使用 turbo4 sym。 GX10 硬件。 使用 MoE 模型:llmfan46/Qwen3.6-35B-A3B-uncensored-heretic-Native-MTP-Preserved +0.41 % PPL 对比 fp16 基线 https://t.co/pwzhfphHCK
查看原文
查看缓存全文

缓存时间: 2026/05/23 08:01

昨晚在我的 llamacpp 分支上首次测试了 MTP,搭配 turbo4 sym 使用。

硬件:GX10。

使用的 MoE 模型:llmfan46/Qwen3.6-35B-A3B-uncensored-heretic-Native-MTP-Preserved

与 fp16 基线相比,PPL 降低了 0.41% https://t.co/pwzhfphHCK

相似文章