confidence-profiling

#confidence-profiling

Fast-dLLM++：用于更快扩散LLM推理的Fr\'{e}chet剖面解码

arXiv cs.CL ↗ · 2026-06-03 缓存

Fast-dLLM++ 引入了适用于扩散LLM的Fr\'{e}chet剖面解码，这是一种无需训练的方法，基于异构置信度剖面选择并行提交集。在LLaDA-8B模型的基准测试中，它实现了高达37%的吞吐量提升，同时保持可比的准确性。

0 人收藏 0 人点赞