test-time-computation

标签

Cards List
#test-time-computation

@DorothyDDU: LoopCoder-v2 已发布 Loop Transformers 重复使用同一个块进行循环隐藏状态优化——让模型“思考”更多……

X AI KOLs Timeline · 2天前 缓存

本文介绍了LoopCoder-v2,一个70亿参数的并行循环变换器系列,用于代码生成,并研究了最优循环次数,发现两个循环能带来显著提升,而更多循环则会导致性能下降。

0 人收藏 0 人点赞
#test-time-computation

测试时个性化:针对缩放失败的一种诊断框架与概率修正方法

arXiv cs.LG · 2026-05-13 缓存

本文提出了测试时个性化(TTP),这是一种通过候选采样和基于奖励的选择来扩展推理时计算,从而提升大语言模型(LLM)个性化能力的框架。该研究诊断了标准奖励模型中的失效模式,并提出了一种概率个性化奖励模型以缓解这些问题。

0 人收藏 0 人点赞
#test-time-computation

PaT:试错后规划,实现高效的测试时代码生成

arXiv cs.CL · 2026-05-11 缓存

本文介绍了 PaT(试错后规划),这是一种用于代码生成的自适应测试时计算策略,在保持与更大模型相当的性能的同时,将推理成本降低了约 69%。

0 人收藏 0 人点赞
#test-time-computation

通过前缀一致性实现可靠的思维链

Hugging Face Daily Papers · 2026-05-08 缓存

本文介绍了“前缀一致性”这一方法,它根据思维链推理中痕迹再生成时的答案重现率对候选响应进行加权。该方法在各种推理模型和基准测试中,以显著少于标准多数投票的令牌数实现了高准确率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈