self-supervision

#self-supervision

路径至关重要：为扩散语言模型学习令牌提交策略

arXiv cs.CL ↗ · 2026-05-26 缓存

本文介绍了TraceLock，这是一种轻量级即插即用控制器，为冻结的扩散语言模型学习令牌提交策略，无需重新训练即可在各种任务中改善质量与步数之间的权衡。

0 人收藏 0 人点赞

#self-supervision

arXiv cs.AI ↗ · 2026-05-25 缓存

EVE-Agent 提出了一个自我进化搜索智能体框架，通过生成问题、答案和证据片段，并基于证据的边际准确性增益进行训练，确保证据可验证性。这提高了基于依据的正确性，且无需人工标注。

0 人收藏 0 人点赞