标签
本文介绍了TraceLock,这是一种轻量级即插即用控制器,为冻结的扩散语言模型学习令牌提交策略,无需重新训练即可在各种任务中改善质量与步数之间的权衡。
EVE-Agent 提出了一个自我进化搜索智能体框架,通过生成问题、答案和证据片段,并基于证据的边际准确性增益进行训练,确保证据可验证性。这提高了基于依据的正确性,且无需人工标注。