self-supervision

标签

Cards List
#self-supervision

路径至关重要:为扩散语言模型学习令牌提交策略

arXiv cs.CL · 2026-05-26 缓存

本文介绍了TraceLock,这是一种轻量级即插即用控制器,为冻结的扩散语言模型学习令牌提交策略,无需重新训练即可在各种任务中改善质量与步数之间的权衡。

0 人收藏 0 人点赞
#self-supervision

EVE-Agent: 可验证证据的自我进化智能体

arXiv cs.AI · 2026-05-25 缓存

EVE-Agent 提出了一个自我进化搜索智能体框架,通过生成问题、答案和证据片段,并基于证据的边际准确性增益进行训练,确保证据可验证性。这提高了基于依据的正确性,且无需人工标注。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈