self-critique

#self-critique

将写作Agent与审校Agent分开是否真的优于单Agent自我批评？

Reddit r/AI_Agents ↗ · 2026-06-30

作者质疑在多Agent架构中分离写作Agent与审校Agent是否比单一Agent带自我批评步骤更具优势，并分享了构建doc-to-wiki系统的经验。

0 人收藏 0 人点赞

#self-critique

Reddit r/ArtificialInteligence ↗ · 2026-05-31

Anthropic的Claude Opus 4.8更新大幅减少了自信但错误的答案，在报告有缺陷的结果上得分为0%，并提供了一个提示词来利用这一改进进行关键的自我批判。

0 人收藏 0 人点赞

#self-critique

arXiv cs.AI ↗ · 2026-05-18 缓存

本文介绍了ICRL框架，该框架联合训练求解器和批判器，通过强化学习内化批判指导，使求解器无需外部批判即可自我改进。它使用分布校准和角色分组优势估计，在智能体和数学推理任务上比GRPO提高了6-7个点。

0 人收藏 0 人点赞