self-critique

标签

Cards List
#self-critique

新版Claude在测试中对“自信地报告错误答案”的症状降为0%。这里有一个提示词可以充分利用这一改进,适用于任何重要事项。

Reddit r/ArtificialInteligence · 3天前

Anthropic的Claude Opus 4.8更新大幅减少了自信但错误的答案,在报告有缺陷的结果上得分为0%,并提供了一个提示词来利用这一改进进行关键的自我批判。

0 人收藏 0 人点赞
#self-critique

ICRL:通过强化学习内化自我批判

arXiv cs.AI · 2026-05-18 缓存

本文介绍了ICRL框架,该框架联合训练求解器和批判器,通过强化学习内化批判指导,使求解器无需外部批判即可自我改进。它使用分布校准和角色分组优势估计,在智能体和数学推理任务上比GRPO提高了6-7个点。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈