critic-model

#critic-model

Critic-R: 使用指令调优检索器与自然语言内省反馈改进Agentic Search

Hugging Face Daily Papers ↗ · 2026-05-30 缓存

Critic-R引入了一个框架，使用评判模型在推理智能体和检索器之间提供内省反馈，在推理和训练时间同时提升智能体搜索性能，且无需重新训练智能体。

0 人收藏 0 人点赞

#critic-model

OpenAI Blog ↗ · 2024-06-27 缓存

OpenAI 推出了 CriticGPT，这是一个基于 GPT-4 的模型，旨在捕捉 ChatGPT 代码输出中的错误。当人类训练员使用 CriticGPT 进行代码审查时，他们的成功率比没有辅助工具的训练员高 60%，解决了随着模型能力不断提升，RLHF 面临的根本局限。

0 人收藏 0 人点赞