critic-model

标签

Cards List
#critic-model

Critic-R: 使用指令调优检索器与自然语言内省反馈改进Agentic Search

Hugging Face Daily Papers · 2026-05-30 缓存

Critic-R引入了一个框架,使用评判模型在推理智能体和检索器之间提供内省反馈,在推理和训练时间同时提升智能体搜索性能,且无需重新训练智能体。

0 人收藏 0 人点赞
#critic-model

用 GPT-4 发现 GPT-4 的错误

OpenAI Blog · 2024-06-27 缓存

OpenAI 推出了 CriticGPT,这是一个基于 GPT-4 的模型,旨在捕捉 ChatGPT 代码输出中的错误。当人类训练员使用 CriticGPT 进行代码审查时,他们的成功率比没有辅助工具的训练员高 60%,解决了随着模型能力不断提升,RLHF 面临的根本局限。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈