interactive-improvement

标签

Cards List
#interactive-improvement

是什么驱动了反馈带来的交互式改进?

arXiv cs.AI · 2天前 缓存

本文研究了在多轮语言智能体场景中,自然语言反馈带来的改进是否超越了仅靠反复尝试所取得的提升。通过跨多个基准测试的受控学生-教师协议,作者发现自我生成的反馈几乎没有额外增益,而强大的外部教师则能带来显著更大的提升,并且学生根据反馈采取行动的能力是关键瓶颈。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈