faithfulness-gap

标签

Cards List
#faithfulness-gap

言行而非推理:定位LLM智能体中的忠实度缺口

arXiv cs.AI · 3天前 缓存

本文通过使用德州扑克作为受控环境,将LLM智能体中的忠实度缺口分解为推理→结论和结论→行动两个步骤。研究发现,结论→行动步骤是可靠的,而推理→结论步骤是不一致的主要来源。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈