trust-calibration

#trust-calibration

渐进自主性作为偏好学习：智能体工具使用中信任校准的形式化

arXiv cs.AI ↗ · 2026-05-20 缓存

本文将智能体工具使用中的信任校准形式化为一个偏好学习问题，利用高斯过程和贝叶斯优化来决定AI代理的行为何时应自主执行或需要人类批准。

0 人收藏 0 人点赞

#trust-calibration

arXiv cs.CL ↗ · 2026-05-20 缓存

本文研究了使用大语言模型生成多模态行为（语言、声音、手势、面部表情）以校准社交互动代理中的信任。研究发现，虽然大语言模型能够生成与预期可信赖特征一致的行为，但也会再现社会性别刻板印象。

0 人收藏 0 人点赞