标签
本文将智能体工具使用中的信任校准形式化为一个偏好学习问题,利用高斯过程和贝叶斯优化来决定AI代理的行为何时应自主执行或需要人类批准。
本文研究了使用大语言模型生成多模态行为(语言、声音、手势、面部表情)以校准社交互动代理中的信任。研究发现,虽然大语言模型能够生成与预期可信赖特征一致的行为,但也会再现社会性别刻板印象。