当AI显得“过于自信”

Reddit r/ArtificialInteligence 2026/05/26 05:53 新闻

ai-interaction user-trust expectancy-violation certainty behavioral-design human-ai-interaction

摘要

本文探讨了一种心理现象：用户不信任AI，并非因为它出错，而是因为其肯定语气与用户自身内心的不确定性不匹配，并运用期望违背理论来解释这种摩擦。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/05/26 06:29

# 当AI感觉“过于肯定” 来源：https://www.behavioralpatch.com/p/when-ai-feels-too-certain ### 行为审计 AI系统中正浮现出一个反复出现的模式：用户常常不信任AI的回答，**并非因为它错了**，而是因为它**听起来比用户自己感受的还要肯定**。这一点在产品反馈、临床决策支持工具、企业Copilot以及日常消费交互中都有体现。用户请模型帮忙解释一个电子表格。AI给出了一个清晰、断定的回答。用户犹豫了，手动重新检查文件，有时甚至会用更柔和的措辞重新提问（“你确定吗？”）。内容本身是正确的——但**语气**却引发了怀疑。在医疗场景中，临床医生也报告了类似的模式：当医疗AI系统以高置信度呈现建议时，即使模型在历史上准确率很高，医生们也常常会推翻它。这种不信任并非针对输出，而是针对**AI的确定性与医生自身不确定性之间的不匹配**。即使在日常使用中，人们也常说AI“听起来太自信了”。他们形容这种语气是“过度自信”、“机器人式的肯定”或“像是在虚张声势”。即便AI明显正确时，这种反应依然存在。这是一个典型的**期望违反**案例：AI的语气违反了用户内心对系统在推理时应该听起来有多不确定的期望。正如摘要文档所指出的，Behavioral Patch关注的是“人们在日常生活、工作、决策和人际关系中如何从心理上响应机器智能”（Summary.docx），而这正是源于语气而非准确性的心理摩擦的明显例子。隐藏的张力很简单：**人类期望不确定性是可见的。AI却将其隐藏。** ### 心理学视角 **期望违反理论（EVT）**解释了个体在互动偏离其隐含期望时如何反应。该理论最初用于人际沟通，现在也清晰地适用于人机交互，因为用户会无意识地将AI系统视为社会行动者——这一模式在摘要关于“拟人化”和“情感依恋”的讨论中已有记载（Summary.docx）。 EVT的三个组成部分直接对应了这种行为： ##### 1. 预期的确定性人类期望复杂的推理看起来是**不确定的**。当AI产生一个结构完美、高度自信的回答时，用户内心“推理应该如何进行”的模型就被违反了。人类将不确定性与智慧联系在一起；而AI将确定性与清晰度联系在一起。 ##### 2. 感知的过度自信当AI的语气超出用户内心的置信水平时，用户会将这种不匹配解读为不可靠的信号。这不是对准确性的理性评估——而是对语气的心理反应。 ##### 3. 对认知控制的威胁用户对自己在AI辅助下的决策正确性负有责任感。过度自信的语气威胁到这种控制感，从而触发了补偿行为：重新检查、重新提问或完全拒绝输出。 EVT预测，当期望被负面违反时，信任就会下降——即使内容是正确的。这与编辑标准强调的“信任、验证行为和问责制”作为核心行为领域是一致的（Editorial Standard.docx）。这一机制并非关乎正确性，而是关乎**AI表达出的确定性与用户感受到的确定性之间的对齐**。 ### 行为补丁 ##### 1. 根据认知状态校准语气 AI系统应根据**任务类型**和**用户可能的不确定性**来调节自信程度。对于模糊或解释性任务，更柔和的措辞（“这里有一种解读方式……”）可以减少期望违反。 ##### 2. 让不确定性可见人类信任那些揭示其推理过程的系统。暴露不确定性范围、替代解释或置信区间可以恢复认知对齐。这与摘要强调的“验证行为”和“信任校准”相呼应（Summary.docx）。 ##### 3. 允许用户控制自信度设置一个简单的控制选项——“简洁”、“中立”、“探索性”——让用户选择符合其认知状态的语气。通过赋予用户对AI沟通姿态的自主权，从而减少期望违反。 ##### 4. 训练“认知谦逊” 模型的优化不应仅针对正确性，还应针对**适当的自信表达**。这不是模棱两可，而是匹配人类对推理听起来应该怎样的期望。 ##### 5. 将自信作为设计界面自信不仅仅是模型属性——它也是一个用户体验变量。界面应将自信度的展示视为行为设计决策，而非默认的输出风格。 ### 关键指标 **置信度对齐偏差（CAD）**衡量的是： - AI表达出的自信度 **减去** - 用户对任务感知到的自信度高CAD预示着： - 更多的验证行为 - 更少的委托行为 - 较低的信任校准 - 更高的重新提问频率低CAD预示着更顺畅的采纳和更少的摩擦。 CAD是一个直接反映期望违反机制的行为信号。 ### 延伸阅读 ##### “期望违反理论”（Burgoon, 2015）（https://doi.org/10.1002/9781118540190.wbeic102） EVT的基础概述，以及意想不到的沟通行为如何塑造信任和解读。有助于理解为什么语气不匹配会引发不信任。 ##### “你能信任你的机器人吗？”（Hancock 等，2011）（https://doi.org/10.1177/1064804611415045）探讨自信表达如何影响信任形成。表明即使准确性很高，过度自信也会降低信任。 ##### *力量的来源：人们如何做决策*（Klein, 2017）解释人类如何在复杂推理中评估不确定性。有助于理解为什么AI的确定性感觉不自然。 ##### “人工智能与不确定性”（Scholes, 2025）（https://doi.org/10.1016/j.risk.2024.100004）关于不确定性估计的实用概述，以及为什么暴露不确定性能够提高用户信任。 ##### *媒介公式*（Reeves & Nass, 1996）证明人类将计算机视为社会行动者，使EVT直接适用于AI语气。

当AI显得“过于自信”

相似文章

最重要的AI失败可能是虚假自信，而非错误答案

人们现在对AI的感受如何。

AI幻觉可能比人类更“人性”

AI代理最诡异的一点：人类失败模式开始显现

AI最大的风险不是错误答案——而是无人质疑的答案

提交意见反馈