当AI显得“过于自信”
摘要
本文探讨了一种心理现象:用户不信任AI,并非因为它出错,而是因为其肯定语气与用户自身内心的不确定性不匹配,并运用期望违背理论来解释这种摩擦。
暂无内容
查看缓存全文
缓存时间: 2026/05/26 06:29
# 当AI感觉“过于肯定”
来源:https://www.behavioralpatch.com/p/when-ai-feels-too-certain
### 行为审计
AI系统中正浮现出一个反复出现的模式:用户常常不信任AI的回答,**并非因为它错了**,而是因为它**听起来比用户自己感受的还要肯定**。这一点在产品反馈、临床决策支持工具、企业Copilot以及日常消费交互中都有体现。
用户请模型帮忙解释一个电子表格。AI给出了一个清晰、断定的回答。用户犹豫了,手动重新检查文件,有时甚至会用更柔和的措辞重新提问(“你确定吗?”)。内容本身是正确的——但**语气**却引发了怀疑。
在医疗场景中,临床医生也报告了类似的模式:当医疗AI系统以高置信度呈现建议时,即使模型在历史上准确率很高,医生们也常常会推翻它。这种不信任并非针对输出,而是针对**AI的确定性与医生自身不确定性之间的不匹配**。
即使在日常使用中,人们也常说AI“听起来太自信了”。他们形容这种语气是“过度自信”、“机器人式的肯定”或“像是在虚张声势”。即便AI明显正确时,这种反应依然存在。
这是一个典型的**期望违反**案例:AI的语气违反了用户内心对系统在推理时应该听起来有多不确定的期望。正如摘要文档所指出的,Behavioral Patch关注的是“人们在日常生活、工作、决策和人际关系中如何从心理上响应机器智能”(Summary.docx),而这正是源于语气而非准确性的心理摩擦的明显例子。
隐藏的张力很简单:**人类期望不确定性是可见的。AI却将其隐藏。**
### 心理学视角
**期望违反理论(EVT)**解释了个体在互动偏离其隐含期望时如何反应。该理论最初用于人际沟通,现在也清晰地适用于人机交互,因为用户会无意识地将AI系统视为社会行动者——这一模式在摘要关于“拟人化”和“情感依恋”的讨论中已有记载(Summary.docx)。
EVT的三个组成部分直接对应了这种行为:
##### 1. 预期的确定性
人类期望复杂的推理看起来是**不确定的**。当AI产生一个结构完美、高度自信的回答时,用户内心“推理应该如何进行”的模型就被违反了。人类将不确定性与智慧联系在一起;而AI将确定性与清晰度联系在一起。
##### 2. 感知的过度自信
当AI的语气超出用户内心的置信水平时,用户会将这种不匹配解读为不可靠的信号。这不是对准确性的理性评估——而是对语气的心理反应。
##### 3. 对认知控制的威胁
用户对自己在AI辅助下的决策正确性负有责任感。过度自信的语气威胁到这种控制感,从而触发了补偿行为:重新检查、重新提问或完全拒绝输出。
EVT预测,当期望被负面违反时,信任就会下降——即使内容是正确的。这与编辑标准强调的“信任、验证行为和问责制”作为核心行为领域是一致的(Editorial Standard.docx)。
这一机制并非关乎正确性,而是关乎**AI表达出的确定性与用户感受到的确定性之间的对齐**。
### 行为补丁
##### 1. 根据认知状态校准语气
AI系统应根据**任务类型**和**用户可能的不确定性**来调节自信程度。对于模糊或解释性任务,更柔和的措辞(“这里有一种解读方式……”)可以减少期望违反。
##### 2. 让不确定性可见
人类信任那些揭示其推理过程的系统。暴露不确定性范围、替代解释或置信区间可以恢复认知对齐。这与摘要强调的“验证行为”和“信任校准”相呼应(Summary.docx)。
##### 3. 允许用户控制自信度设置
一个简单的控制选项——“简洁”、“中立”、“探索性”——让用户选择符合其认知状态的语气。通过赋予用户对AI沟通姿态的自主权,从而减少期望违反。
##### 4. 训练“认知谦逊”
模型的优化不应仅针对正确性,还应针对**适当的自信表达**。这不是模棱两可,而是匹配人类对推理听起来应该怎样的期望。
##### 5. 将自信作为设计界面
自信不仅仅是模型属性——它也是一个用户体验变量。界面应将自信度的展示视为行为设计决策,而非默认的输出风格。
### 关键指标
**置信度对齐偏差(CAD)**衡量的是:
- AI表达出的自信度 **减去**
- 用户对任务感知到的自信度
高CAD预示着:
- 更多的验证行为
- 更少的委托行为
- 较低的信任校准
- 更高的重新提问频率
低CAD预示着更顺畅的采纳和更少的摩擦。
CAD是一个直接反映期望违反机制的行为信号。
### 延伸阅读
##### “期望违反理论”(Burgoon, 2015)(https://doi.org/10.1002/9781118540190.wbeic102)
EVT的基础概述,以及意想不到的沟通行为如何塑造信任和解读。有助于理解为什么语气不匹配会引发不信任。
##### “你能信任你的机器人吗?”(Hancock 等,2011)(https://doi.org/10.1177/1064804611415045)
探讨自信表达如何影响信任形成。表明即使准确性很高,过度自信也会降低信任。
##### *力量的来源:人们如何做决策*(Klein, 2017)
解释人类如何在复杂推理中评估不确定性。有助于理解为什么AI的确定性感觉不自然。
##### “人工智能与不确定性”(Scholes, 2025)(https://doi.org/10.1016/j.risk.2024.100004)
关于不确定性估计的实用概述,以及为什么暴露不确定性能够提高用户信任。
##### *媒介公式*(Reeves & Nass, 1996)
证明人类将计算机视为社会行动者,使EVT直接适用于AI语气。
相似文章
最重要的AI失败可能是虚假自信,而非错误答案
本文认为,最危险的AI失败并非源于错误答案,而是系统基于不完整的数据、过时的上下文或糟糕的假设,以虚假自信行事。这表明AI评估应优先考虑处理不确定性的能力,而非原始智能。
人们现在对AI的感受如何。
本文探讨了围绕AI的社会紧张局势,AI生成的内容越来越多地被当作性格证据,导致真实性危机和地位焦虑,因为人类努力失去了感知价值。
AI幻觉可能比人类更“人性”
文章指出,AI幻觉其实映射了人类的认知偏差——确认偏误、过度自信等,它们并非纯粹的技术缺陷,而是像人类一样在知识缺口处“脑补”的结果。
AI代理最诡异的一点:人类失败模式开始显现
作者观察到AI代理展现出类似人类的失败模式,比如在上下文压力下过度自信和跳过步骤,这表明系统可靠性更多地依赖于稳健的验证和受控环境,而不仅仅是模型智能。
AI最大的风险不是错误答案——而是无人质疑的答案
本文认为,AI最大的风险并非幻觉,而是人类验证能力的逐渐退化,最终导致一个无法质疑AI输出的文明。