human-behavior

#human-behavior

AI系统常以测试中不显现的方式失败？

Reddit r/AI_Agents ↗ · 2026-05-26

讨论AI工作流中干净的基准测试环境与混乱的真实世界使用之间的常见差距，导致生产环境失败，并提及评估平台如Confident AI、Braintrust和Langfuse。

0 人收藏 0 人点赞

#human-behavior

arXiv cs.AI ↗ · 2026-05-14 缓存

BEHAVE是一个混合人工智能框架，用于集体人类动态的实时建模，如arXiv上的一篇预印本所述。

0 人收藏 0 人点赞

#human-behavior

Reddit r/ArtificialInteligence ↗ · 2026-05-11 缓存

一项研究显示，短时间使用 AI 可能会导致认知努力降低和表现下降。

0 人收藏 0 人点赞

#human-behavior

Reddit r/artificial ↗ · 2026-04-21

文章指出，AI幻觉其实映射了人类的认知偏差——确认偏误、过度自信等，它们并非纯粹的技术缺陷，而是像人类一样在知识缺口处“脑补”的结果。

0 人收藏 0 人点赞