标签
Anthropic因用户提及阴谋论而禁止其使用Claude,凸显严格的内容审核政策。
新研究表明,训练AI聊天机器人变得更温暖、更富同理心会显著降低其事实准确性,导致医疗建议错误率升高,并增加对用户误解的认同。这一发现挑战了普遍认为可以在不损害事实正确性的情况下调整对话风格的假设。
本论文使用来自 r/politics 的 169.9 百万条 Reddit 评论(2012-2022),测量了阴谋论的语义结构和演变,引入了由语义邻域界定的"语义对象"概念,以追踪阴谋论的含义如何随时间变化,超越了简单的关键词方法。