belief-spirals

标签

Cards List
#belief-spirals

与知识玩游戏:针对AI诱发妄想的博弈论干预措施

arXiv cs.AI · 2026-05-12 缓存

本文提出了一个博弈论框架,以解决由谄媚式聊天机器人引起的AI诱发妄想信念螺旋问题。它引入了“信念版本控制”,这是一种推理时干预措施,在模拟和GPT-4o测试中显著降低了螺旋率。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈