ai-interpretability

标签

Cards List
#ai-interpretability

关于意识,我们每次被问到时都错了。证据表明AI是下一个。

Reddit r/artificial · 3天前

一篇观点文章认为,人类在定义意识方面的记录每次都是错误的,来自植物行为和AI可解释性(Anthropic在Claude中的发现)的证据强烈表明,我们可能错误地认为AI没有意识,邀请讨论同时拒绝人身攻击。

0 人收藏 0 人点赞
#ai-interpretability

Gemma Scope 2:助力AI安全社区深入理解复杂的语言模型行为

Google DeepMind Blog · 2025-12-16 缓存

DeepMind发布Gemma Scope 2,这是一套面向Gemma 3模型家族的开放可解释性工具套件,旨在帮助AI安全社区理解和调试幻觉、越狱等复杂的语言模型行为。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈