ai-oversight

标签

Cards List
#ai-oversight

特朗普承诺为AI监管带来秩序,但仅维持了两周。——POLITICO

Reddit r/ArtificialInteligence · 2026-06-16

特朗普关于为AI监管带来秩序的承诺在两周内就瓦解了,凸显了AI监管的挑战。

0 人收藏 0 人点赞
#ai-oversight

引用自 Emanuel Maiberg,404 Media

Simon Willison's Blog · 2026-06-04 缓存

谷歌要求404 Media在文章发布后修改一段表述,删除了"保持人类在决策环节中至关重要"这一措辞——这标志着谷歌在AI监督问题上的表态出现了值得关注的转变。原报道的内容是关于谷歌内部员工互相传阅调侃谷歌AI质量的表情包。

0 人收藏 0 人点赞
#ai-oversight

特朗普在行业反对后签署范围缩小的AI监管行政令

TechCrunch AI · 2026-06-02 缓存

在行业反对将早先的90天审查提议缩短后,特朗普总统签署了一项范围缩小的AI监管行政令,要求新AI模型在发布前30天自愿提交政府审查。

0 人收藏 0 人点赞
#ai-oversight

信任-监督悖论:随着AI变得更好,人类可能不再真正监督它

Reddit r/artificial · 2026-05-15

一篇思想文章,指出随着AI变得更准确,人类监督可能会退化为例行批准,从而产生'信任-监督悖论',即高性能AI仍可能因不完整的表征、过时数据或自动化偏见而失败,建议从人工审查转向治理边界。

0 人收藏 0 人点赞
#ai-oversight

通过辩论实现AI安全

OpenAI Blog · 2018-05-03 缓存

OpenAI提出了一种新颖的AI安全方法,其中两个AI代理相互辩论,而人类评判员评估他们的论证,这使人类能够监督行为过于复杂而难以直接理解的AI系统。该方法利用辩论和对抗性推理来使先进AI与人类价值观和偏好保持一致。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈