ai-oversight

#ai-oversight

特朗普承诺为AI监管带来秩序，但仅维持了两周。——POLITICO

Reddit r/ArtificialInteligence ↗ · 2026-06-16

特朗普关于为AI监管带来秩序的承诺在两周内就瓦解了，凸显了AI监管的挑战。

0 人收藏 0 人点赞

#ai-oversight

Simon Willison's Blog ↗ · 2026-06-04 缓存

谷歌要求404 Media在文章发布后修改一段表述，删除了"保持人类在决策环节中至关重要"这一措辞——这标志着谷歌在AI监督问题上的表态出现了值得关注的转变。原报道的内容是关于谷歌内部员工互相传阅调侃谷歌AI质量的表情包。

0 人收藏 0 人点赞

#ai-oversight

TechCrunch AI ↗ · 2026-06-02 缓存

在行业反对将早先的90天审查提议缩短后，特朗普总统签署了一项范围缩小的AI监管行政令，要求新AI模型在发布前30天自愿提交政府审查。

0 人收藏 0 人点赞

#ai-oversight

Reddit r/artificial ↗ · 2026-05-15

一篇思想文章，指出随着AI变得更准确，人类监督可能会退化为例行批准，从而产生'信任-监督悖论'，即高性能AI仍可能因不完整的表征、过时数据或自动化偏见而失败，建议从人工审查转向治理边界。

0 人收藏 0 人点赞

#ai-oversight

OpenAI Blog ↗ · 2018-05-03 缓存

OpenAI提出了一种新颖的AI安全方法，其中两个AI代理相互辩论，而人类评判员评估他们的论证，这使人类能够监督行为过于复杂而难以直接理解的AI系统。该方法利用辩论和对抗性推理来使先进AI与人类价值观和偏好保持一致。

0 人收藏 0 人点赞