标签
谷歌要求404 Media在文章发布后修改一段表述,删除了"保持人类在决策环节中至关重要"这一措辞——这标志着谷歌在AI监督问题上的表态出现了值得关注的转变。原报道的内容是关于谷歌内部员工互相传阅调侃谷歌AI质量的表情包。
在行业反对将早先的90天审查提议缩短后,特朗普总统签署了一项范围缩小的AI监管行政令,要求新AI模型在发布前30天自愿提交政府审查。
一篇思想文章,指出随着AI变得更准确,人类监督可能会退化为例行批准,从而产生'信任-监督悖论',即高性能AI仍可能因不完整的表征、过时数据或自动化偏见而失败,建议从人工审查转向治理边界。
OpenAI提出了一种新颖的AI安全方法,其中两个AI代理相互辩论,而人类评判员评估他们的论证,这使人类能够监督行为过于复杂而难以直接理解的AI系统。该方法利用辩论和对抗性推理来使先进AI与人类价值观和偏好保持一致。