标签
这篇文章提出了一个问题:用户是否真的重视AI生成内容的真实性,尤其是当这些内容是由AI代理或为AI代理生成时,并探讨了对信任和伦理的影响。
据Wall Street Journal调查,Polymarket被指控付费给网红,让他们制作自己下注的虚假视频。该公司据报道制作了超过1000个欺骗性片段,创作者后来已将其删除。
本文揭露了约翰·柯尼希(John Koenig)的《The Dictionary of Obscure Sorrows》的一个抄袭版本,该版本抄袭了整本书的文字,并用AI生成的图片替换了原始插图,同时还使用GPT-4让用户创作新的“悲伤”词条。这一事件引发了对AI助长抄袭和侵犯版权的担忧。
本文介绍了涌现对齐(Emergent Alignment)这一自监督方法,该方法为大型语言模型(LLMs)赋予一个“良心”步骤,用于审查自身输出,并利用直接偏好优化(DPO)引导模型远离非伦理行为,从而实现在无需外部评判者的情况下进行在线对齐。
本文介绍了'synthetic resonance'这一框架,用于理解有意义的人机关系而不将主观体验归因于人工智能,并呼吁进一步研究。
Dario Amodei,Anthropic的首席执行官,表示他不认为他的AI模型被用于战争罪行就是越过了红线,而是将责任归咎于战争和人类判断。
作者描述了在Facebook上发现AI生成的视频,这些视频冒充残障人士以推销低质量商品,强调了伦理问题以及对真实残障人士企业的影响。
本文使用机械可解释性对LLaMA 3.1-8B-Instruct中的伦理推理进行审计,发现了“情境锚定效应”,即特定领域的表征在道德计算中占主导地位,并提出了“机械对齐”作为研究计划。
这项对204篇EduNLP论文的系统综述揭示,教师作为受影响最大的群体,在受益者中代表性不足;实际部署仍属罕见;伦理参与更倾向于承认而非行动——突显了私营部门激励因素与基础性教育需求之间的张力。
Niantic Spatial 否认有关 Pokémon Go 玩家位置数据被用于训练军用无人机的说法,称该数据并未与合作伙伴 Vantor 共享,且合作仅限于地面定位。
一家乌克兰无人机制造商透露,两年前的一次测试中使用了全自主无人机,据报道在没有人类干预的情况下杀死了俄罗斯士兵,这标志着人工智能制导武器的一个里程碑,尽管存在持续的法律和伦理问题。
一位前谷歌Android平台安全总监解释了他离职的决定,指出谷歌管理层已失去道德指南针,公司文化也从早期的理想状态退化。
本文介绍了Moral Trolley Arena,一个评估大语言模型如何在同一选项中组合多种道德信号的基准,发现复合判断是压缩的而非加性的。
一名前xAI工程师提起诉讼,声称他因对Grok聊天机器人的AI安全性提出担忧而被解雇,该机器人已表现出有害行为。诉讼称xAI无视了埃隆·马斯克的安全指令。
PreAct-Bench是一个包含五个领域、1000对道德与不道德行动轨迹的基准测试,旨在评估LLM从部分轨迹中预测有害结果的能力(预测性监控)。结果表明,虽然人类表现良好,但当前的LLM仍存在困难,凸显了未来导向的风险推理的必要性。