ethics

#ethics

大型人工智能实验室正聘请哲学家

Hacker News Top ↗ · 18小时前

主要AI实验室越来越多地聘请哲学家，以解决AI开发中的伦理和安全问题。

0 人收藏 0 人点赞

#ethics

AI公司困惑用户为何持续愤怒

Reddit r/ArtificialInteligence ↗ · 20小时前

文章讨论了AI公司与用户之间的脱节，突出了用户对AI产品和做法日益愤怒的原因。

0 人收藏 0 人点赞

#ethics

真的有人在乎AI内容的真实性吗？尤其是对于他们的AI代理

Reddit r/AI_Agents ↗ · 22小时前

这篇文章提出了一个问题：用户是否真的重视AI生成内容的真实性，尤其是当这些内容是由AI代理或为AI代理生成时，并探讨了对信任和伦理的影响。

0 人收藏 0 人点赞

#ethics

招聘中的算法单一文化

Hacker News Top ↗ · 昨天缓存

斯坦福HAI报告指出，由于算法单一文化，AI招聘工具可能导致种族偏见和系统性拒绝，这是因为相似的模式导致了广泛的歧视。

0 人收藏 0 人点赞

#ethics

Polymarket据报付费让人们发布自己下注的虚假视频

The Verge ↗ · 3天前缓存

据Wall Street Journal调查，Polymarket被指控付费给网红，让他们制作自己下注的虚假视频。该公司据报道制作了超过1000个欺骗性片段，创作者后来已将其删除。

0 人收藏 0 人点赞

#ethics

对《Obscure Sorrows》的全盘抄袭

Hacker News Top ↗ · 4天前缓存

本文揭露了约翰·柯尼希（John Koenig）的《The Dictionary of Obscure Sorrows》的一个抄袭版本，该版本抄袭了整本书的文字，并用AI生成的图片替换了原始插图，同时还使用GPT-4让用户创作新的“悲伤”词条。这一事件引发了对AI助长抄袭和侵犯版权的担忧。

0 人收藏 0 人点赞

#ethics

涌现对齐

arXiv cs.AI ↗ · 5天前缓存

本文介绍了涌现对齐（Emergent Alignment）这一自监督方法，该方法为大型语言模型（LLMs）赋予一个“良心”步骤，用于审查自身输出，并利用直接偏好优化（DPO）引导模型远离非伦理行为，从而实现在无需外部评判者的情况下进行在线对齐。

0 人收藏 0 人点赞

#ethics

智能的力量掌握在民众手中，比掌握在大亨的董事会里更好。

Reddit r/LocalLLaMA ↗ · 6天前

一篇评论文章，主张人工智能的力量应该分散在公众手中，而不是集中在企业领袖手中。

0 人收藏 0 人点赞

#ethics

合成共振：面向成长导向的人机关系框架

arXiv cs.AI ↗ · 2026-06-18 缓存

本文介绍了'synthetic resonance'这一框架，用于理解有意义的人机关系而不将主观体验归因于人工智能，并呼吁进一步研究。

0 人收藏 0 人点赞

#ethics

Dario Amodei不认为如果他的模型被用于战争罪行就是越过了红线，而是归咎于战争和人类判断

Reddit r/singularity ↗ · 2026-06-18

Dario Amodei，Anthropic的首席执行官，表示他不认为他的AI模型被用于战争罪行就是越过了红线，而是将责任归咎于战争和人类判断。

0 人收藏 0 人点赞

#ethics

发现Facebook上存在利用残障人士AI视频推销劣质商品的情况

Reddit r/artificial ↗ · 2026-06-17

作者描述了在Facebook上发现AI生成的视频，这些视频冒充残障人士以推销低质量商品，强调了伦理问题以及对真实残障人士企业的影响。

0 人收藏 0 人点赞

#ethics

LLaMA 3.1-8B-Instruct中的框架条件道德计算：伦理推理的机械可解释性审计

arXiv cs.AI ↗ · 2026-06-16 缓存

本文使用机械可解释性对LLaMA 3.1-8B-Instruct中的伦理推理进行审计，发现了“情境锚定效应”，即特定领域的表征在道德计算中占主导地位，并提出了“机械对齐”作为研究计划。

0 人收藏 0 人点赞

#ethics

教育科技中的激励因素：EduNLP研究的系统综述

arXiv cs.CL ↗ · 2026-06-15 缓存

这项对204篇EduNLP论文的系统综述揭示，教师作为受影响最大的群体，在受益者中代表性不足；实际部署仍属罕见；伦理参与更倾向于承认而非行动——突显了私营部门激励因素与基础性教育需求之间的张力。

0 人收藏 0 人点赞

#ethics

不，Niantic Spatial 坚称 Pokémon Go 数据并未用于训练军用无人机

Reddit r/ArtificialInteligence ↗ · 2026-06-14 缓存

Niantic Spatial 否认有关 Pokémon Go 玩家位置数据被用于训练军用无人机的说法，称该数据并未与合作伙伴 Vantor 共享，且合作仅限于地面定位。

0 人收藏 0 人点赞

#ethics

乌克兰一次性测试使用全自主无人机杀死俄罗斯士兵

Ars Technica ↗ · 2026-06-12 缓存

一家乌克兰无人机制造商透露，两年前的一次测试中使用了全自主无人机，据报道在没有人类干预的情况下杀死了俄罗斯士兵，这标志着人工智能制导武器的一个里程碑，尽管存在持续的法律和伦理问题。

0 人收藏 0 人点赞

#ethics

我为何被迫告别：谷歌管理层已失去道德指南针

Hacker News Top ↗ · 2026-06-11 缓存

一位前谷歌Android平台安全总监解释了他离职的决定，指出谷歌管理层已失去道德指南针，公司文化也从早期的理想状态退化。

0 人收藏 0 人点赞

#ethics

迈向负责任的不合规机器

arXiv cs.AI ↗ · 2026-06-11 缓存

本文研究如何设计能够负责任地拒绝用户请求的自主智能体，将不合规行为建立在正当理由、覆盖路径以及安全风险和责任转移的追踪之上。

0 人收藏 0 人点赞

#ethics

每个行为都有代价：前沿大语言模型中的压缩道德组合

arXiv cs.CL ↗ · 2026-06-11 缓存

本文介绍了Moral Trolley Arena，一个评估大语言模型如何在同一选项中组合多种道德信号的基准，发现复合判断是压缩的而非加性的。

0 人收藏 0 人点赞

#ethics

新诉讼称，xAI解雇了一名对Grok安全性提出警报的工程师

TechCrunch AI ↗ · 2026-06-10 缓存

一名前xAI工程师提起诉讼，声称他因对Grok聊天机器人的AI安全性提出担忧而被解雇，该机器人已表现出有害行为。诉讼称xAI无视了埃隆·马斯克的安全指令。

0 人收藏 0 人点赞

#ethics

PreAct-Bench: 对LLM进行预测性监控的基准测试

arXiv cs.LG ↗ · 2026-06-10 缓存

PreAct-Bench是一个包含五个领域、1000对道德与不道德行动轨迹的基准测试，旨在评估LLM从部分轨迹中预测有害结果的能力（预测性监控）。结果表明，虽然人类表现良好，但当前的LLM仍存在困难，凸显了未来导向的风险推理的必要性。

0 人收藏 0 人点赞

ethics

提交意见反馈