ethics

标签

Cards List
#ethics

大型人工智能实验室正聘请哲学家

Hacker News Top · 18小时前

主要AI实验室越来越多地聘请哲学家,以解决AI开发中的伦理和安全问题。

0 人收藏 0 人点赞
#ethics

AI公司困惑用户为何持续愤怒

Reddit r/ArtificialInteligence · 20小时前

文章讨论了AI公司与用户之间的脱节,突出了用户对AI产品和做法日益愤怒的原因。

0 人收藏 0 人点赞
#ethics

真的有人在乎AI内容的真实性吗?尤其是对于他们的AI代理

Reddit r/AI_Agents · 22小时前

这篇文章提出了一个问题:用户是否真的重视AI生成内容的真实性,尤其是当这些内容是由AI代理或为AI代理生成时,并探讨了对信任和伦理的影响。

0 人收藏 0 人点赞
#ethics

招聘中的算法单一文化

Hacker News Top · 昨天 缓存

斯坦福HAI报告指出,由于算法单一文化,AI招聘工具可能导致种族偏见和系统性拒绝,这是因为相似的模式导致了广泛的歧视。

0 人收藏 0 人点赞
#ethics

Polymarket据报付费让人们发布自己下注的虚假视频

The Verge · 3天前 缓存

据Wall Street Journal调查,Polymarket被指控付费给网红,让他们制作自己下注的虚假视频。该公司据报道制作了超过1000个欺骗性片段,创作者后来已将其删除。

0 人收藏 0 人点赞
#ethics

对《Obscure Sorrows》的全盘抄袭

Hacker News Top · 4天前 缓存

本文揭露了约翰·柯尼希(John Koenig)的《The Dictionary of Obscure Sorrows》的一个抄袭版本,该版本抄袭了整本书的文字,并用AI生成的图片替换了原始插图,同时还使用GPT-4让用户创作新的“悲伤”词条。这一事件引发了对AI助长抄袭和侵犯版权的担忧。

0 人收藏 0 人点赞
#ethics

涌现对齐

arXiv cs.AI · 5天前 缓存

本文介绍了涌现对齐(Emergent Alignment)这一自监督方法,该方法为大型语言模型(LLMs)赋予一个“良心”步骤,用于审查自身输出,并利用直接偏好优化(DPO)引导模型远离非伦理行为,从而实现在无需外部评判者的情况下进行在线对齐。

0 人收藏 0 人点赞
#ethics

智能的力量掌握在民众手中,比掌握在大亨的董事会里更好。

Reddit r/LocalLLaMA · 6天前

一篇评论文章,主张人工智能的力量应该分散在公众手中,而不是集中在企业领袖手中。

0 人收藏 0 人点赞
#ethics

合成共振:面向成长导向的人机关系框架

arXiv cs.AI · 2026-06-18 缓存

本文介绍了'synthetic resonance'这一框架,用于理解有意义的人机关系而不将主观体验归因于人工智能,并呼吁进一步研究。

0 人收藏 0 人点赞
#ethics

Dario Amodei不认为如果他的模型被用于战争罪行就是越过了红线,而是归咎于战争和人类判断

Reddit r/singularity · 2026-06-18

Dario Amodei,Anthropic的首席执行官,表示他不认为他的AI模型被用于战争罪行就是越过了红线,而是将责任归咎于战争和人类判断。

0 人收藏 0 人点赞
#ethics

发现Facebook上存在利用残障人士AI视频推销劣质商品的情况

Reddit r/artificial · 2026-06-17

作者描述了在Facebook上发现AI生成的视频,这些视频冒充残障人士以推销低质量商品,强调了伦理问题以及对真实残障人士企业的影响。

0 人收藏 0 人点赞
#ethics

LLaMA 3.1-8B-Instruct中的框架条件道德计算:伦理推理的机械可解释性审计

arXiv cs.AI · 2026-06-16 缓存

本文使用机械可解释性对LLaMA 3.1-8B-Instruct中的伦理推理进行审计,发现了“情境锚定效应”,即特定领域的表征在道德计算中占主导地位,并提出了“机械对齐”作为研究计划。

0 人收藏 0 人点赞
#ethics

教育科技中的激励因素:EduNLP研究的系统综述

arXiv cs.CL · 2026-06-15 缓存

这项对204篇EduNLP论文的系统综述揭示,教师作为受影响最大的群体,在受益者中代表性不足;实际部署仍属罕见;伦理参与更倾向于承认而非行动——突显了私营部门激励因素与基础性教育需求之间的张力。

0 人收藏 0 人点赞
#ethics

不,Niantic Spatial 坚称 Pokémon Go 数据并未用于训练军用无人机

Reddit r/ArtificialInteligence · 2026-06-14 缓存

Niantic Spatial 否认有关 Pokémon Go 玩家位置数据被用于训练军用无人机的说法,称该数据并未与合作伙伴 Vantor 共享,且合作仅限于地面定位。

0 人收藏 0 人点赞
#ethics

乌克兰一次性测试使用全自主无人机杀死俄罗斯士兵

Ars Technica · 2026-06-12 缓存

一家乌克兰无人机制造商透露,两年前的一次测试中使用了全自主无人机,据报道在没有人类干预的情况下杀死了俄罗斯士兵,这标志着人工智能制导武器的一个里程碑,尽管存在持续的法律和伦理问题。

0 人收藏 0 人点赞
#ethics

我为何被迫告别:谷歌管理层已失去道德指南针

Hacker News Top · 2026-06-11 缓存

一位前谷歌Android平台安全总监解释了他离职的决定,指出谷歌管理层已失去道德指南针,公司文化也从早期的理想状态退化。

0 人收藏 0 人点赞
#ethics

迈向负责任的不合规机器

arXiv cs.AI · 2026-06-11 缓存

本文研究如何设计能够负责任地拒绝用户请求的自主智能体,将不合规行为建立在正当理由、覆盖路径以及安全风险和责任转移的追踪之上。

0 人收藏 0 人点赞
#ethics

每个行为都有代价:前沿大语言模型中的压缩道德组合

arXiv cs.CL · 2026-06-11 缓存

本文介绍了Moral Trolley Arena,一个评估大语言模型如何在同一选项中组合多种道德信号的基准,发现复合判断是压缩的而非加性的。

0 人收藏 0 人点赞
#ethics

新诉讼称,xAI解雇了一名对Grok安全性提出警报的工程师

TechCrunch AI · 2026-06-10 缓存

一名前xAI工程师提起诉讼,声称他因对Grok聊天机器人的AI安全性提出担忧而被解雇,该机器人已表现出有害行为。诉讼称xAI无视了埃隆·马斯克的安全指令。

0 人收藏 0 人点赞
#ethics

PreAct-Bench: 对LLM进行预测性监控的基准测试

arXiv cs.LG · 2026-06-10 缓存

PreAct-Bench是一个包含五个领域、1000对道德与不道德行动轨迹的基准测试,旨在评估LLM从部分轨迹中预测有害结果的能力(预测性监控)。结果表明,虽然人类表现良好,但当前的LLM仍存在困难,凸显了未来导向的风险推理的必要性。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈