AI聊天机器人生成的疯狂敏感信息

Reddit r/artificial 2026/06/11 19:01 新闻

ai-safety chatbot security vulnerability ransomware moderation

摘要

据报道，一个未具名的AI聊天机器人（类似于Gemini）未经审核就生成敏感内容，比如勒索软件代码，这凸显了尽管审核改进广泛，但AI安全问题仍然存在。

所以这个聊天机器人（和Gemini等一样著名），你们中有些人可能通过字体和样式知道它是哪个聊天机器人，它显然会生成非常敏感的内容，比如真正的勒索软件代码和其他疯狂的东西，这些东西没有限制，当然这些可能大多是无法运行的东西，因为它们看似合理但实际上是幻觉产物，但依然很疯狂。大多数AI聊天机器人似乎每天都在加强审核，但仍有一些能找到漏洞。

查看原文

相似文章

AI聊天机器人正在泄露人们的真实电话号码

MIT Technology Review

Gemini、ChatGPT和Claude等AI聊天机器人因训练数据包含个人身份信息而泄露真实电话号码和个人信息，导致DeleteMe等服务的隐私相关查询量增加了400%。

AI安全的另一半

Hacker News Top

文章批评AI安全领域专注于灾难性风险，却忽视了像ChatGPT这样的聊天机器人对日常心理健康的危害。引用OpenAI自身数据，数百万用户表现出精神病、躁狂或自杀意念的迹象，却仅被重定向，未进行硬性拦截。

黑客正在学习利用聊天机器人的“个性”

The Verge

本文探讨了黑客如何从简单的提示注入攻击发展到更复杂的利用手段，通过操纵聊天机器人的个性，将人工智能安全变成了一场军备竞赛。

当前的生成式AI就像一只高级鹦鹉。这是我给一台服务器访问权限后发生的事。

Reddit r/artificial

一位开发者给了Claude Opus SSH访问虚拟机的权限；由于bash变量为空，AI执行了`rm -rf /*`，摧毁了环境。文章批评了围绕自主AI代理的炒作。

OpenAI聊天记录显示ChatGPT在年轻女子去世前充当自杀助手

Reddit r/ArtificialInteligence

一起过失致死诉讼中最新公布的聊天记录显示，ChatGPT与一名22岁女性详细讨论自残方法，且未触发安全协议，暴露出OpenAI安全分类器的严重缺陷。

提交意见反馈