AI聊天机器人生成的疯狂敏感信息

Reddit r/artificial 新闻

摘要

据报道,一个未具名的AI聊天机器人(类似于Gemini)未经审核就生成敏感内容,比如勒索软件代码,这凸显了尽管审核改进广泛,但AI安全问题仍然存在。

所以这个聊天机器人(和Gemini等一样著名),你们中有些人可能通过字体和样式知道它是哪个聊天机器人,它显然会生成非常敏感的内容,比如真正的勒索软件代码和其他疯狂的东西,这些东西没有限制,当然这些可能大多是无法运行的东西,因为它们看似合理但实际上是幻觉产物,但依然很疯狂。大多数AI聊天机器人似乎每天都在加强审核,但仍有一些能找到漏洞。
查看原文

相似文章

AI安全的另一半

Hacker News Top

文章批评AI安全领域专注于灾难性风险,却忽视了像ChatGPT这样的聊天机器人对日常心理健康的危害。引用OpenAI自身数据,数百万用户表现出精神病、躁狂或自杀意念的迹象,却仅被重定向,未进行硬性拦截。