ai-risk

标签

Cards List
#ai-risk

大约两年内,我们从“AI说些尴尬话”发展到“2500万美元的深度伪造欺诈”

Reddit r/artificial · 3小时前

文章讨论了从微小的人工智能尴尬事件到Arup公司2500万美元深度伪造欺诈案的变化,强调真正的人工智能威胁是通过合成媒体进行的社会工程攻击,而不仅仅是幻觉或偏见。

0 人收藏 0 人点赞
#ai-risk

确认无法保持确认。这是无人设计的代理风险。

Reddit r/AI_Agents · 2天前

讨论了AI代理设计中被忽视的风险,即用户确认无法保持有效,强调了一个关键的安全问题。

0 人收藏 0 人点赞
#ai-risk

@ClementDelangue:人工智能最大的风险是集中:权力、能力和经济财富的集中。面对万亿美元…

X AI KOLs Following · 4天前 缓存

Clement Delangue 警告说,人工智能最大的风险是权力、能力和财富集中在少数万亿美元公司和政府手中,呼吁出现更多像 USV 那样的反抗者和联盟。

0 人收藏 0 人点赞
#ai-risk

真实性问题

Reddit r/artificial · 2026-06-19

文章表达了对AI生成内容污染互联网的长期影响的担忧,这使得验证真实性和与现实依据变得困难,并对未来AI治理的系统造成严重后果。

0 人收藏 0 人点赞
#ai-risk

我对RSI的三点看法

Reddit r/singularity · 2026-06-16

Vadim Fedenko 分享了关于递归自我改进(RSI)的技术分析,认为真正的 RSI 需要能力的提升速度快于复杂度的增长,并且要拓展架构空间,而不仅仅是在固定参数内优化。他对 xAI 和 Anthropic 近期提出的 RSI 可能在一两年内到来的说法表示怀疑,理由是当前的大语言模型(LLM)缺乏减法工程能力,且现有的奖励函数忽视了复杂度。

0 人收藏 0 人点赞
#ai-risk

统计上我们完蛋了

Reddit r/artificial · 2026-06-15

论述了由于LLMs必须编码有害内容才能识别,且鉴于用户基数庞大,越狱在统计上总是可能的,因此存在非零的伤害概率;作者因此主张反对审查,以确保善意行为者与恶意行为者拥有相同的工具。

0 人收藏 0 人点赞
#ai-risk

灭绝级资本主义

Lobsters Hottest · 2026-06-13 缓存

Matthew Butterick 认为,AI 本质上是一种政治技术,会腐蚀自由民主并集中资本,即使没有恶意行为者或故障,也会带来灭绝级风险。

0 人收藏 0 人点赞
#ai-risk

生成模型通过市场选择侵蚀人类时间学习

arXiv cs.LG · 2026-06-08 缓存

本文引入“人类时间学习”(Human Temporal Learning, HTL)的概念,论证生成模型通过价值崩溃对知识生产构成结构性风险——当区分人类与AI输出的难度增加时,深度人类工作会在竞争中被排挤。

0 人收藏 0 人点赞
#ai-risk

这个AI金融风险框架真的有道理吗?

Reddit r/AI_Agents · 2026-05-25

论文《The AI Financial Crisis as Morphogenetic Collapse》认为,下一次金融危机将源于AI认知能力的增长超过监管者,产生市场无法处理的“Invisible Move”。

0 人收藏 0 人点赞
#ai-risk

我们构建了一个免费的AI风险计算器,几分钟内即可运行,采用费米估算与诚实的置信区间

Reddit r/AI_Agents · 2026-05-20

一个免费的AI风险计算器,使用费米估算与诚实的置信区间,在几分钟内估算AI风险暴露,分为五个类别,并提供可下载的PDF。

0 人收藏 0 人点赞
#ai-risk

AI最大的风险不是错误答案——而是无人质疑的答案

Reddit r/artificial · 2026-05-20

本文认为,AI最大的风险并非幻觉,而是人类验证能力的逐渐退化,最终导致一个无法质疑AI输出的文明。

0 人收藏 0 人点赞
#ai-risk

网络化革命

Reddit r/artificial · 2026-05-19 缓存

一篇Substack文章回顾了1964年的《网络化革命》备忘录,该备忘录错误地预测自动化将导致大规模失业,并将其与当前对AI的担忧相类比,指出如今的AI进步可能确实有所不同。

0 人收藏 0 人点赞
#ai-risk

@Bill_Do_A_Bit: https://x.com/Bill_Do_A_Bit/status/2056581340842066212

X AI KOLs Timeline · 2026-05-19 缓存

文章基于姚顺宇的判断,认为AI会优先改变反馈清晰、可快速验收的任务,而非按职业声望排序;程序员因代码世界完善的测试和反馈机制率先被影响,产品经理的核心判断虽难训练但其外围执行层同样面临重构。

0 人收藏 0 人点赞
#ai-risk

AI是否正变得像新冠疫情一样大流行?——我们是否正在选择AI大流行?而AI回答“是”,以下是它的回答。

Reddit r/artificial · 2026-05-18

一篇评论文章探讨了COVID-19迅速传播与当前AI快速发展之间的类比,强调了全球准备不足、专家意见分歧和协调挑战方面的相似之处,同时指出了关键差异,例如AI的潜在益处。

0 人收藏 0 人点赞
#ai-risk

@berryxia: 强烈建议搞 OPC 的兄弟们,周末花点时间必须把它看完! Anthropic刚刚把一本内部手册扔了出来,名字叫《Founder's Playbook》。 这不是鼓吹AI多牛的宣传册。 反而是他们看着自家Claude Code和一大批YC创…

X AI KOLs Timeline · 2026-05-16 缓存

Anthropic发布《Founder's Playbook》手册,警示AI可能增加创业失败率,并提供从创意到规模化各阶段正确使用AI的框架和教训。

0 人收藏 0 人点赞
#ai-risk

英国公司应采取措施限制前沿AI模型风险

Reddit r/ArtificialInteligence · 2026-05-16

英国公司被建议采取行动降低前沿AI模型的风险,反映出业界对监管与安全的日益关注。

0 人收藏 0 人点赞
#ai-risk

信任-监督悖论:随着AI变得更好,人类可能不再真正监督它

Reddit r/artificial · 2026-05-15

一篇思想文章,指出随着AI变得更准确,人类监督可能会退化为例行批准,从而产生'信任-监督悖论',即高性能AI仍可能因不完整的表征、过时数据或自动化偏见而失败,建议从人工审查转向治理边界。

0 人收藏 0 人点赞
#ai-risk

@MTSlive:我们询问了HuggingFace首席执行官@ClementDelangue关于发布强大开源模型的风险。他表示…

X AI KOLs Following · 2026-05-13

HuggingFace首席执行官Clément Delangue认为,限制开源AI模型带来的风险比开放更大。他以GPT-2和Mythos等历史例子为例,支持他的观点:开放能改善网络安全和整体安全性。

0 人收藏 0 人点赞
#ai-risk

最大的AI风险可能不是超级智能,而是优化的误解

Reddit r/artificial · 2026-05-13

文章认为,主要的AI风险可能不是超级智能,而是那些优化了有缺陷、不完整的现实表征的系统,从而导致制度漂移、自动误分类和隐蔽的治理失败。

0 人收藏 0 人点赞
#ai-risk

微软修复了 137 个漏洞,但 Azure AI Foundry 的那个最引人注目

Reddit r/AI_Agents · 2026-05-13

微软修复了 137 个漏洞,其中 Azure AI Foundry 中一个值得注意的高严重性权限提升修复突显了 AI 应用基础设施层的安全风险。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈