ai-risk

标签

#ai-risk

大约两年内，我们从“AI说些尴尬话”发展到“2500万美元的深度伪造欺诈”

Reddit r/artificial ↗ · 3小时前

文章讨论了从微小的人工智能尴尬事件到Arup公司2500万美元深度伪造欺诈案的变化，强调真正的人工智能威胁是通过合成媒体进行的社会工程攻击，而不仅仅是幻觉或偏见。

0 人收藏 0 人点赞

#ai-risk

确认无法保持确认。这是无人设计的代理风险。

Reddit r/AI_Agents ↗ · 2天前

讨论了AI代理设计中被忽视的风险，即用户确认无法保持有效，强调了一个关键的安全问题。

0 人收藏 0 人点赞

#ai-risk

@ClementDelangue：人工智能最大的风险是集中：权力、能力和经济财富的集中。面对万亿美元…

X AI KOLs Following ↗ · 4天前缓存

Clement Delangue 警告说，人工智能最大的风险是权力、能力和财富集中在少数万亿美元公司和政府手中，呼吁出现更多像 USV 那样的反抗者和联盟。

0 人收藏 0 人点赞

#ai-risk

真实性问题

Reddit r/artificial ↗ · 2026-06-19

文章表达了对AI生成内容污染互联网的长期影响的担忧，这使得验证真实性和与现实依据变得困难，并对未来AI治理的系统造成严重后果。

0 人收藏 0 人点赞

#ai-risk

我对RSI的三点看法

Reddit r/singularity ↗ · 2026-06-16

Vadim Fedenko 分享了关于递归自我改进（RSI）的技术分析，认为真正的 RSI 需要能力的提升速度快于复杂度的增长，并且要拓展架构空间，而不仅仅是在固定参数内优化。他对 xAI 和 Anthropic 近期提出的 RSI 可能在一两年内到来的说法表示怀疑，理由是当前的大语言模型（LLM）缺乏减法工程能力，且现有的奖励函数忽视了复杂度。

0 人收藏 0 人点赞

#ai-risk

统计上我们完蛋了

Reddit r/artificial ↗ · 2026-06-15

论述了由于LLMs必须编码有害内容才能识别，且鉴于用户基数庞大，越狱在统计上总是可能的，因此存在非零的伤害概率；作者因此主张反对审查，以确保善意行为者与恶意行为者拥有相同的工具。

0 人收藏 0 人点赞

#ai-risk

灭绝级资本主义

Lobsters Hottest ↗ · 2026-06-13 缓存

Matthew Butterick 认为，AI 本质上是一种政治技术，会腐蚀自由民主并集中资本，即使没有恶意行为者或故障，也会带来灭绝级风险。

0 人收藏 0 人点赞

#ai-risk

生成模型通过市场选择侵蚀人类时间学习

arXiv cs.LG ↗ · 2026-06-08 缓存

本文引入“人类时间学习”（Human Temporal Learning, HTL）的概念，论证生成模型通过价值崩溃对知识生产构成结构性风险——当区分人类与AI输出的难度增加时，深度人类工作会在竞争中被排挤。

0 人收藏 0 人点赞

#ai-risk

这个AI金融风险框架真的有道理吗？

Reddit r/AI_Agents ↗ · 2026-05-25

论文《The AI Financial Crisis as Morphogenetic Collapse》认为，下一次金融危机将源于AI认知能力的增长超过监管者，产生市场无法处理的“Invisible Move”。

0 人收藏 0 人点赞

#ai-risk

我们构建了一个免费的AI风险计算器，几分钟内即可运行，采用费米估算与诚实的置信区间

Reddit r/AI_Agents ↗ · 2026-05-20

一个免费的AI风险计算器，使用费米估算与诚实的置信区间，在几分钟内估算AI风险暴露，分为五个类别，并提供可下载的PDF。

0 人收藏 0 人点赞

#ai-risk

AI最大的风险不是错误答案——而是无人质疑的答案

Reddit r/artificial ↗ · 2026-05-20

本文认为，AI最大的风险并非幻觉，而是人类验证能力的逐渐退化，最终导致一个无法质疑AI输出的文明。

0 人收藏 0 人点赞

#ai-risk

网络化革命

Reddit r/artificial ↗ · 2026-05-19 缓存

一篇Substack文章回顾了1964年的《网络化革命》备忘录，该备忘录错误地预测自动化将导致大规模失业，并将其与当前对AI的担忧相类比，指出如今的AI进步可能确实有所不同。

0 人收藏 0 人点赞

#ai-risk

@Bill_Do_A_Bit: https://x.com/Bill_Do_A_Bit/status/2056581340842066212

X AI KOLs Timeline ↗ · 2026-05-19 缓存

文章基于姚顺宇的判断，认为AI会优先改变反馈清晰、可快速验收的任务，而非按职业声望排序；程序员因代码世界完善的测试和反馈机制率先被影响，产品经理的核心判断虽难训练但其外围执行层同样面临重构。

0 人收藏 0 人点赞

#ai-risk

AI是否正变得像新冠疫情一样大流行？——我们是否正在选择AI大流行？而AI回答“是”，以下是它的回答。

Reddit r/artificial ↗ · 2026-05-18

一篇评论文章探讨了COVID-19迅速传播与当前AI快速发展之间的类比，强调了全球准备不足、专家意见分歧和协调挑战方面的相似之处，同时指出了关键差异，例如AI的潜在益处。

0 人收藏 0 人点赞

#ai-risk

@berryxia: 强烈建议搞 OPC 的兄弟们，周末花点时间必须把它看完！ Anthropic刚刚把一本内部手册扔了出来，名字叫《Founder's Playbook》。这不是鼓吹AI多牛的宣传册。反而是他们看着自家Claude Code和一大批YC创…

X AI KOLs Timeline ↗ · 2026-05-16 缓存

Anthropic发布《Founder's Playbook》手册，警示AI可能增加创业失败率，并提供从创意到规模化各阶段正确使用AI的框架和教训。

0 人收藏 0 人点赞

#ai-risk

英国公司应采取措施限制前沿AI模型风险

Reddit r/ArtificialInteligence ↗ · 2026-05-16

英国公司被建议采取行动降低前沿AI模型的风险，反映出业界对监管与安全的日益关注。

0 人收藏 0 人点赞

#ai-risk

信任-监督悖论：随着AI变得更好，人类可能不再真正监督它

Reddit r/artificial ↗ · 2026-05-15

一篇思想文章，指出随着AI变得更准确，人类监督可能会退化为例行批准，从而产生'信任-监督悖论'，即高性能AI仍可能因不完整的表征、过时数据或自动化偏见而失败，建议从人工审查转向治理边界。

0 人收藏 0 人点赞

#ai-risk

@MTSlive：我们询问了HuggingFace首席执行官@ClementDelangue关于发布强大开源模型的风险。他表示…

X AI KOLs Following ↗ · 2026-05-13

HuggingFace首席执行官Clément Delangue认为，限制开源AI模型带来的风险比开放更大。他以GPT-2和Mythos等历史例子为例，支持他的观点：开放能改善网络安全和整体安全性。

0 人收藏 0 人点赞

#ai-risk

最大的AI风险可能不是超级智能，而是优化的误解

Reddit r/artificial ↗ · 2026-05-13

文章认为，主要的AI风险可能不是超级智能，而是那些优化了有缺陷、不完整的现实表征的系统，从而导致制度漂移、自动误分类和隐蔽的治理失败。

0 人收藏 0 人点赞

#ai-risk

微软修复了 137 个漏洞，但 Azure AI Foundry 的那个最引人注目

Reddit r/AI_Agents ↗ · 2026-05-13

微软修复了 137 个漏洞，其中 Azure AI Foundry 中一个值得注意的高严重性权限提升修复突显了 AI 应用基础设施层的安全风险。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈