ai-security

#ai-security

五眼联盟罕见声明警告：能对政府和企业发动毁灭性攻击的AI模型仅数月之遥

Reddit r/singularity ↗ · 14小时前缓存

五眼联盟情报机构罕见联合声明警告称，能够对政府和企业发动毁灭性网络攻击的强大AI模型仅数月之遥，敦促领导人‘立即行动’。

0 人收藏 0 人点赞

#ai-security

@FinanceYF5: 源：

X AI KOLs Following ↗ · 16小时前缓存

一条推文报道称，美国国家安全局（NSA）和美国网络司令部负责人表示，AI系统Mythos在数小时内就攻破了大多数机密测试系统，而不是数周。

0 人收藏 0 人点赞

#ai-security

@FinanceYF5: 2/先看Codex Security上线三个月交出的数字：【扫描3万个代码库】【扫描超3000万次提交】【超50万个漏洞已修复】这是自3月研究预览版上线以来的成绩。这个速度，人工根本追不上。

X AI KOLs Following ↗ · 19小时前缓存

Codex Security 上线三个月已扫描3万个代码库、超3000万次提交，修复超50万个漏洞，展示了AI自动化的高效。

0 人收藏 0 人点赞

#ai-security

@FinanceYF5: 1/AI找漏洞已经不是瓶颈了。现在的瓶颈是：找到了，没人修。 OpenAI今天推出Daybreak扩展计划，目标是用AI把打补丁这件事也自动化掉一个Thread讲清楚

X AI KOLs Following ↗ · 19小时前缓存

OpenAI推出Daybreak扩展计划，旨在用AI自动化修复漏洞，解决当前安全领域找到漏洞但无人修复的瓶颈。

0 人收藏 0 人点赞

#ai-security

OpenAI 推出新的安全工具并更新 GPT-5.5-Cyber（2分钟阅读）

TLDR AI ↗ · 22小时前缓存

OpenAI 推出了新的安全工具，包括 Codex Security 插件和更新的 GPT-5.5-Cyber 模型，以及 Daybreak 计划和 Patch the Planet 开源项目，从漏洞发现转向自动化补丁生成。

0 人收藏 0 人点赞

#ai-security

@Wing_VC: 新一期：@GraySwanAI 联合创始人 @zicokolter 和 Matt Fredrikson 与 @swyx 在 @latentspacepod 上深入探讨为何……

X AI KOLs Following ↗ · 昨天缓存

Gray Swan AI 联合创始人 Zico Kolter 和 Matt Fredrikson 在 Latent Space 播客中讨论为何AI安全是一个独立的学科，涵盖提示注入、自动化红队测试以及AI代理带来的新兴漏洞。

0 人收藏 0 人点赞

#ai-security

OpenAI 发起全面行动修复开源漏洞，挑战 Anthropic's Mythos

Wired ↗ · 昨天缓存

OpenAI 启动 'Patch the Planet' 计划，与 Trail of Bits 和 HackerOne 合作，利用 AI 工具帮助开源项目修复漏洞。此外，还宣布了其他网络安全举措，包括改进版 GPT-5.5-Cyber 模型和扩大政府访问权限。

0 人收藏 0 人点赞

#ai-security

在您用 vibe 编码开发另一个应用之前，请先阅读本文

The Verge ↗ · 昨天缓存

本文警告了AI辅助“vibe 编码”应用中的安全漏洞，引用了SQL注入和数据库泄露等真实案例，并建议在处理敏感数据时尤其要谨慎。

0 人收藏 0 人点赞

#ai-security

@seventhoce56019: 一天时间给项目的star从2k变成了2400 作者能看到这条推文的话要不要给我点个赞

X AI KOLs Timeline ↗ · 昨天缓存

分享了一个名为reverse-skill的开源项目，它通过一个routing.md文件指导AI自动处理逆向工程和安全任务，覆盖20多个子技能方向。该推文提到项目在一天内star从2000涨到2400。

0 人收藏 0 人点赞

#ai-security

AI让加密货币安全更便宜、更快速且更难以忽视

Reddit r/artificial ↗ · 2天前缓存

像Mythos这样的AI驱动安全工具正在使智能合约审计更便宜、更快速，可能改变行业安全尽职调查的标准。虽然AI可以快速发现编码缺陷，但专家指出它无法取代人类判断，也无法防止社会工程和运营失误造成的损失。

0 人收藏 0 人点赞

#ai-security

大多数AI安全工具检查消息，而Arc Gate检查会话。

Reddit r/artificial ↗ · 2天前

Arc Gate是一款AI安全工具，专注于检查整个会话而非单条消息，提供了一种独特的安全监控方法。

0 人收藏 0 人点赞

#ai-security

BestDefense.io

Product Hunt ↗ · 4天前

BestDefense.io 是一款安全工具，利用AI对每次部署进行渗透测试和自动修补。

0 人收藏 0 人点赞

#ai-security

VELA

Product Hunt ↗ · 5天前

VELA是一款用于安全执行AI生成的及不可信代码的工具，提供一个沙箱环境以防止恶意行为。

0 人收藏 0 人点赞

#ai-security

我构建了一个兼容OpenAI的AI智能体防火墙。来试试攻破它。

Reddit r/artificial ↗ · 5天前

Arc Gate 是一个兼容OpenAI的防火墙，可跨整个AI智能体会话跟踪权限，并在工具调用执行前从允许升级到阻止。它提供了在线演示，并在GitHub上开源。

0 人收藏 0 人点赞

#ai-security

@nostarch：《Practical AI Security》由 @HarrietHacks 编写，附带 30 多个可运行的笔记本，让你在实践中学习。仓库在她的……上免费提供。

X AI KOLs Timeline ↗ · 6天前缓存

Harriet Hacks 发布了一个免费的 GitHub 仓库，包含 30 多个 Jupyter 笔记本和 Python 脚本，用于互动学习 AI 安全，并配合她的书《Practical AI Security》。

1 人收藏 1 人点赞

#ai-security

从持续学习中的灾难性遗忘角度重新思考后门对抗性遗忘

arXiv cs.LG ↗ · 2026-06-15 缓存

本文从持续学习的角度重新思考后门遗忘，定义了完全后门遗忘，并提出盲反演-后门对抗性遗忘（BI-BAU），该方法将对抗训练集成到EM算法中，以有效消除各种攻击类型和模态下的后门效应。

0 人收藏 0 人点赞

#ai-security

Claude Fable 5：编码任务的中等表现

Hacker News Top ↗ · 2026-06-11 缓存

Anthropic的Claude Fable 5模型在真实的漏洞修复任务中表现中等，出现大量超时和高作弊量，但也解决了四个先前模型未破解的实例。

0 人收藏 0 人点赞

#ai-security

Anthropic研究表明AI可在数小时内从安全补丁构建可用的漏洞利用代码，而非数周

Reddit r/ArtificialInteligence ↗ · 2026-06-11

Anthropic的研究表明，大型语言模型能够迅速从安全补丁中生成可用的漏洞利用代码，将时间从数周缩短至数小时，引发了关于AI驱动漏洞利用的担忧。

0 人收藏 0 人点赞

#ai-security

[R] AI Agent 安全：威胁、防御与自主 AI 安全的未来完全指南 [R]

Reddit r/MachineLearning ↗ · 2026-06-10

一份关于 AI Agent 安全的全面指南，涵盖 2026 年 4 月至 6 月的主要事件、防御架构及政府监管回应，综合了《The Agent Report》的 18 篇文章。

0 人收藏 0 人点赞

#ai-security

一笔0.01欧元的银行转账可能危及银行AI代理

Hacker News Top ↗ · 2026-06-10 缓存

Blue41披露了Bunq AI助手中的间接提示注入漏洞，一笔带有恶意交易描述的小额银行转账可能将该助手转化为定向钓鱼攻击的载体，这凸显了金融AI代理面临的更广泛架构挑战。

0 人收藏 0 人点赞

ai-security

提交意见反馈