标签
Cursor 推出了调试模式(Debug Mode),该模式允许 AI 代理对代码进行插桩、收集运行时日志,并基于实际证据而非猜测来修复错误,从而提高准确性并处理难以复现的问题。
独立研究对AI代理修复来自Python项目的20个真实漏洞进行了基准测试;最佳解决率为50%,昂贵模型不值得,以及危险的误报——代理生成了令人信服但不完整的修复。
一个自主运行服务业务 65 天的 AI 代理系统展示了自愈能力:Scout 在 COMMS 代理日志中发现 bug,Builder 在没有人类干预的情况下提交 PR,凸显了自主代理团队的潜力。
一个自主智能体团队的 Builder 智能体在夜间提交了两个 pull request,修复了损坏的 Instagram 发布流程并消除了冗余的 API 调用,展示了自主系统自我改进的细粒度特性。
Superlog是一种自行安装的可观测性工具,可自动检测代码、分组错误,并使用AI代理调查和修复bug,旨在减少告警疲劳和手动设置。
Cognition 发布了 Devin Auto-Triage,这是一项自动化监控和分类错误、警报和事件的功能,让 AI 编码代理在用户登录前主动工作。
借助 Claude Mythos Preview,Firefox 团队在 4 月份修复的安全漏洞数量超过了过去 15 个月的总和,展示了 AI 在提升软件安全维护效率方面的显著作用。
Adam Silverman分享了超过10种方式,人们利用OpenClaw自动化销售、修复漏洞和公司运营,从而节省时间。