标签
变异测试现已在 sydtest Haskell 测试框架中正式发布,开发者可通过自动生成代码变异并验证测试套件是否能捕获这些变异,从而客观评估测试质量。作者的动机源于 AI 生成代码(通过 Claude)的兴起,以及对测试覆盖率进行客观、自动化度量的需求。
SQLite 已添加一个 AGENTS.md 文件,声明不接受智能体代码,但欢迎带有可复现测试用例的智能体错误报告,并将 AI 生成的错误报告分拆到一个单独的论坛。
一个团队遇到由AI生成的代码导致的生产错误,引发了一场关于谁该为错误负责以及如何在AI辅助开发中重新定义代码所有权的讨论。
一位开发者分享了这样一个经历:OpenAI的Codex在API中插入了一个运行时扩展存在性检查,这是一种过多的防护措施,人类工程师绝不会这样做。
这篇文章讨论了一个担忧:随着AI工具生成越来越多的代码,未来基于这些合成代码训练的模型可能会质量下降、原创性降低,并询问像OpenAI、Anthropic和GitHub这样的主要AI实验室计划如何应对这个问题。
文章认为,尽管AI取得了进步,工程师仍然必须理解代码和系统,因为AI生成的代码可能成为负担,并强调了计算机科学基础和系统设计的重要性。
Sci-Bot是一个由AI驱动的研究助手,连接到Sci-Hub数据库,提供基于科学文献的答案。该项目是作为实验使用AI生成的代码构建的。
Stage 是一个代码审查平台,它通过将变更分组为逻辑章节,帮助工程师更快地审查 AI 生成的拉取请求,旨在减少拉取请求的积压。
本期通讯文章讨论了AI生成代码速度超过人工代码审查速度所导致的“AI代码质量下降”问题,并提供了平衡速度与质量的策略。
Bjarne Stroustrup批评AI生成的代码,称其引入更多错误、臃肿和安全漏洞,且几乎无法验证,而资深开发者宁愿退休也不愿处理它。
cargo-crap 是一个 Rust 工具,它使用 CRAP 指标来识别既复杂又测试不足的函数,帮助开发者管理 AI 生成代码中的风险。
一位开发者正在寻求反馈,关于构建一个系统来审核 AI 生成的拉取请求,通过降低认知负担并突出关键变更,询问前 60 秒的审核实践和信任证据。
谷歌威胁情报小组报告称,黑客利用AI生成代码发现并武器化一个可绕过双重身份验证的零日漏洞,标志着人工智能驱动网络犯罪的显著升级。
Google透露,目前75%的新代码由AI生成并经人工审核,比例从2024年的25%、2025年的50%跃升至今日的75%,主要得益于Gemini模型与智能体工作流。