标签
Treedocs 是一个 Swift CLI 工具,能够生成仓库的文档化树状视图,并自动检查过时的文档条目,帮助团队保持文档最新。
Linux 7.2 终于在经过六年和超过360个补丁后移除了已弃用的 strncpy API,因其易出错,转而使用更安全的替代方案如 strscpy 和 memcpy。
一个团队构建了AI代理来自动修复技术债务:扫描代码库、自动提交PR。他们发现最困难的是精确定义问题,此外还讨论了多个代理在同一代码库上运行时的冲突问题以及设置防护栏的必要性。
HumanLayer推出了一个Agentic IDE和协作平台,使工程师能够在整个SDLC中提速2-3倍,同时保持严格的代码质量,已被Block、Uber等财富500强公司使用。
对开发者在使用AI辅助编码时经历的各个阶段的反思,从最初的惊叹到平衡的理解,并担忧经验不足的开发者如何在严重依赖AI代理的情况下学会判断代码质量。
一个关于Windows x86仿真器团队的故事:他们遇到一个程序,其初始化循环完全展开了64KB(65,536条指令),于是添加了特殊优化,将其替换为一个紧凑循环。
分析AI编码代理如何将瓶颈从编写代码转移到审查代码,数据显示代码变更量增加861%,缺陷率上升,使得代码审查成为软件工程中最具杠杆效应的技能。
本文讨论了AI编码智能体循环如何在不经意间从现有代码库中学习并传播已弃用的代码模式,导致技术债务,尽管表面看起来很成功。
本文探讨了那些编写代码巧妙但难以维护的“明星开发者”现象,并将其与AI生成代码带来的挑战进行类比,强调了可维护性和团队协作的重要性。
Charlie Marsh 发布的一系列针对 Ruff 项目的 GitHub 拉取请求。
FrontierCode是Cognition AI推出的新基准测试,通过评估合并性(mergeability)来衡量AI模型编写高质量、可维护代码的能力。结果显示,即使是Claude Opus 4.8等顶级模型,在最难子集上的得分也仅为13.4%,这突显了代码质量方面存在的显著差距。
FrontierCode 是 METR 和 Cognition 推出的新编程基准,用于评估 AI 模型在代码可维护性和质量方面的表现,结果显示许多模型会生成无法合并的代码。该基准包含超过 1000 小时的工作量,并表明即使顶尖模型也难以应对,其中 Opus 4.8 在最难的等级上仅获得 13.8%。
Cognition 宣布推出 FrontierCode,这是一个新的代码评估基准,超越了单元测试,衡量代码质量、范围、测试正确性和人类审查者认可度,解决了代理编写通过测试但不可维护的草率代码的问题。
compound-engineering-plugin 是一个 AI 编程插件,通过将80%资源分配在规划与评审、20%在执行上来避免技术债,包含37个skill和51个agent,支持Claude Code、Codex、Cursor三大平台。
一篇博文论述:尽管用户不会直接关心代码内部结构,但良好的代码质量对于性能、修复漏洞和交付功能至关重要——这与“只有面向用户的结果才重要”这一常见套话相反。
一篇开发者博客文章反对在不阅读 AI 生成代码的情况下直接将其部署到生产环境,强调代码审查具有至关重要的作用:分散责任、降低巴士因子风险,以及让团队成员保持对代码库的了解。
一个为AI代理提供的Clean Code Skills仓库,强制执行Robert C. Martin的原则,以改善AI生成代码的可维护性并减少技术债务。它为Python和TypeScript提供了模块化技能,指导代理编写更整洁、更结构化的代码。