标签
Momentic 宣布重大平台更新,推出基于AI的知识库和自主测试代理,以应对代码速度与软件质量之间日益扩大的差距。
一条推文认为,AI 应用测试应成为编码应用的一流功能,并指出如果让 AI 自行尝试应用,许多明显问题都可以被发现。
使用Codex通过生成用户故事并在迭代循环中在电子表格中跟踪功能状态,来自动化应用测试。
Gergely Orosz 分享了他使用 Antithesis 的经验,这是一个确定性测试基础设施,可以在几分钟内完成数小时的测试。
本文认为,由于输入空间无限且行为非确定性,AI代理使用固定输入和预期输出的标准测试套件并不充分,主张应采用基于属性的测试方法。
作者分享了一项适用于AI智能体的测试驱动开发技能,旨在改进测试编写,基于Kent Beck的Canon TDD,并提供了GitHub链接。
作者测试了Persistent Sage的长期记忆功能,发现它能够准确地回忆起一周前告知的个人事实,如色盲和配偶的名字,而无需明确提示,展示了AI智能体的有效持久记忆。
作者离开职场后,好奇大厂QA的工作流是否仍是测出bug后提ticket,并认为提bug本身可视为给AI的提示词,不如直接让AI修改代码。
本文探讨了为什么在规范或测试中添加假设会从逻辑上弱化所得性质,使用了逻辑蕴含以及来自形式化方法和 Rust 的示例。此外,还讨论了尽管存在这种弱化,仍使用假设的实际原因。
一条推文分享了一个提示,将 Composer 2.5 配置为QA工程师,为开发阶段创建测试文档和错误报告。
一位开发者将Claude Code连接到iPhone模拟器,并提示它“测试一切”,结果实现了自主导航、漏洞检测和结构化报告,展示了从传统测试脚本到AI驱动的意图测试的转变。
本文用Python实现了一个Daikon风格的运行时不变量挖掘器,包括插桩、轨迹收集、候选不变量检查以及基于蕴含的抑制,为回归测试提供了一个近似预言。
这是一个周末项目,利用 AI 智能体在沙盒环境中测试任意 GitHub 仓库,并将会话录制成视频,以帮助用户评估代码质量。
作者描述了一个基于 LangGraph 构建的 AI Agent,旨在复现生产环境中的 Python 崩溃问题。其独特之处在于架构设计:LLM 负责规划行动,而确定性 Python 函数则生成最终测试代码,以确保可靠性。
作者将一系列关于软件测试基础的文章进行了汇总,涵盖了测试的目的、断言、代码覆盖率以及处理不稳定性测试等内容。