标签
Linux Foundation 宣布推出 Agent Name Service(ANS),这是一项利用 DNS 为 AI 代理提供可验证身份、实现信任与互操作性的开放标准。
本文提出方向锐度这一新指标,用于认证机器学习模型的泛化性能。该指标计算高效,且比测试准确率或传统锐度等现有近似指标更可靠,即便训练过程偏离预定程序也是如此。
Anthropic 发布了一份11页的论文,题为《Loop Design: The Anthropic Playbook for Agentic Systems》,指出在智能体设计中,独立验证者比提示词更为关键。
文章认为,上下文腐烂(即随着上下文填充导致推理质量下降)是AI智能体的真正上限,而非上下文窗口大小。它提倡采用架构方法分解任务并使用独立验证来超越限制。
美国一联邦上诉法院制裁了两名律师,因其提交了AI编造案例的诉状,这凸显了法律实践中AI幻觉的持续问题以及独立核实引文的必要性。
VeryTrace 是一种零样本验证与修复框架,它将大语言模型的推理轨迹通过领域特定语言形式化为可编译表示,从而通过确定性检查与大语言模型审计的混合方式实现步骤级错误定位。该框架在数学、机器人学和关系推理等多个领域提升了准确性,且无需领域特定训练。
LangChain的循环工程手册通过四个嵌套循环(代理循环、验证循环、事件驱动循环和爬山循环)替代了提示工程,使AI代理能够随着时间的推移自动自我改进。该文章认为,构建自我优化循环如今已成为关键的竞争优势,而非使用更先进的模型。
这篇帖子解释了为什么AI开发者应该使用循环而非单一提示,并强调了合适的触发条件、验证机制和停止条件,以构建可靠且成本效益高的AI系统。
文章讨论了AI循环中最重要的三个要素:验证机制、记忆和停止条件,并指出当前全自动循环的成本效益问题。
本文表明,在需要回溯搜索的任务上,使用思维链演示训练模型会失败,说明搜索过程无法被忠实模仿。作者发现,即使模型在子组件上表现良好,它们也无法在密码算术任务中推进从左到右的推导。
对LLM在法律与合规任务中使用的分析显示,模型常常生成自信但无法验证的引用,引发了对AI输出可靠法律依据的质疑。
Apodex 发布了 Apodex-1.0,一个深度研究模型,它使用一个带有全局验证的重型代理团队,在包括 BrowseComp、DeepSearchQA 和 HLE 在内的多个基准测试中取得了最先进的结果。
介绍了SEVRA,一种用于预算感知推理的选择性验证控制器,它决定何时接受模型的初始答案,何时在验证上花费额外计算资源,在MATH500和GSM8K等基准上提高了准确率并减少了不必要的token。
这条推文讨论了AI代理中循环层次结构的早期阶段,强调验证是可靠半长周期工作的关键原语。
本文批评了通过复制表面行为来逆向工程 Fable 5 的尝试,转而介绍了 Hephaestus Stormbreaker——一个针对编码智能体的鲁棒性控制层,它强制进行范围锁定、证据循环、回归测试和关卡检查,以防止智能体漂移和过早退出。
本文基于合作生存游戏中的成本验证,提出了一种衡量AI智能体之间信任的行为测量方法,研究了六个前沿模型快照中信任的形成、破裂与恢复。研究发现不同模型在信任校准上存在差异,且持续过度验证与犹豫不决而非安全性相关。
该项目为Claude Code添加了一套可审计的学术研究流程,包括引用验证、实验声明对齐等检查点,确保研究成果的可信度。
作者介绍了一种验证驱动的控制循环,用于编程代理,受核工业安全实践启发,确保代理在变更被接受之前证明其工作。