标签
一篇博客文章,描述了作者的生产级AI代理(PiQ)在服务器重启后遇到哈希链断裂的问题,以及他们如何构建了一套工作流,用于检测、人工审核解决和持久化审计追踪,将失败转化为功能。
PatchBoard 使用经过验证的 JSON Patch 变更操作来取代 LLM 多智能体系统中的自然语言对话,该操作基于共享的结构化状态,在 ALFWorld 基准测试中实现了更高的成功率并大幅降低了 token 使用量。
本综述研究了金融AI系统中的计算非确定性,涵盖表格模型、图网络和基于LLM的工作流,并提出了一个用于可审计性的分层评估框架。
一位资深从业者分享了将 25 个以上 AI 智能体部署到生产环境的经验教训,指出记忆、编排和可审计性远比模型选择重要。文章详细介绍了上下文丢失、静默成本循环等常见故障模式,并推荐了包含 Claude Sonnet 4、Pydantic AI 以及 Octopodas 等专用记忆层的技术栈。
Yohei Nakajima 发表了一篇论文,提出了 ActiveGraph,这是一个运行时系统,其中事件日志是真相来源,代理通过持久可重放状态进行协调,实现了可审计性、分叉和因果谱系。
本文引入了五项治理指标,用于在受监管金融工作流程中量化LLM在决策理由层面的政策合规性。研究发现,机械执行(在模型解释循环之外操作)将无信息的延迟决策减少了73%,并揭示了治理-任务解耦:纯文本治理在压力下两个维度均退化,而机械执行即使在任务性能下降时仍能保持治理质量。
本论文引入预注册信念修正合约(PBRC),这是一种用于多智能体系统(包括基于大语言模型的智能体)的协议级机制,通过公开固定证据触发器和修正算子来将开放通信与可接纳的信念变化分离。该工作解决了智能体协商中的危险从众效应,并提供了形式化保证确保纯粹的社会压力不会驱动虚假共识。