auditability

标签

Cards List
#auditability

我们的AI代理在生产环境中的链断了。以下是我们的修复方案,以及为什么说这次断裂正是关键所在。

Reddit r/AI_Agents · 昨天

一篇博客文章,描述了作者的生产级AI代理(PiQ)在服务器重启后遇到哈希链断裂的问题,以及他们如何构建了一套工作流,用于检测、人工审核解决和持久化审计追踪,将失败转化为功能。

0 人收藏 0 人点赞
#auditability

PatchBoard:基于模式的状态变更机制,用于可靠且可审计的LLM多智能体协作

arXiv cs.CL · 6天前 缓存

PatchBoard 使用经过验证的 JSON Patch 变更操作来取代 LLM 多智能体系统中的自然语言对话,该操作基于共享的结构化状态,在 ALFWorld 基准测试中实现了更高的成功率并大幅降低了 token 使用量。

0 人收藏 0 人点赞
#auditability

从准确性到可审计性:金融AI系统中的确定性综述

arXiv cs.AI · 2026-05-26 缓存

本综述研究了金融AI系统中的计算非确定性,涵盖表格模型、图网络和基于LLM的工作流,并提出了一个用于可审计性的分层评估框架。

0 人收藏 0 人点赞
#auditability

关于 AI 智能体的真实内情

Reddit r/AI_Agents · 2026-05-22

一位资深从业者分享了将 25 个以上 AI 智能体部署到生产环境的经验教训,指出记忆、编排和可审计性远比模型选择重要。文章详细介绍了上下文丢失、静默成本循环等常见故障模式,并推荐了包含 Claude Sonnet 4、Pydantic AI 以及 Octopodas 等专用记忆层的技术栈。

0 人收藏 0 人点赞
#auditability

@yoheinakajima: babyagi 约有 ~200 次引用,但零篇论文……我刚刚在 arXiv 上发表了第一篇论文"The Log is the Agent: Event-Sourc…"

X AI KOLs Following · 2026-05-22 缓存

Yohei Nakajima 发表了一篇论文,提出了 ActiveGraph,这是一个运行时系统,其中事件日志是真相来源,代理通过持久可重放状态进行协调,实现了可审计性、分叉和因果谱系。

0 人收藏 0 人点赞
#auditability

LLM治理的机械执行:金融决策系统中治理-任务解耦的证据

arXiv cs.CL · 2026-05-15 缓存

本文引入了五项治理指标,用于在受监管金融工作流程中量化LLM在决策理由层面的政策合规性。研究发现,机械执行(在模型解释循环之外操作)将无信息的延迟决策减少了73%,并揭示了治理-任务解耦:纯文本治理在压力下两个维度均退化,而机械执行即使在任务性能下降时仍能保持治理质量。

0 人收藏 0 人点赞
#auditability

预注册信念修正合约

arXiv cs.CL · 2026-04-20 缓存

本论文引入预注册信念修正合约(PBRC),这是一种用于多智能体系统(包括基于大语言模型的智能体)的协议级机制,通过公开固定证据触发器和修正算子来将开放通信与可接纳的信念变化分离。该工作解决了智能体协商中的危险从众效应,并提供了形式化保证确保纯粹的社会压力不会驱动虚假共识。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈