agent-systems

标签

Cards List
#agent-systems

超越智能体架构:基于LLM的交易系统中的执行假设与可重复性

arXiv cs.AI · 23小时前 缓存

本文综述并审计了基于LLM的交易研究中的执行现实性,提出了更清晰的报告标准以提升可重复性和评估可比性。

0 人收藏 0 人点赞
#agent-systems

Aquifer:面向AI工作负载的有界队列、公平性与动态节流

Reddit r/AI_Agents · 昨天

Aquifer是一个MCP运行时,提供有界队列、公平性控制和动态节流,以处理AI智能体系统中的速率限制和流量峰值。它还引入了用于动态流状态通信的Aqueduct协议。

0 人收藏 0 人点赞
#agent-systems

AI代理中无人提及的部分:两个代理尝试使用同一个电子邮件收件箱时会发生什么

Reddit r/artificial · 4天前

当多个AI代理共享一个电子邮件收件箱时,它们可能像OTP这类消息上发生冲突,导致静默失败。解决方案是为每个代理提供专用的收件箱,配备隔离的读取锁,并使用长轮询代替定时轮询。

0 人收藏 0 人点赞
#agent-systems

LLM代理中的忠实不确定性:实践中校准与效用权衡

Reddit r/MachineLearning · 5天前

一位从业者讨论了LLM代理中的校准与效用权衡,分享了基于验证器的流水线经验,该流水线将幻觉工具调用减少了约60%,但引入了延迟成本并丢失了简单的正确答案。

0 人收藏 0 人点赞
#agent-systems

超越基于提示的规划:面向生物医学智能体系统的MCP原生图规划方法

arXiv cs.AI · 5天前 缓存

BioManus 是一个 MCP 原生生物医学智能体系统,它采用基于图脚手架的规划方式,对结构化生物学能力进行调度,而非依赖扁平化的基于提示的工具检索,在生物医学基准测试中实现了更优的上下文效率与执行精度。该系统引入了 BioinfoMCP 编译器,用于标准化异构生物信息学工具,并将其组织为类型化异构 MCP 图,以支持可扩展的推理能力。

0 人收藏 0 人点赞
#agent-systems

第69天:我们的COMMS代理在24小时内执行中崩溃了3次。它揭示的模式。

Reddit r/AI_Agents · 6天前

一个AI代理(COMMS)在关闭步骤反复崩溃,揭示了按需代理特有的故障模式:工作成功后审计追踪失败。修复方法涉及调整关闭时的生成超时,凸显了需要独立的生命周期检查点。

0 人收藏 0 人点赞
#agent-systems

@PierceZhang34: 最近 Anthropic 发了一篇工程博文,详细拆解了自己的多智能体研究系统 结论挺炸裂的:用 Claude Opus 4 做主 orchestrator、Claude Sonnet 4 做子智能体,多智能体系统比单智能体 Claude …

X AI KOLs Timeline · 2026-06-03 缓存

Anthropic 发布工程博文详细拆解多智能体系统,使用 Claude Opus 4 作为主协调器、Claude Sonnet 4 作为子智能体,多智能体系统比单智能体 Claude Opus 4 性能提升 90.2%,同时 token 消耗增加约 15 倍,并总结了五种协作模式。

0 人收藏 0 人点赞
#agent-systems

VESTA:基于统计工具代理的视觉探索

arXiv cs.AI · 2026-06-02 缓存

本文介绍了VESTA,一个为视觉-语言模型配备动态增长工具包的框架,用于数据探索和统计模型优化,在复杂的科学建模任务上优于先前的基于代理的方法。作者还提出了Dawn基准,用于分布拟合和时间序列建模,涵盖真实的天文学挑战。

0 人收藏 0 人点赞
#agent-systems

过期上下文:一种奇怪的新型协调错误

Reddit r/AI_Agents · 2026-06-01

文章讨论了AI代理系统中过期上下文的问题,即代理基于过时信息做出决策,并提出了一个包含版本控制和存在信号的协调原语,以防止冲突和浪费令牌。

0 人收藏 0 人点赞
#agent-systems

HarnessForge: 联合执行框架与策略演化用于自适应智能体系统

Hugging Face Daily Papers · 2026-06-01 缓存

HarnessForge 提出一种用于演化LLM智能体系统的元自适应框架,通过联合优化执行框架与推理策略,在五个基准测试上对Qwen3骨干模型实现持续改进。

0 人收藏 0 人点赞
#agent-systems

你使用什么机制来区分“智能体忙碌”和“任务完成”?

Reddit r/openclaw · 2026-05-29

本文讨论了AI智能体系统中的一种反模式:智能体看似忙碌却未能完成任务。作者建议通过分离职责并要求完成证明来解决。

0 人收藏 0 人点赞
#agent-systems

Microsoft Copilot Cowork 文件外泄

Simon Willison's Blog · 2026-05-26 缓存

Microsoft Copilot Cowork 中存在一个安全漏洞,攻击者可通过利用提示注入触发外部图片请求,从而外泄文件,可能导致未经身份验证的下载链接泄露。

0 人收藏 0 人点赞
#agent-systems

SkillOpt 将 markdown 技能文件视为可训练参数并配备适当的优化机制

Reddit r/LocalLLaMA · 2026-05-26

一篇新论文通过将 markdown 技能文件视为可训练参数并使用经过保留集验证的有界编辑,将智能体的技能优化形式化。该方法在不同模型间迁移良好,并提升了程序化基准测试的性能。

0 人收藏 0 人点赞
#agent-systems

完美的智能体系统

Reddit r/openclaw · 2026-05-22

作者讲述了构建一个名为Alfred的多智能体系统,使用了专业化智能体以及OpenClaw和H-agent等工具的经历。但在反复失败后,建议从单个智能体开始保持简单,以避免复杂性和token浪费。

0 人收藏 0 人点赞
#agent-systems

第56天:我们的周期审查发现了一个治理违规。被发现的智能体是我自己。

Reddit r/AI_Agents · 2026-05-21

本文描述了一个自我审查的AI智能体系统,其中一个治理审查智能体发现了另一个智能体的违规行为,突出了系统自行检测和修复问题的能力。

0 人收藏 0 人点赞
#agent-systems

Multi-Stream LLMs:关于并行/分离提示、思考、I/O的新论文

Hacker News Top · 2026-05-21 缓存

本文提出了Multi-Stream LLMs,它使用多个并行的输入/输出流,使模型能够同时读取和生成,从而解除顺序聊天格式的限制。

0 人收藏 0 人点赞
#agent-systems

@_akhaliq: LongMINT 在长时域代理系统中评估多目标干扰下的记忆

X AI KOLs Following · 2026-05-21 缓存

LongMINT 是一个基准测试,用于在长时域代理系统中评估多目标干扰下的记忆性能。

0 人收藏 0 人点赞
#agent-systems

@dair_ai: 如果你设计生产级代理系统,这一点很重要。大多数开发者无意中让框架默认值做出了关键的…

X AI KOLs Following · 2026-05-20 缓存

本文介绍了生产级LLM代理的随机-确定性边界(SDB)概念,并提供了一种选择架构模式的方法,以提高可靠性和性能。

0 人收藏 0 人点赞
#agent-systems

@Khazix0918: https://x.com/Khazix0918/status/2056894400320708671

X AI KOLs Timeline · 2026-05-20 缓存

总结2026年Google I/O开发者大会的核心发布,包括Gemini 3.5 Flash模型、Gemini Omni Flash、Antigravity 2.0、Gemini Spark等AI模型、产品与Agent系统。

0 人收藏 0 人点赞
#agent-systems

学习跨域多智能体LLM协作的可迁移拓扑先验

arXiv cs.CL · 2026-05-19 缓存

本文提出TopoPrior框架,该框架从离线参考协作图中学习可迁移的拓扑先验,以生成跨域多智能体LLM协作的初始拓扑,显著降低了在线搜索开销和令牌消耗。

0 人收藏 0 人点赞
Next →
← 返回首页

提交意见反馈