标签
本文针对长时间运行的语言代理引入了记忆深度的概念,将其与基于检索的记忆访问区分开来,并提出了EVAF——一种利用惊喜和效价门控LoRA更新的选择性参数整合机制。跨多个模型的实验表明,EVAF在上下文卸载后以极少的参数写入提高了目标持久性。
一场关于如何有效运行自主长时编码代理的录播讨论,包含目标设定、模型选择及最佳实践等见解,现已免费提供。
Agent libOS 引入了一种受库操作系统启发的、用于大语言模型智能体的运行时基座,将智能体视为具有显式能力、生命周期管理、审计记录和人工审批队列的可调度进程。该设计将信任边界从工具调度移至运行时原语,使得长期运行的智能体能够安全地被调度、授权、恢复和审计。
来自Google的教程,教你使用Agent Development Kit (ADK)构建能暂停数日、重启后恢复且不丢失上下文的长时间运行AI智能体,并附有代码和逐步指导,适用于新员工入职等企业工作流。
一位实践者分享了AI代理连续运行6小时以上时,上下文窗口管理策略(摘要、RAG、截断)的真实失败模式,指出每种方法都会以仅在长时间运行时才会显现的方式降低决策质量。
Anthropic 应用AI团队在研讨会上分享了如何构建能持续运行数小时的智能体,核心在于上下文管理、规划与自我验证,以及模型与配套工具的共同演进。
ActiveGraph 引入了一个用于长期运行的人工智能代理的连续性层,基于 BabyAGI 的持久状态概念,以维护随时间推移的信念、依赖关系和行动的连贯且不断演变的模型。
一份详细的架构指南,介绍如何构建长期运行的AI代理,通过结合向量存储、图数据库和时间边缘(temporal edges)来处理随时间变化的用户偏好,而不是覆盖数据。
RecMem是一种基于重复的记忆整合方法,适用于长期运行的LLM智能体,通过仅在语义相似的交互重复出现时调用LLM,可减少高达87%的令牌消耗,同时提高准确性。
刚刚发布新 X 文章:5 种长时运行 AI Agent 的设计模式。借助 Google 全新 Agent Platform,构建可连续运行数天、无需中断的 Agent。
文章讨论了随着AI智能体运行时间延长至数天和数百步,传统可观测性方法失效,提出基于轨迹的可观测性驱动开发(ODD)来监控和调试长时间运行的智能体,并介绍了Honeycomb平台的相关实践。
Anthropic 推出了一种由两部分组成的解决方案,使用初始化代理和编码代理,使 Claude Agent SDK 能够有效处理跨多个上下文窗口的长时间运行任务,并通过保持干净、增量的状态来实现。