标签
新论文提出自压缩语言模型代理,该类代理可自行决定何时清理其推理和工具调用轨迹,以避免积累错误和过时信息。
一位29岁的中国销售利用Claude和6个AI代理搭建ETH价格模拟引擎,上月盈利30.6万美元,展示了AI在量化交易中的潜力。
几乎所有AI模型和智能体的进步都依赖于评估(evals)。通过评估理解工作流程和智能体性能将成为企业推动自动化的核心能力。
本文解释了AI代理中的循环工程概念,强调核心循环很简单,但关键工作在于模型周围的“束具”,包括知道何时停止以及防止上下文腐败。
Otto (MIT) 是一个开源浏览器扩展,它通过 CLI 或代理将真实标签页转化为可控节点,解决了“代理需要浏览器”的问题,无需无头农场或昂贵的云服务。
Oak是一个为AI代理设计的开源版本控制系统,提供每会话分支工作流、内容寻址懒挂载,以及比Git更快的性能。目前处于公开测试阶段,可作为CLI工具和可复用的Rust库使用。
Box首席执行官Aaron Levie认为,AI智能体使用软件的频率将比人类高出100倍,因此需要设置护栏、权威数据源、日志记录和协作功能;能够支持无头交互的平台将占据最佳优势。
精心整理的 10 个用于通过强化学习训练 AI Agent 的开源工具,涵盖 OpenPipe ART、verl-agent、Agent Lightning 和 Unsloth 等框架,并介绍了各工具的使用场景和优势。
代理强化训练器(ART)是一个开源框架,将基于GRPO的强化学习嵌入任何Python应用,使代理能够通过环境交互学习,利用轨迹评分和LoRA更新,据称使用Qwen 2.5 14B模型在邮件检索任务上超越OpenAI的o3。
一篇来自Google DeepMind的58页论文,关于构建专精于博弈论的智能体,重点介绍了研究中的关键见解。
本文介绍了一台运行六个AI代理(24/7不间断)的配置,设备是Minisforum MS-S1 Max迷你工作站,搭载AMD Ryzen AI Max+ 395芯片,每月电费仅11美元。文章强调从云端API成本转向本地推理,实现始终在线的代理,用于邮件分类、研究监控和文档处理等任务。
一条推文强调,来自韩国的Q使用Codex桌面应用和lazycodex实现了一个会话,其中有近300个子代理运行超过一天,展示了前沿的代理工程。
Perplexity Brain是一个记忆系统,它构建了一个跨任务、项目、决策、文件和来源的持久上下文图,使智能体能够从相关上下文开始,而不是从头开始,从而提高答案正确性并降低任务成本。
有Hacker News用户询问是否有人在使用Google的A2A代理间协议,提到六个月前的困惑和MCP的兴起,但现在看到了代理交互的潜力。