agent-optimization

#agent-optimization

智能体优化器能否实现累积提升？——基于 Terminal-Bench 2.0 的持续学习评估

arXiv cs.AI ↗ · 6天前缓存

本文在 Terminal-Bench 2.0 上引入了一个两阶段持续学习评估，用以检验智能体优化方法的增益在递归应用时是否能够累积。结果发现，只有包含回归控制的 RELAI-VCL 方法实现了累积性改进。

0 人收藏 0 人点赞

#agent-optimization

X AI KOLs Timeline ↗ · 2026-07-11 缓存

一份详细报告，关于在 NVIDIA DGX Spark 上优化生产环境 vLLM 服务配置，纠正了导致 MTP acceptance 降低 34% 的标志设置。该结论基于对 90 多份 NVIDIA 官方文档的审阅以及一次包含 69 个场景的工具评估。

0 人收藏 0 人点赞

#agent-optimization

arXiv cs.CL ↗ · 2026-07-09 缓存

介绍STRACE，一个通过结构化轨迹分析与因果提取来构建高信噪比优化上下文以改进长周期智能体的框架，在形式化验证任务上超越基线。

0 人收藏 0 人点赞

#agent-optimization

Hugging Face Daily Papers ↗ · 2026-06-06 缓存

Bayesian-Agent 提出了一种框架，将可重复使用的技能和SOP视为假设，通过贝叶斯推理指导代理行为，并利用后验引导的框架优化提升任务性能。使用deepseek-v4-flash在多个基准上取得了显著改进。

0 人收藏 0 人点赞

#agent-optimization

X AI KOLs Timeline ↗ · 2026-05-20 缓存

Hermes Agent 现在原生支持 skill bundles，允许多个技能同时触发。作者建议只将逻辑上连贯的工作流程捆绑在一起，以避免指令冲突。

0 人收藏 0 人点赞

#agent-optimization

Reddit r/AI_Agents ↗ · 2026-05-12

本文揭示了冗长的命令行界面（CLI）输出如何浪费 LLM 编程智能体的 token，并介绍了一种基于模式的压缩器，能够在保留关键信息的同时减少 shell 命令输出的噪声。

0 人收藏 0 人点赞

#agent-optimization

Hugging Face Daily Papers ↗ · 2026-05-12 缓存

本文探讨了大型语言模型（LLM）异步强化学习中的旧 logits 缺失问题，提出了精确与近似的修正方法，以提升训练稳定性和性能。

0 人收藏 0 人点赞