agent-scaffolding

#agent-scaffolding

智能体回避：智能体是否知道何时停止而非行动？

arXiv cs.AI ↗ · 2026-06-30 缓存

本文定义了智能体回避问题，即决定大型语言模型智能体在不确定性下何时应停止行动的问题，并在网络购物、终端环境和问答场景中进行了评估。文章介绍了CONVOLVE，一种无需更新模型参数即可改善及时回避的上下文工程方法。

0 人收藏 0 人点赞

#agent-scaffolding

X AI KOLs Following ↗ · 2026-06-09 缓存

本文介绍了自我束具（Self-Harness），一种新的范式，其中基于LLM的智能体能够迭代地改进自身的操作束具——包括提示、工具和控制流程——无需人类工程师或更强大的外部智能体，在多个模型上取得了显著的性能提升。

0 人收藏 0 人点赞

#agent-scaffolding

X AI KOLs Following ↗ · 2026-06-07 缓存

每周精选AI论文综述，涵盖MIT的自我修正发现系统、智能体自我进化解析，以及谷歌使用智能体框架进行形式数学的LEAP系统。

0 人收藏 0 人点赞

#agent-scaffolding

X AI KOLs Timeline ↗ · 2026-06-05 缓存

一篇分析AI智能体可靠性的论文，已被ICML 2026接收。研究发现，即使是最新的前沿模型（GPT 5.5、Gemini 3.1 Pro、Claude Opus 4.7），相较于早期版本也仅有微小的可靠性提升，结果一致性较低，且智能体框架中依然存在持续性问题。

0 人收藏 0 人点赞

#agent-scaffolding

arXiv cs.AI ↗ · 2026-05-08 缓存

本文挑战了“向大语言模型智能体添加更多搭建组件总能提升性能”的假设，通过系统实验证明，跨组件干扰往往会导致性能下降。研究发现，在各种模型规模下，更简单、针对特定任务的组件子集通常优于配备齐全的“全能型”智能体。

0 人收藏 0 人点赞