标签
WISE提出了一种用于Minecraft的长视距智能体框架,通过因果事件图增强低级控制器的情景记忆,使其能够在视角变化下稳健回忆,并通过因果推理实现机会性任务重排序。该框架还采用了多尺度渐进探索策略,在长视距稀疏任务上展示了更高的成功率和效率。
介绍了HIPIF,一种通过分层规划与信息折叠来训练LLM智能体处理长期任务的方法,旨在减少长上下文干扰,在三个基准测试上取得了优异结果。
一篇关于多代理AI协作的实战分享,提出了使用Opus 4.8做规划、Deepseek/Gemma做执行的分层策略,可降低成本10倍、提升速度2倍,并开源了相关实现。
MM-WebAgent是一种分层智能体框架,通过联合优化布局和多模态内容来协调基于AIGC的元素生成,从而生成连贯且视觉一致的网页。本文引入了一个基准测试和多级评估协议,展示了该框架相比代码生成和基于智能体的基线方法的改进。
HiVLA 提出了一种分层视觉-语言-动作框架,通过使用扩散变换器动作专家将语义规划与运动控制解耦,从而改进机器人操作。该系统结合了用于任务分解和视觉接地的VLM规划器与使用级联交叉注意力的专用DiT动作专家,在长周期任务和细粒度操作方面尤其优于端到端基线。
Agent S2 是一种新型的计算机使用智能体组合式框架,通过采用混合定位(Mixture-of-Grounding)与主动分层规划(Proactive Hierarchical Planning)技术,在多个基准测试中达到了最先进的性能。