hierarchical-planning

#hierarchical-planning

MM-WebAgent: 一种用于网页生成的分层多模态Web智能体

Hugging Face Daily Papers ↗ · 2026-04-16 缓存

MM-WebAgent是一种分层智能体框架，通过联合优化布局和多模态内容来协调基于AIGC的元素生成，从而生成连贯且视觉一致的网页。本文引入了一个基准测试和多级评估协议，展示了该框架相比代码生成和基于智能体的基线方法的改进。

0 人收藏 0 人点赞

#hierarchical-planning

Hugging Face Daily Papers ↗ · 2026-04-15 缓存

HiVLA 提出了一种分层视觉-语言-动作框架，通过使用扩散变换器动作专家将语义规划与运动控制解耦，从而改进机器人操作。该系统结合了用于任务分解和视觉接地的VLM规划器与使用级联交叉注意力的专用DiT动作专家，在长周期任务和细粒度操作方面尤其优于端到端基线。

0 人收藏 0 人点赞

#hierarchical-planning

Papers with Code Trending ↗ · 2025-04-01 缓存

Agent S2 是一种新型的计算机使用智能体组合式框架，通过采用混合定位（Mixture-of-Grounding）与主动分层规划（Proactive Hierarchical Planning）技术，在多个基准测试中达到了最先进的性能。

0 人收藏 0 人点赞