MapAgent:面向城市级车道级地图生成的工业级自主框架

Hugging Face Daily Papers 论文

摘要

MapAgent 是一个工业级自主框架,融合视觉语言处理与约束感知推理,能够自动生成符合规范的车道级地图,已在百度地图中为超过360个城市实现了95%以上的自动化。

车道级地图是自动驾驶和车道级导航的关键基础设施,然而为数百个城市构建和维护标准化的车道网络仍然高度依赖人工。近期端到端矢量化建图方法可以直接从传感器数据预测车道几何和拓扑,但它们通常将建图规范和交通规则视为隐式的、基于数据集的监督。此外,在复杂场景(例如磨损或缺失的标线、遮挡)中,正确的车道配置往往难以仅凭视觉证据确定,导致规范违规成为人工后期编辑的主要来源。我们提出 MapAgent,一种工业级自主架构,通过增强矢量化骨干网络,实现符合规范的车道地图生产。MapAgent 并非简单地在地图预测基础上增加一个智能体循环,而是在一个有界、验证驱动的“判断-规划-执行”循环中,将骨干感知与显式规范校验、约束感知推理和确定性地图编辑相结合。视觉语言判断器通过联合检查视觉证据和草稿向量来诊断错误,而工具调用规划器生成最小修正编辑并事后重新验证。为了在城市级生产中保持可扩展性,MapAgent 仅在骨干网络置信度较低的瓦块上选择性触发,增加适度开销的同时保持吞吐量。在真实世界数据集上的实验表明,与强大的生产基线相比,MapAgent 取得了持续改进,尤其在复杂和长尾场景中。此外,MapAgent 已集成到百度地图中,支持全国超过360个城市的车道级地图生成,将整体生产自动化率提升至95%以上,证明了 MapAgent 在大规模车道级地图生成中的实用性和有效性。
查看原文
查看缓存全文

缓存时间: 2026/06/04 03:41

论文页面 - MapAgent:面向城市级车道级地图生成的工业级智能体框架

来源:https://huggingface.co/papers/2606.04513

摘要

MapAgent 是一种工业级智能体架构,它将视觉语言处理与约束感知推理相结合,生成符合规范的车道地图,在大规模城市地图绘制中实现了高自动化率。

车道级地图(https://huggingface.co/papers?q=Lane-level%20maps)是自动驾驶(https://huggingface.co/papers?q=autonomous%20driving)和车道级导航的关键基础设施,然而为数百个城市构建和维护标准化的车道网络仍然高度依赖人工劳动。近年来的端到端矢量地图构建(https://huggingface.co/papers?q=vectorized%20mapping)方法可以直接从传感器数据预测车道几何和拓扑结构,但它们通常将地图绘制规范和交通规则视为隐式的、依赖数据集的监督信号。此外,在复杂场景(如标线磨损、缺失或被遮挡)中,正确的车道配置往往仅凭视觉证据难以确定,导致规范违反成为人工后期编辑的主要来源。我们提出 MapAgent,这是一种工业级智能体架构,它在矢量生成骨干网络的基础上增强,用于生产符合规范的车道地图。MapAgent 并非仅仅为地图预测添加一个智能体循环,而是将骨干网络的感知能力与显式规范验证、约束感知推理(https://huggingface.co/papers?q=constraint-aware%20reasoning)以及确定性地图编辑(https://huggingface.co/papers?q=deterministic%20map%20editing)相结合,并在一个有界、由验证驱动的 Judge(https://huggingface.co/papers?q=Planner)-Planner(https://huggingface.co/papers?q=Planner)-Worker(https://huggingface.co/papers?q=Worker)循环下运行。一个视觉语言 Judge(https://huggingface.co/papers?q=vision-language%20Judge)通过共同检查视觉证据和草稿向量来诊断错误,而一个调用工具的 Planner(https://huggingface.co/papers?q=Planner)则生成最小的修正编辑,并在编辑后重新验证。为了保持城市级生产的可扩展性,MapAgent 仅在骨干网络置信度较低的地图瓦片上选择性触发,在增加少量开销的同时保持吞吐量。在真实数据集(https://huggingface.co/papers?q=real-world%20datasets)上的实验表明,与强大的生产基线相比,MapAgent 持续取得改进,尤其是在复杂和长尾场景中。此外,MapAgent 已集成到百度地图中,支持全国超过 360 个城市的车道级地图生成,并将整体生产自动化率(https://huggingface.co/papers?q=production%20automation)提升至 95% 以上,展示了 MapAgent 在大规模车道级地图生成中的实用性和有效性。

查看 arXiv 页面(https://arxiv.org/abs/2606.04513)查看 PDF(https://arxiv.org/pdf/2606.04513)项目页面(https://github.com/eadst/KDD-2026-MapAgent)GitHub0(https://github.com/eadst/KDD-2026-MapAgent)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.04513)

引用本论文的模型0

暂无模型链接本论文

请在模型 README.md 中引用 arxiv.org/abs/2606.04513,以便在此页面建立链接。

引用本论文的数据集0

暂无数据集链接本论文

请在数据集 README.md 中引用 arxiv.org/abs/2606.04513,以便在此页面建立链接。

引用本论文的 Space0

暂无 Space 链接本论文

请在 Space README.md 中引用 arxiv.org/abs/2606.04513,以便在此页面建立链接。

包含本论文的收藏集0

暂无收藏集包含本论文

请将本论文添加到一个收藏集(https://huggingface.co/new-collection)中,以便在此页面建立链接。

相似文章

@GoSailGlobal: 中文 AI Agent 现在最缺的是「能调到本地真数据」的能力 高德地图官方刚开了一个口子 amap-lbs-skill,适配 OpenClaw 平台,MIT 协议,9 star 打包了五样 POI 搜索 路径规划(步行 / 驾车 / 骑…

X AI KOLs Timeline

高德地图官方发布了 amap-lbs-skill,一个适配 OpenClaw 平台的开源工具包(MIT 协议),提供 POI 搜索、路径规划、旅游规划等五类地图数据服务,使 AI Agent 能够直接调用中国本地真实地理数据,实现可视化地图链接输出。

使用 GPT-4o 视觉微调构建更智能的地图

OpenAI Blog

Grab 利用 OpenAI 的 GPT-4o 视觉微调功能改进 GrabMaps,在速度限制标志定位(13%)、车道计数(20%)方面取得显著精度提升,并减少了东南亚复杂路网的手动制图工作量。