MapAgent:面向城市级车道级地图生成的工业级自主框架
摘要
MapAgent 是一个工业级自主框架,融合视觉语言处理与约束感知推理,能够自动生成符合规范的车道级地图,已在百度地图中为超过360个城市实现了95%以上的自动化。
查看缓存全文
缓存时间: 2026/06/04 03:41
论文页面 - MapAgent:面向城市级车道级地图生成的工业级智能体框架
来源:https://huggingface.co/papers/2606.04513
摘要
MapAgent 是一种工业级智能体架构,它将视觉语言处理与约束感知推理相结合,生成符合规范的车道地图,在大规模城市地图绘制中实现了高自动化率。
车道级地图(https://huggingface.co/papers?q=Lane-level%20maps)是自动驾驶(https://huggingface.co/papers?q=autonomous%20driving)和车道级导航的关键基础设施,然而为数百个城市构建和维护标准化的车道网络仍然高度依赖人工劳动。近年来的端到端矢量地图构建(https://huggingface.co/papers?q=vectorized%20mapping)方法可以直接从传感器数据预测车道几何和拓扑结构,但它们通常将地图绘制规范和交通规则视为隐式的、依赖数据集的监督信号。此外,在复杂场景(如标线磨损、缺失或被遮挡)中,正确的车道配置往往仅凭视觉证据难以确定,导致规范违反成为人工后期编辑的主要来源。我们提出 MapAgent,这是一种工业级智能体架构,它在矢量生成骨干网络的基础上增强,用于生产符合规范的车道地图。MapAgent 并非仅仅为地图预测添加一个智能体循环,而是将骨干网络的感知能力与显式规范验证、约束感知推理(https://huggingface.co/papers?q=constraint-aware%20reasoning)以及确定性地图编辑(https://huggingface.co/papers?q=deterministic%20map%20editing)相结合,并在一个有界、由验证驱动的 Judge(https://huggingface.co/papers?q=Planner)-Planner(https://huggingface.co/papers?q=Planner)-Worker(https://huggingface.co/papers?q=Worker)循环下运行。一个视觉语言 Judge(https://huggingface.co/papers?q=vision-language%20Judge)通过共同检查视觉证据和草稿向量来诊断错误,而一个调用工具的 Planner(https://huggingface.co/papers?q=Planner)则生成最小的修正编辑,并在编辑后重新验证。为了保持城市级生产的可扩展性,MapAgent 仅在骨干网络置信度较低的地图瓦片上选择性触发,在增加少量开销的同时保持吞吐量。在真实数据集(https://huggingface.co/papers?q=real-world%20datasets)上的实验表明,与强大的生产基线相比,MapAgent 持续取得改进,尤其是在复杂和长尾场景中。此外,MapAgent 已集成到百度地图中,支持全国超过 360 个城市的车道级地图生成,并将整体生产自动化率(https://huggingface.co/papers?q=production%20automation)提升至 95% 以上,展示了 MapAgent 在大规模车道级地图生成中的实用性和有效性。
查看 arXiv 页面(https://arxiv.org/abs/2606.04513)查看 PDF(https://arxiv.org/pdf/2606.04513)项目页面(https://github.com/eadst/KDD-2026-MapAgent)GitHub0(https://github.com/eadst/KDD-2026-MapAgent)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.04513)
引用本论文的模型0
暂无模型链接本论文
请在模型 README.md 中引用 arxiv.org/abs/2606.04513,以便在此页面建立链接。
引用本论文的数据集0
暂无数据集链接本论文
请在数据集 README.md 中引用 arxiv.org/abs/2606.04513,以便在此页面建立链接。
引用本论文的 Space0
暂无 Space 链接本论文
请在 Space README.md 中引用 arxiv.org/abs/2606.04513,以便在此页面建立链接。
包含本论文的收藏集0
暂无收藏集包含本论文
请将本论文添加到一个收藏集(https://huggingface.co/new-collection)中,以便在此页面建立链接。
相似文章
MAP:一种用于长周期交互式智能体推理的“先绘图后行动”范式
本文提出了“先绘图后行动”范式(MAP),这是一个即插即用的框架,在执行前将环境理解前置到交互式LLM智能体中,在多个基准测试中取得了一致性的性能提升,并使前沿模型在25个游戏环境中的22个上超越了接近零的基线性能。
@GoSailGlobal: 中文 AI Agent 现在最缺的是「能调到本地真数据」的能力 高德地图官方刚开了一个口子 amap-lbs-skill,适配 OpenClaw 平台,MIT 协议,9 star 打包了五样 POI 搜索 路径规划(步行 / 驾车 / 骑…
高德地图官方发布了 amap-lbs-skill,一个适配 OpenClaw 平台的开源工具包(MIT 协议),提供 POI 搜索、路径规划、旅游规划等五类地图数据服务,使 AI Agent 能够直接调用中国本地真实地理数据,实现可视化地图链接输出。
使用 GPT-4o 视觉微调构建更智能的地图
Grab 利用 OpenAI 的 GPT-4o 视觉微调功能改进 GrabMaps,在速度限制标志定位(13%)、车道计数(20%)方面取得显著精度提升,并减少了东南亚复杂路网的手动制图工作量。
学习局部通信以解决大规模多智能体路径规划
本文介绍了LC-MAPF,一种带有可学习通信模块的预训练模型,用于多智能体路径规划,它改善了协调性,并在保持可扩展性的同时优于现有基于学习的求解器。
一种结合大语言模型和思维链的自主AI框架,用于无人机辅助物流调度与移动边缘计算
本文提出了一种自主AI框架,利用大语言模型和思维链推理来优化无人机辅助的物流调度与移动边缘计算,旨在提高制造物流中的效率和资源分配。