AI交通科学家自主发现交通法规
摘要
本文介绍了TrafficSci,一种自主AI系统,通过迭代工作流程自动化发现跨城市的通用交通法规,成功重新发现了已建立的法规,并识别出城市驾驶行为中一种新的时间记忆尺度。
arXiv:2607.01639v1 公告类型:新
摘要:通用交通法规描述了跨城市拥堵、出行行为和驾驶行为的重复模式,为交通规划、管理和控制提供了科学基础。然而,这些法规的发现仍然依赖于专家驱动,需要从异质的观测证据中识别候选规律,或通过干预实验进行验证。尽管自主人工智能(AI)系统在受控实验室环境中推进了科学发现,但将其扩展到复杂的交通领域仍然是一个挑战。在此,我们提出TrafficSci,一种自主AI系统,将交通法规的发现形式化为一个可迭代、可审计的工作流程,集成了证据范围界定、批评-判断假设归纳以及观察-干预验证。在四个涵盖人口、网络、控制和轨迹尺度的案例研究中,TrafficSci自主重新发现了三条已有的交通法规,并识别出一种未报道的城市驾驶行为内在时间记忆尺度,该尺度在八个城市和两个轨迹数据集上统计一致。TrafficSci为将AI驱动的科学发现从受控领域扩展到复杂城市系统提供了一条路径。
查看缓存全文
缓存时间: 2026/07/03 05:45
# 利用AI交通科学家自主发现交通规律 来源:https://arxiv.org/html/2607.01639 \unnumbered \equalcont 这些作者对本文贡献相同。 \equalcont 这些作者对本文贡献相同。 \equalcont 这些作者对本文贡献相同。 \equalcont 这些作者对本文贡献相同。 \[1,4\]\fnmYisheng\surLv [4,5]\fnmFei\-Yue\surWang 1]多模态人工智能系统国家重点实验室,中国科学院自动化研究所,北京100190,中国 2]中国科学院大学人工智能学院,北京100049,中国 3]中国电信研究院,北京102209,中国 4]澳门系统工程研究所,澳门科技大学,澳门999078,中国 5]复杂系统管理与控制国家重点实验室,中国科学院自动化研究所,北京100190,中国 \fnmYue\surLiu\fnmXiaoyan\surGong\fnmQinghai\surMiao\fnmJunyou\surShang\fnmYutong\surWang\fnmChao\surGuo\fnmYonglin\surTian\fnmYizhang\surChai\fnmChao\[email protected] (https://arxiv.org/html/2607.01639v1/mailto:[email protected])[email protected] (https://arxiv.org/html/2607.01639v1/mailto:[email protected])\[[[[[ ###### 摘要 通用交通规律描述了跨城市的拥堵、出行和驾驶行为中的重复模式,为交通规划、管理和控制提供了科学基础。然而,这些规律的发现仍然依赖专家驱动,需要从异质的观测证据中识别候选规律,或通过干预实验进行验证。尽管自主人工智能(AI)系统在受控实验室环境中推动了科学发现,但将其扩展到复杂的交通领域仍是一项挑战。本文介绍TrafficSci,一个代理型AI系统,它将交通规律发现形式化为一个迭代、可审计的工作流,整合了证据范围界定、批评-判断假设归纳以及观测-干预验证。在涵盖人口、网络、控制和轨迹尺度的四个案例研究中,TrafficSci自主重新发现了三项已建立的交通规律,并识别出一个先前未报告的、城市驾驶行为中固有的时间记忆尺度,该尺度在八个城市和两个轨迹数据集中统计一致。TrafficSci为将AI驱动的科学发现从受控领域扩展到复杂的城市系统提供了一条路径。 城市交通网络是城市需要积极管理的最复杂系统之一。关于缓解拥堵、信号部署、路径规划和长期基础设施投资的决策,最终都依赖于对交通行为特点的定量理解:拥堵成本如何在网络上分布,人口如何在空间和时间上分配出行,个体驾驶员如何对前方情况做出反应,以及控制技术的效益如何随其部署水平而扩展。这种理解蕴含在交通规律中——简洁且可检验的规律性模式,在不同运行条件下重复出现,且关键是在不同城市间均可重现[[1 (https://arxiv.org/html/2607.01639#bib.bib1),2 (https://arxiv.org/html/2607.01639#bib.bib2),3 (https://arxiv.org/html/2607.01639#bib.bib3),4 (https://arxiv.org/html/2607.01639#bib.bib4),5 (https://arxiv.org/html/2607.01639#bib.bib5)]](#bib.bib5)]。这些规律为预测提供可解释的先验,为控制设计提供有原则的边界,并为城市规划提供可迁移的基础[[6 (https://arxiv.org/html/2607.01639#bib.bib6),7 (https://arxiv.org/html/2607.01639#bib.bib7),8 (https://arxiv.org/html/2607.01639#bib.bib8),9 (https://arxiv.org/html/2607.01639#bib.bib9)]](#bib.bib9)]。然而,相对于城市交通系统的复杂性,已建立的交通规律集仍然有限。数据驱动的预测和控制模型发展迅速[[10 (https://arxiv.org/html/2607.01639#bib.bib10)]](#bib.bib10)],但稳健交通管理最终依赖的可解释科学规律却没有跟上步伐,导致该领域在观测和优化日益复杂的交通系统能力与解释为何特定干预有效及其局限所在的能力之间存在日益扩大的差距。 缩小这一差距的困难既来自实践也来自结构。传统的交通规律研究始于文献的人工综合,经过变量和指标的反复设计,需要大量的实现工作(包括数据选择、清洗和定制分析代码),然后才能检验一个假设[[11 (https://arxiv.org/html/2607.01639#bib.bib11)]](#bib.bib11)]。可靠的验证通常需要跨越多个数据集、时间段和运行状态进行检查;涉及管理干预的问题还需要进行受控仿真实验。结果常常引发修改,从而重新启动整个循环。这些实践负担因与实验室科学的基本不对称而加剧。城市交通系统是开放的、非平稳的,且与人类行为紧密耦合;无法安排受控的物理实验来隔离变量并直接探究候选规律。因此,每个假设都应通过观测数据分析、计算模拟或两者结合来佐证。这种双重证据要求,加上每次实验迭代的高昂人工成本,限制了任何单个研究团队在现实时间框架内可以探索的假设空间,并使可能重要的交通规律未被发现。 大语言模型(LLMs)的最新进展通过将研究组织为可执行、可验证的工作流,为加速科学发现开辟了道路[[12 (https://arxiv.org/html/2607.01639#bib.bib12),13 (https://arxiv.org/html/2607.01639#bib.bib13),14 (https://arxiv.org/html/2607.01639#bib.bib14),15 (https://arxiv.org/html/2607.01639#bib.bib15),16 (https://arxiv.org/html/2607.01639#bib.bib16)]](#bib.bib16)]。在化学领域,Coscientist系统将语言模型与机器人工具集成,自主规划和执行实验[[17 (https://arxiv.org/html/2607.01639#bib.bib17)]](#bib.bib17)];在材料科学领域,A-Lab将计算预测与机器人合成相结合,在数天内发现并生产新型化合物[[18 (https://arxiv.org/html/2607.01639#bib.bib18)]](#bib.bib18)];在生物医学科学领域,Co-Scientist进一步展示了LLM代理在科学发现中的潜力,将文献推理、假设生成、实验规划和迭代细化整合到一个自动化研究工作流中[[19 (https://arxiv.org/html/2607.01639#bib.bib19)]](#bib.bib19)]。这些成功共享一个结构性前提:一个闭环,其中假设生成与实验验证紧密耦合[[20 (https://arxiv.org/html/2607.01639#bib.bib20)]](#bib.bib20)]。在每种情况下,循环的实验侧依赖于可控的实验室设备。对于受控实验通常不可行、且候选规律应同时经受观测和干预检验的领域,能否构建类似的循环,在交通科学中尚未得到系统探索。 在本文中,我们介绍TrafficSci,一个旨在为城市交通科学闭合这一发现循环的代理型AI系统。给定一个研究主题,TrafficSci通过结构化的树搜索机制检索和组织领域文献,将候选交通规律构建为锚定于引用证据的可证伪假设,并通过一个支持真实世界数据分析与仿真干预测试的实验模块对其进行验证[[21 (https://arxiv.org/html/2607.01639#bib.bib21)]](#bib.bib21)]。当测试结果无法佐证某个候选时,系统修改假设并重新进入验证循环。核心设计原则是观测佐证和干预测试在一个单一的迭代循环中运行,以应对一个没有可控实验室的领域所固有的双重证据标准。 我们通过四个案例研究评估TrafficSci,涵盖人口层面的出行和访问规模、网络层面的拥堵动态、面向控制的干预评估以及轨迹层面的驾驶时间规律性。在前三个案例研究中,TrafficSci自主重新发现并实证验证了先前工作中报告的已建立的交通规律,无需人工指定假设或验证程序。除了重新发现,TrafficSci还发现了一个先前未报告的法律——驾驶行为中稳定的时间记忆尺度规律,该规律直接从大规模车辆轨迹中识别,无需预定义的假设或分析模板,并在不同城市间保持一致。综合来看,这些结果表明,交通规律发现可以组织为可重复、可审计的计算机理,该机理恢复已有知识并识别传统研究遗漏的规律,初步证明了AI驱动的科学发现可以从受控实验室扩展到复杂的城市交通系统。 ## 1. 结果 ### 1.1 系统概述 参见图1图1:TrafficSci的架构。TrafficSci从交通证据范围界定模块开始,该模块检索相关文献并构建证据语料库。随后,交通规律归纳模块从检索到的证据中构建结构化的假设。这些假设由观测-干预验证模块通过真实世界交通数据的统计分析或仿真环境中的基于干预的实验进行评估。生成的实验证据被反馈以更新和细化假设,形成用于交通科学自动化发现的闭环过程。如图1所示,TrafficSci是一个自主系统,专门针对城市交通研究的独特特点进行设计,用于发现和验证交通规律。它遵循代理型AI驱动的工作流,包括论文检索、假设构建、自动化实验以及归纳模块内的反馈驱动假设细化。这些代理之间的协作使TrafficSci能够在人口层面的出行、网络层面的拥堵、面向控制的干预和轨迹层面的驾驶行为中,发现并验证交通规律。为了使这一工作流可操作,TrafficSci将发现过程组织为三个相互交互的功能模块: - •**交通证据范围界定模块** 使用基于文献的代理树搜索(Lit-LATS)框架,基于预定义的交通主题自主检索相关文献。它组织文献并提取关键信息,形成结构化的知识库,为假设构建和交通规律发现提供信息。 - •**交通规律归纳模块** 基于交通证据范围界定模块的知识库,生成结构化、可检验的假设。它定义了交通变量、它们之间的关系以及适用的条件,为实验验证提供假设。 - •**观测-干预验证模块** 为交通规律归纳模块生成的假设设计和执行实验。它在真实世界交通数据上进行观测验证,或在可主动操纵交通条件的仿真环境中进行干预验证。在可扩展的交通数据库支持下,该模块将结果反馈给闭环框架中的假设细化、拒绝或泛化。 这些模块共同将高层研究主题转化为经过实证检验的交通规律假设,其详细工作流如图2所示。 参见图2图2:TrafficSci的详细工作流。**a** 交通证据范围界定模块。给定一个研究领域提示,系统执行主题分解,并对每个子主题应用Lit-LATS进行结构化的文献探索,包括选择、扩展、检索、评估和反向传播,产生一个粗略排序的文献集。**b** 交通规律归纳模块。利用检索到的文献和领域提示,生成代理提出带有明确证据锚定的结构化候选假设。批评-判断循环筛选候选假设的有效性、概念新颖性、重要性和特异性,然后进行竞争性淘汰。选定的假设连同其证据集、批评记录和验证路径标签一起传递到验证模块。**c** 观测-干预验证模块。细化的假设由过程代理翻译为可执行程序,并由实验代理通过基于MCP的工具交互(例如SUMO、SciPy和OpenHands)进行实证测试,产生结构化的实验结果。 ### 1.2 基准测试:重新发现已建立的交通规律 我们使用三个已建立的城交通规律作为基准重新发现任务,以评估TrafficSci能否从早期证据中重构可检验的假设和验证程序。选取三个代表性案例,覆盖不同尺度的交通现象,包括人类移动性、拥堵动态和控制诱发的交通动态。为确保重新发现过程不依赖于直接访问目标研究,文献检索阶段限制为在相应参考文献论文之前发表的出版物。 参见图3图3:TrafficSci如何发现控制城市地点访客量的时空规律,该规律是旅行距离和访问频率的联合函数。**a** 用户提供的提示,指定目标科学问题。**b** 用于识别相关先前研究和实证证据的文献检索过程。**c** 从检索到的文献中构建可检验的假设。**d–g** 东京、巴黎、纽约和北京四个城市中访客量对组合距离-频率变量的对数-对数关系。**h** 系统生成的结论。结果表明不同城市间存在一致的逆平方规模关系。 #### 1.2.1 跨城市人类移动的普遍访问规律 城市中的人类移动特点是对不同地点的重复访问,在城市环境中形成丰富的时空访问模式[[22 (https://arxiv.org/html/2607.01639#bib.bib22)]](#bib.bib22)]。一个核心问题是,访客量能否通过一个同时考虑旅行距离和访问频率的通用规律来解释,而不仅仅是空间距离。这个问题与对重复人口流动、城市互动强度和地点需求的理解密切相关。研究《人类移动的普遍访问规律》[[3 (https://arxiv.org/html/2607.01639#bib.bib3)]](#bib.bib3)]报告指出,给定地点的访客数量与旅行距离和访问频率乘积的平方成反比,揭示了在异质城市间保持稳定的紧凑时空关系[[23 (https://arxiv.org/html/2607.01639#bib.bib23),24 (https://arxiv.org/html/2607.01639#bib.bib24)]](#bib.bib24)]。 为了重新审视这一规律,TrafficSci围绕三个核心变量组织问题——旅行距离、访问
相似文章
AutoSci:面向完整科研生命周期的以记忆为中心的智能代理系统
AutoSci是一个以记忆为中心的智能代理系统,旨在自动化完整的科学研究生命周期,从文献理解到回复审稿意见,使用基于LLM的智能体,具有持久记忆和自我进化能力。
用于城市设计的智能监控系统:基于人工智能的十字路口软基础设施分析
本学术论文介绍了一种基于人工智能的分析框架,利用现有的监控系统基础设施,评估交通软性干预措施对城市十字路口车辆速度和安全性所产生的影响。
科学领域的代理型AI实验
本文介绍了两个代理型AI框架:DeepTS/DeepCollector和DeepScribe,它们利用混合本地-云端架构和大语言模型,自动化科学工作流程,包括时间序列数据整理以及将物理讲座转化为结构化报告。
利用生成式AI拓宽交通安全数据获取渠道:一种基于模式框架的空间自然语言查询方法
本文提出了一种基于模式框架的自然语言接口,用于交通安全分析。该接口利用大型语言模型解释用户查询,同时保持对权威数据库的确定性执行。该框架在马萨诸塞州交通安全数据库上进行了评估,成功执行了所有查询,并在29%的案例中纠正了错误,展示了拓宽安全数据获取渠道的实用方法。
面向行人行为不确定性的安全自动驾驶的多智能体强化学习
本文提出了一种多智能体强化学习框架,该框架同时训练自动驾驶车辆和具有个性驱动乱穿马路行为的行人,与单智能体方法相比,碰撞率降低了30%,并展示了更真实的交互场景。