噪声非平稳物联网环境中基于主动推理的自适应交通信号控制

arXiv cs.AI 2026/06/15 04:00 论文

摘要

本文提出了一种用于噪声物联网环境中自适应交通信号控制的主动推理控制器，在传感器遮挡和恶劣天气条件下，空闲时间和CO2排放均优于DQN。

arXiv:2606.13698v1 公告类型：交叉摘要：在配备物联网的城市交叉口中，交通信号控制必须在传感器遮挡、天气衰减和非平稳需求下保持有效。传统控制器在这些条件下性能下降，而学习到的策略难以审计。为解决这些挑战，我们提出了一种针对四臂信号交叉口的主动推理控制器，通过最小化关于各方向拥堵水平的高斯信念的预期自由能（EFE）来动态选择相位，从而形成完全可追溯的决策流程。我们在SUMO交通模拟器中将该控制器与基于规则的经验模型和深度Q网络（DQN）进行了基准测试，涵盖四种逐渐增加噪声和非平稳性的场景，包括传感器遮挡、恶劣天气和随机事故。在每个场景的100次独立随机评估中，主动推理在最嘈杂的场景下实现了最低的空闲时间和CO2排放（空闲时间56,977秒，CO2排放29.12千克，而DQN分别为71,741秒和30.56千克）。这些性能提升以公交优先服务率和相位切换频率的适度成本为代价。

查看原文

查看缓存全文

缓存时间: 2026/06/15 09:13

# 噪声非平稳物联网环境中自适应交通信号控制的主动推理
来源：https://arxiv.org/abs/2606.13698
查看PDF（https://arxiv.org/pdf/2606.13698）

> 摘要：在配备物联网的交叉口中，城市交通信号控制必须在传感器遮挡、天气衰减和非平稳需求下保持有效。传统控制器在这些条件下性能下降，而学习到的策略仍难以审计。为应对这些挑战，我们提出了一种针对四臂信号交叉口的主动推理控制器，它通过最小化关于每个方向拥堵水平的高斯信念的期望自由能（EFE）来动态选择相位，从而形成完全可追踪的决策流水线。我们在SUMO交通模拟器中，将控制器与基于规则的启发式方法和深度Q网络（DQN）进行了基准测试，涵盖了四个场景，这些场景逐步增加噪声和非平稳性，包括传感器遮挡、恶劣天气和随机事故。在每个场景的100次独立随机评估中，主动推理在最嘈杂的场景中实现了最低的闲置时间和CO2排放（56,977秒和29.12千克，而DQN为71,741秒和30.56千克）。这些增益是以公交优先服务率和相位切换频率的适度成本为代价的。

## 提交历史

来自：Alfreds Lapkovskis [查看电子邮件（https://arxiv.org/show-email/d40aab49/2606.13698）]**[v1]**2026年5月31日星期日 19:15:13 UTC（126 KB）

噪声非平稳物联网环境中基于主动推理的自适应交通信号控制

相似文章

用于城市设计的智能监控系统：基于人工智能的十字路口软基础设施分析

自动驾驶中基于不确定性感知与时间规制的专家建议强化学习

面向行人行为不确定性的安全自动驾驶的多智能体强化学习

从累积约束到自适应运行时安全控制用于非平稳强化学习

OracleTSC：用于交通信号控制的 Oracle 信息奖励门槛与不确定性正则化

提交意见反馈