标签
本文提出了可重复使用的经过认证的运行时监控器,用于过去时间信号时序逻辑(ptSTL),这些监控器使用语义潜在表示来评估不同规格而无需重新训练,并在行人交叉路口和Waymo驾驶数据上进行了验证。
Re2Pix 是一个分层视频预测框架,通过首先使用冻结的视觉基础模型预测语义表征,然后将这些预测作为条件输入到潜在扩散模型中以生成逼真的帧,从而改进未来视频生成。该方法通过嵌套丢弃和混合监督策略解决了训练-测试不匹配问题,在自动驾驶基准测试中实现了更好的时间语义一致性和感知质量。