semantic-representations

标签

Cards List
#semantic-representations

在不同规格下使用语义潜在表示的基于视觉运行时监控

arXiv cs.LG · 2026-05-15 缓存

本文提出了可重复使用的经过认证的运行时监控器,用于过去时间信号时序逻辑(ptSTL),这些监控器使用语义潜在表示来评估不同规格而无需重新训练,并在行人交叉路口和Waymo驾驶数据上进行了验证。

0 人收藏 0 人点赞
#semantic-representations

表征先于像素:语义引导的分层视频预测

Hugging Face Daily Papers · 2026-04-13 缓存

Re2Pix 是一个分层视频预测框架,通过首先使用冻结的视觉基础模型预测语义表征,然后将这些预测作为条件输入到潜在扩散模型中以生成逼真的帧,从而改进未来视频生成。该方法通过嵌套丢弃和混合监督策略解决了训练-测试不匹配问题,在自动驾驶基准测试中实现了更好的时间语义一致性和感知质量。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈