使用时间段模型进行预测和控制

OpenAI Blog 2017/03/12 08:00 论文

摘要

OpenAI 推出了一种使用深度生成模型在时间段上学习复杂非线性系统动力学的方法，能够实现稳定的长期预测和可微分的轨迹优化以进行基于模型的控制。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/04/20 14:43

# 使用时间段模型进行预测和控制来源：https://openai.com/index/prediction-and-control-with-temporal-segment-models/ ## 摘要我们介绍了一种基于深度生成模型学习复杂非线性系统动力学的方法，该方法在状态和动作的时间段上运行。与在单个离散时间步上运行的动力学模型不同，我们学习未来状态轨迹的分布，该分布以过去状态、过去动作和规划的未来动作轨迹为条件，以及动作轨迹的隐变量先验。我们的方法基于卷积自回归模型和变分自编码器。它对复杂的随机系统在长时间跨度上做出稳定准确的预测，有效地表达不确定性并建模碰撞、传感器噪声和动作延迟的影响。学习到的动力学模型和动作先验可用于端到端的、完全可微的轨迹优化和基于模型的策略优化，我们用它来评估我们方法的性能和样本效率。

使用时间段模型进行预测和控制

相似文章

用于具有不可观测记忆状态的欧拉-拉格朗日系统自适应控制的时序注意力

将预测未来行为作为一项学习任务

面向自回归动力系统预测的可扩展单步生成建模

面向切换动态序列的时变深度状态空间模型

基于时间增强符号图神经网络的动态链接预测

提交意见反馈