流式力控视频生成

Hugging Face Daily Papers 2026/06/05 00:00 论文

摘要

StreamForce 是一种因果统一视频生成模型，通过蒸馏流水线和自回归架构，为时变力提供实时、基于物理的响应，在力的遵循度和运动真实性方面达到了最先进的性能。

我们提出了 StreamForce，一个流式视频生成框架，通过连续的力输入实现基于物理的控制。与之前的视频模型不同，它们针对不同的力类型训练单独的模型、假设固定力或依赖非因果处理，StreamForce 是一个因果统一模型，能够即时且连贯地响应局部和全局的时变力。为此，我们设计了一个统一的力表示作为控制信号，并开发了一个用于力可控视频生成的蒸馏流水线。我们的模型结合了自回归效率和力响应性，保持了稳定的光度真实性和动态真实性。StreamForce 在单个 GPU 上运行速度可达 16.6 FPS，在力的遵循度和运动真实性方面达到了最先进的性能。项目网站：https://neu-vi.github.io/StreamForce/

查看原文

查看缓存全文

缓存时间: 2026/06/08 07:14

论文页面 - 基于流力控制的流式视频生成

来源：https://huggingface.co/papers/2606.07508

摘要

StreamForce 是一种因果统一的视频生成模型，通过蒸馏流水线（https://huggingface.co/papers?q=distillation%20pipeline）和自回归架构，为时变力提供实时、具有物理基础的响应。

我们提出 StreamForce，一个流式视频生成（https://huggingface.co/papers?q=streaming%20video%20generation）框架，能够通过连续力输入实现具有物理基础的控制。与以往针对不同力类型训练独立模型、假设力固定或依赖非因果处理的视频模型不同，StreamForce 是一个因果统一的模型，能够即时且连贯地响应局部和全局的时变力。为了实现这一点，我们设计了一种统一的力表示作为控制信号，并开发了用于力可控视频生成（https://huggingface.co/papers?q=force-controllable%20video%20generation）的蒸馏流水线（https://huggingface.co/papers?q=distillation%20pipeline）。我们的模型结合了自回归效率（https://huggingface.co/papers?q=autoregressive%20efficiency）与力响应能力，保持了稳定的光度与动态真实性。StreamForce 在单 GPU 上运行速度可达 16.6 FPS，在力遵循度和运动真实性方面均达到最先进水平。项目网站：https://neu-vi.github.io/StreamForce/

查看 arXiv 页面（https://arxiv.org/abs/2606.07508）查看 PDF（https://arxiv.org/pdf/2606.07508）项目页面（https://neu-vi.github.io/StreamForce/）添加到收藏（https://huggingface.co/login?next=%2Fpapers%2F2606.07508）

在您的 agent 中获取此论文：

hf papers read 2606\.07508

没有最新的 CLI？curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型链接此论文

请在模型 README.md 中引用 arxiv.org/abs/2606.07508，以便从此页面链接。

引用此论文的数据集0

没有数据集链接此论文

请在数据集 README.md 中引用 arxiv.org/abs/2606.07508，以便从此页面链接。

引用此论文的 Spaces0

没有 Space 链接此论文

请在 Space README.md 中引用 arxiv.org/abs/2606.07508，以便从此页面链接。

包含此论文的收藏0

没有收藏包含此论文

请将此论文添加到一个收藏（https://huggingface.co/new-collection）中，以便从此页面链接。

流式力控视频生成

论文页面 - 基于流力控制的流式视频生成

摘要

引用此论文的模型0

引用此论文的数据集0

引用此论文的 Spaces0

包含此论文的收藏0

相似文章

Causal Forcing++：可扩展的少步自回归扩散蒸馏，用于实时交互式视频生成

Steady-Forcing: 在长时域自然视频扩散中平衡空间持久性与运动连续性

Stream-R1：流式视频生成的可靠性-困惑度感知奖励蒸馏

Stream-T1：用于流式视频生成的测试时扩展

StreamChar: 基于解耦编排的长时域流式角色音视频生成

提交意见反馈