PhysForge:为交互式虚拟世界生成具备物理基础的 3D 资产
摘要
PhysForge 是一个两阶段框架,能够生成具备物理基础和运动学参数的交互式 3D 资产,解决了虚拟世界中静态几何模型带来的瓶颈问题。
查看缓存全文
缓存时间: 2026/05/08 08:11
论文页面 - PhysForge:为交互式虚拟世界生成物理接地 3D 资产
来源:https://huggingface.co/papers/2605.05163
摘要
PhysForge 通过结合用于物理规划的视觉-语言模型(VLM)与一种新型注入机制,利用物理接地扩散模型合成详细的几何结构和运动学参数,从而生成交互式 3D 资产。
合成物理接地的 3D 资产是交互式虚拟世界和具身智能体的关键瓶颈。现有方法主要侧重于静态几何结构,忽视了交互所需的功能属性。我们提出,交互式资产生成必须以功能逻辑和分层物理为基础。为了弥合这一差距,我们提出了 PhysForge,这是一种由 PhysDB(包含 15 万个资产和四级物理标注的大规模数据集)支持的两阶段解耦框架。首先,视觉-语言模型作为“物理架构师”,规划出定义材料、功能和运动学约束的“分层物理蓝图”(Hierarchical Physical Blueprint)。其次,物理接地扩散模型(physics-grounded diffusion model)通过新颖的 KineVoxel 注入(KineVoxel Injection)(KVI)机制,实现该蓝图,合成高保真几何结构及精确的运动学参数(kinematic parameters)。实验表明,PhysForge 能够生成功能合理、可直接用于模拟的资产(simulation-ready assets),为交互式 3D 内容和具身智能体提供了稳健的数据引擎。
查看 arXiv 页面 (https://arxiv.org/abs/2605.05163) 查看 PDF (https://arxiv.org/pdf/2605.05163) 项目页面 (https://hku-mmlab.github.io/PhysForge/) GitHub44 (https://github.com/HKU-MMLab/PhysForge) 加入收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.05163)
在您的代理中获取此论文:
hf papers read 2605\.05163
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型 0
没有链接此论文的模型
请在模型 README.md 中引用 arxiv.org/abs/2605.05163 以从本页面链接它。
引用此论文的数据集 0
没有链接此论文的数据集
请在数据集 README.md 中引用 arxiv.org/abs/2605.05163 以从本页面链接它。
引用此论文的 Spaces 0
没有链接此论文的 Space
请在 Space README.md 中引用 arxiv.org/abs/2605.05163 以从本页面链接它。
包含此论文的合集 1
相似文章
PhysiFormer: 在世界空间中学习模拟力学
PhysiFormer 使用坐标空间扩散生成物理上合理的3D物体运动,无需显式归纳偏置,实现了高效的多物体推理以及对复杂材料和几何形状的泛化。
PhyGenHOI: 物理感知的动态人-物交互4D生成
PhyGenHOI是一个新颖框架,通过将运动扩散模型与物质点方法模拟相结合,利用3D高斯表示生成物理精确的4D人-物交互。
GamerForge
GamerForge 是一款AI驱动的工具,可转换游戏、CGI和VFX资产,让创作者能够高效地增强和编辑数字资产。
@ziqi_huang_: 关于物理AI的有趣工作:PhysX-Omni。首个统一的可模拟生成框架,支持刚体、可变形和…
PhysX-Omni 是一个统一的框架,用于可模拟的物理3D生成,涵盖刚体、可变形体和关节物体,并带有新数据集(PhysXVerse)和基准(PhysX-Bench)。
PhyMotion: 面向物理驱动人体视频生成的结构化3D运动奖励
PhyMotion 提出一种基于物理的奖励系统,评估生成视频中人体运动的运动学合理性、接触一致性和动态可行性,与人类判断具有更强的相关性,并在基于强化学习的后训练中提升运动真实感。