分辨率不变的自适应体素力学属性场
摘要
AdaVoMP 使用稀疏自适应体素结构和 Transformer 编码器-解码器来预测三维物体的空间变化力学属性,从而实现高分辨率可变形模拟,提高了准确性和效率。
查看缓存全文
缓存时间: 2026/06/20 14:29
论文页 - 自适应体积力学属性场(分辨率无关)
来源:https://huggingface.co/papers/2606.18231
摘要
AdaVoMP 利用稀疏自适应体素结构与 Transformer 编码器-解码器模型,预测三维物体的密集空间变化力学属性,从而实现更逼真、更高精度且更高效的可变形仿真。
精确的力学属性(或材料参数)——如杨氏模量(E)、泊松比(ν)和密度(ρ)——对数字世界的可靠物理仿真至关重要,但大多数3D资产缺乏此类信息。我们提出 AdaVoMP,一种能针对不同表示形式的输入3D物体预测精确的密集空间变化(E, ν, ρ)的方法,在分辨率、精度和内存效率上均超越现有最佳技术。该技术的核心是一种稀疏自适应体素结构(SAV),能高效表示输入的三维形状和材料场输出。我们将先前最精确方法 VoMP 所采用的固定体素模型,替换为一种新型的稀疏Transformer编码器-解码器模型,该模型能针对每个输入形状自回归地生成独特的 SAV 来表示其材料属性,所达到的分辨率是先前技术的 16³ 倍。实验表明,即使测试时计算量少于所有现有方法,AdaVoMP 仍能估计出更准确的体积属性。这使得我们能够将高分辨率复杂三维物体转化为可直接用于仿真的资产,从而实现逼真的可变形仿真。
查看 arXiv 页面 (https://arxiv.org/abs/2606.18231) 查看 PDF (https://arxiv.org/pdf/2606.18231) 添加至收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.18231)
在您的代理中获取此论文:
hf papers read 2606.18231
没有最新 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型0
暂无模型关联此论文
请在模型 README.md 中引用 arxiv.org/abs/2606.18231 以从此页面建立链接。
引用该论文的数据集0
暂无数据集关联此论文
请在数据集 README.md 中引用 arxiv.org/abs/2606.18231 以从此页面建立链接。
引用该论文的 Space0
暂无 Space 关联此论文
请在 Space README.md 中引用 arxiv.org/abs/2606.18231 以从此页面建立链接。
包含该论文的合集0
暂无合集包含此论文
请将本论文添加至合集 (https://huggingface.co/new-collection) 以从此页面建立链接。
相似文章
SpatialAvatar-0:基于多阶段重建的高质量4D头部虚拟形象
SpatialAvatar-0 提出了一种基于共享 FLAME 网格绑定高斯表示的多阶段重建方法,用于高质量4D头部虚拟形象,在多个基准测试中实现了更优性能,且迭代次数更少。
Stream3D-VLM:基于增量几何先验的在线3D空间理解
Stream3D-VLM 是一款在线3D视觉-语言模型,通过增量整合几何先验并使用几何自适应体素压缩,能够从流式视频中实现实时空间理解,在3D空间理解任务上优于现有模型。
MeshWeaver: 稀疏体素引导的表面编织用于自回归网格生成
MeshWeaver 提出了一种自回归网格生成框架,它使用多级稀疏体素编码器直接预测顶点,为高多边形网格实现了最先进的压缩率和几何保真度。
Patch-PODiff-ViT: 基于分块POD的结构化潜在扩散模型,用于超分辨率和不确定性量化
Patch-PODiff-ViT 引入了一种结构化潜在扩散框架,利用分块本征正交分解 (POD) 实现超分辨率和不确定性量化,通过固定的线性正交基和预测方差的解析传播实现高效扩散。
AdaCodec:面向视频多模态大模型的预测性视觉编码
AdaCodec 通过仅在场景预测失败时传输完整视觉标记,否则使用紧凑的帧间变化描述,从而减少多模态大模型中的视频编码冗余。在匹配的标记预算下,它优于逐帧 RGB 基线,并且在使用显著更少标记的情况下取得更好或相当的结果,将首令牌延迟从 9.26 秒降至 1.62 秒。