MeshWeaver: 稀疏体素引导的表面编织用于自回归网格生成

Hugging Face Daily Papers 论文

摘要

MeshWeaver 提出了一种自回归网格生成框架,它使用多级稀疏体素编码器直接预测顶点,为高多边形网格实现了最先进的压缩率和几何保真度。

自回归网格生成通过将网格分词化为序列并以语言建模方式训练模型而受到关注。然而,现有方法存在两个基本限制:(i)分词效率低,导致分词序列过长,无法扩展到高多边形网格;(ii)缺乏几何感知引导,因为生成仅以全局形状嵌入为条件,而非局部表面线索。我们介绍 MeshWeaver,这是一个自回归框架,它将网格生成视为一个表面编织过程,直接预测下一个顶点,而非独立坐标。其核心是一个多级稀疏体素编码器,通过三种互补方式将几何上下文注入生成过程:提供体素特征作为顶点表示,通过交叉注意力引导令牌预测,以及作为结构脚手架,将生成约束在输入表面周围。我们的分层设计能够在单次解码步骤中实现从粗到细的顶点预测,同时将生成模型与三维几何紧密耦合。大量实验表明,MeshWeaver 实现了 18% 的最先进压缩率,能够生成多达 16K 面的网格,并在几何保真度上显著优于先前方法。
查看原文
查看缓存全文

缓存时间: 2026/06/04 03:41

论文页面 - MeshWeaver:基于稀疏体素引导的表面编织自回归网格生成

来源:https://huggingface.co/papers/2606.04688

摘要

MeshWeaver 提出了一种自回归网格生成框架,该框架直接预测顶点而非坐标,利用多层级稀疏体素编码器增强几何上下文,实现了卓越的压缩比和保真度。

自回归网格生成(https://huggingface.co/papers?q=Autoregressive%20mesh%20generation)通过将网格标记化为序列并以语言建模(https://huggingface.co/papers?q=language-modeling)方式训练模型而受到关注。然而,现有方法存在两个根本性局限:(i)标记化(https://huggingface.co/papers?q=tokenization)效率低,导致生成的标记序列过长,无法扩展到高面数网格;(ii)缺乏几何感知引导,生成过程仅依赖全局形状嵌入而非局部表面线索。我们提出了 MeshWeaver,这是一个自回归框架,将网格生成视为表面编织过程,直接预测下一个顶点而非独立的坐标。其核心是一个多层级稀疏体素编码器(https://huggingface.co/papers?q=multi-level%20sparse-voxel%20encoder),通过三种互补方式将几何上下文(https://huggingface.co/papers?q=geometric%20context)注入生成过程:提供体素特征作为顶点表示、通过交叉注意力(https://huggingface.co/papers?q=cross-attention)引导针对体素特征的标记预测、以及作为结构支架将生成约束在输入表面附近。我们的层级设计能够在单次解码步骤中实现由粗到细的顶点预测(https://huggingface.co/papers?q=vertex%20prediction),同时将生成模型与3D几何紧密耦合。大量实验证明,MeshWeaver 实现了18%的最先进压缩比,能够生成多达16K面的网格,并且在几何保真度(https://huggingface.co/papers?q=geometric%20fidelity)上显著优于先前方法。

查看 arXiv 页面(https://arxiv.org/abs/2606.04688)查看 PDF(https://arxiv.org/pdf/2606.04688)添加到收藏(https://huggingface.co/login?next=%2Fpapers%2F2606.04688)

在您的 agent 中获取此论文:

hf papers read 2606\.04688

没有最新 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型引用此论文

在模型 README.md 中引用 arxiv.org/abs/2606.04688 即可从此页面链接。

引用此论文的数据集0

没有数据集引用此论文

在数据集 README.md 中引用 arxiv.org/abs/2606.04688 即可从此页面链接。

引用此论文的 Spaces0

没有 Space 引用此论文

在 Space README.md 中引用 arxiv.org/abs/2606.04688 即可从此页面链接。

包含此论文的收藏集0

没有收藏集包含此论文

将此论文添加到一个收藏集(https://huggingface.co/new-collection)即可从此页面链接。

相似文章

SplatWeaver:学习分配高斯基元以实现可泛化新视角合成

Hugging Face Daily Papers

SplatWeaver 是一种前馈新视角合成框架,它根据空间复杂度动态分配 3D 高斯基元,相比固定分配方法提升了渲染质量与效率。该框架利用基数高斯专家和高频先验引导的像素级路由方案,自适应地在复杂与平滑的场景区域间分配基元。

UniMesh:统一3D网格理解与生成

Hugging Face Daily Papers

UniMesh通过单一模型,借助Mesh Head、链式网格迭代编辑和自省纠错机制,同时完成3D网格生成与理解任务。

Helix4D:复杂4D网格生成

Hugging Face Daily Papers

Helix4D 提出了一种从视频生成高质量动态4D网格的框架,通过扩展Trellis2,引入跨帧注意力机制和4D时间编码,在不增加参数的情况下重新利用冗余的空间RoPE频带,从而实现这一目标。

基于时空注意力链的快速4D网格生成

Hugging Face Daily Papers

一种基于时空注意力链的无需训练4D网格生成方法,将创建时间加速至9秒(13倍加速),同时提升时间一致性并扩展到更长的序列,具备零样本追踪和相机估计能力。

GenRecon:结合生成先验的多视图3D场景重建

Hugging Face Daily Papers

GenRecon提出了一种3D场景重建方法,将生成式3D先验与多视图图像条件相结合,实现了室内环境的高保真、可编辑网格重建,性能比现有方法提升16%。