基于质量感知神经算子的点云拉普拉斯特征空间学习
摘要
介绍了NEO,一种从点云预测低频拉普拉斯-贝尔特拉米特征空间的神经框架,通过质量感知神经算子和Rayleigh-Ritz精化,实现近线性扩展和强大的零样本泛化能力。
arXiv:2605.24390v1 公告类型: 新
摘要: 拉普拉斯-贝尔特拉米算子(LBO)的特征分解是几何分析的基础,但由于在大规模数据上迭代求解器的高昂成本,计算其低频特征模态仍然是一个重大瓶颈。为了分摊这一成本,我们引入了神经特征空间算子(NEO),这是一种前馈框架,旨在直接从点云预测谱。关键在于,NEO通过学习稳定的、不变的低频子空间,规避了标准特征向量回归的病态性质(该回归存在固有的符号翻转和旋转歧义)。具体来说,网络预测一组冗余的基函数,其张成空间稳健地覆盖目标特征空间,从而通过轻量级的Rayleigh-Ritz精化恢复精确的特征对。为了处理不规则采样,我们提出了一种质量感知神经算子,将每点面积权重融入基于注意力的聚合中,提高了对非均匀密度的鲁棒性,并实现了跨分辨率的零样本泛化。我们的方法实现了近线性运行时扩展,并在相当精度下相比迭代求解器获得了显著的墙上时间加速,同时表现出对高分辨率点云的强大零样本迁移。所得的特征对支持标准谱几何任务,而原始基函数为下游学习提供了有效的逐点特征。代码: https://github.com/Adversarr/NEO.
查看缓存全文
缓存时间: 2026/05/26 09:05
# 学习点云上带质量感知的神经算子的拉普拉斯本征空间 来源: https://arxiv.org/html/2605.24390 \(2026\) ###### 摘要 拉普拉斯-贝尔特拉米算子(LBO)的特征分解是几何分析的基础,但由于在大规模数据上迭代求解器的成本高昂,计算其低频特征模态仍是一个重大瓶颈。为了摊销这一成本,我们引入了神经特征空间算子(NEO),这是一个前馈框架,旨在直接从点云预测频谱。关键的是,NEO通过学习稳定、不变的低频子空间,规避了标准特征向量回归的不适定性——后者固有地存在符号翻转和旋转歧义。具体来说,网络预测一组冗余的基函数,其张成空间稳健地覆盖目标特征空间,从而可以通过轻量级的瑞利-里兹精化恢复精确的特征对。为了处理不规则采样,我们提出了一种质量感知神经算子,它将逐点面积权重纳入基于注意力的聚合中,从而提高了对非均匀密度的鲁棒性,并实现了跨分辨率的零样本泛化。我们的方法实现了近线性的运行时间缩放,并在相当精度下相比迭代求解器获得了显著的墙上时钟加速,且对高分辨率点云展现出强大的零样本迁移能力。得到的特征对支持标准的谱几何处理任务,而原始基函数则为下游学习提供了有效的逐点特征。 代码: https://github.com/Adversarr/NEO 谱几何处理,特征值问题,神经算子 ††journal:TOG ††journalyear:2026 ††conference:Special Interest Group on Computer Graphics and Interactive Techniques Conference Conference Papers; July 19–23, 2026; Los Angeles, CA, USA ††booktitle:Special Interest Group on Computer Graphics and Interactive Techniques Conference Conference Papers \(SIGGRAPH Conference Papers ’26\), July 19–23, 2026, Los Angeles, CA, USA ††doi:10.1145/3799902.3811185 ††isbn:979-8-4007-2554-8/2026/07 ††ccs:Computing methodologies Shape analysis ††ccs:Computing methodologies Artificial intelligence ††ccs:Computing methodologies Neural networks 请参见图1。 图1.我们提出了NEO,一个神经框架,通过直接从原始点云预测低频特征空间来加速拉普拉斯-贝尔特拉米谱分析。 左:不同分辨率、采样密度和形状类别(底部)的示例输入以及相应的预测低频特征函数(顶部)。 右:得到的谱表示可用于下游几何处理任务,如形状匹配(函数映射)、热方法测地线和分割。 NEO的预告图。左侧显示了多个具有不同分辨率、采样密度和形状类别的3D点云输入,以及在形状上可视化的预测低频拉普拉斯-贝尔特拉米特征函数。右侧展示了预测频谱的下游用途,包括函数映射形状匹配、基于热核的测地线计算和分割。 ## 1. 引言 拉普拉斯-贝尔特拉米算子(LBO)的特征模态提供了3D形状的内在谱表示(Lévy,2006 (https://arxiv.org/html/2605.24390#bib.bib20))。就像欧几里得域上的傅里叶基一样,*低频*特征函数捕捉全局、平滑的几何结构,支撑着各种图形学流程(Vallet and Lévy,2008 (https://arxiv.org/html/2605.24390#bib.bib47); Ovsjanikov et al.,2012 (https://arxiv.org/html/2605.24390#bib.bib33)),从谱网格处理(Lévy and Zhang,2010 (https://arxiv.org/html/2605.24390#bib.bib21); Zhang et al.,2007 (https://arxiv.org/html/2605.24390#bib.bib54))和物理模拟(Pentland and Williams,1989 (https://arxiv.org/html/2605.24390#bib.bib35)),到几何深度学习(Bronstein et al.,2017 (https://arxiv.org/html/2605.24390#bib.bib6); Sharp et al.,2022 (https://arxiv.org/html/2605.24390#bib.bib42))。实际上,获得这一基归结为求解由LBO离散化产生的稀疏广义特征值问题(GEVP)。虽然离散化通常是局部的且高效的,但提取前\(k\)个低频模态仍然是主要的计算瓶颈。基于Krylov子空间的标准特征求解器(例如,隐式重启Lanczos方法)通过迭代过程计算这些模态。因此,计算本质上是*逐实例*的:分辨率、重新采样或变形的变化往往需要重新计算分解。这一成本在大规模下是难以承受的,迫使谱分析在许多流程中退化为离线预处理。 请参见图2。 图2. LBO特征空间计算的歧义性。特征函数并非唯一确定:每个模态仅确定到全局符号,而重复(或接近重复)特征值在同一特征空间内允许任意正交基。因此,同样有效的特征求解器(或同一求解器在微小数值扰动下)可能为同一形状返回不同的特征向量基(A vs. B),包括(左)退化特征空间内的旋转、(中)符号翻转,以及(右)谱簇附近的模态混合或重排序。这些歧义使得直接的特征向量回归变得不适定,因为没有唯一的基可以对齐。 比较图,展示了同一形状的拉普拉斯-贝尔特拉米特征向量的歧义性。示例显示了有效解,它们通过重复特征空间内的旋转、特征函数的符号翻转,或谱簇附近的模态混合与重排序而不同。 受前馈流程(如RenderFormer (Zeng et al.,2025 (https://arxiv.org/html/2605.24390#bib.bib53)) 和 VGGT (Wang et al.,2025 (https://arxiv.org/html/2605.24390#bib.bib48)))成功的启发,我们将这一范式推广到谱分析,通过学习直接在3D点云上求解GEVP。我们的目标是在单一前馈传递中预测低频LBO特征空间的高质量近似。然而,由于固有的歧义(Davis and Kahan,1970 (https://arxiv.org/html/2605.24390#bib.bib12); Golub and Van Loan,2013 (https://arxiv.org/html/2605.24390#bib.bib13); Chang et al.,2024 (https://arxiv.org/html/2605.24390#bib.bib9)),直接回归离散化特征向量是不适定的:每个特征向量仅定义到符号翻转,而重复特征值在相关特征空间内允许任意旋转(见图2 (https://arxiv.org/html/2605.24390#S1.F2))。因此,回归单个向量迫使网络记忆训练数据中任意的基选择,导致训练不稳定和泛化能力差。为了解决这一问题,我们利用了一个事实:尽管单个特征函数是歧义的,但它们张成的低频不变子空间是唯一且定义良好的。因此,我们将学习目标从回归单个特征函数转移到预测一组函数,其张成空间稳健地捕捉目标特征空间。为此,我们引入了*神经特征空间算子*(NEO),一个从原始点云预测低频不变子空间的前馈框架。NEO并不精确输出\(k\)个模态,而是预测一组适度冗余的\(m\)个函数(\(m > k\)),其张成空间稳健地捕捉目标特征空间,为容纳重复或邻近特征值提供了余量。关键在于,为了处理点云采样的不规则性,我们在神经算子中采用了*质量感知*注意力机制。该模块明确地将点质量纳入特征聚合,确保神经算子近似关于底层测度的连续积分算子,而不是被采样密度所偏置。我们使用一个旋转不变的损失来训练NEO,该损失比较的是张成空间而非单个特征向量,从而直接解决了上述特征向量歧义问题。当需要显式特征对时,我们应用一个轻量级的瑞利-里兹精化。这一步将离散化算子投影到预测的低维基上,将原始的、大规模稀疏GEVP简化为一个小型稠密特征值问题,从而高效求解。我们的实验表明,NEO实现了近线性的推理缩放,加速了从数千点到超过一百万个点的点云上的特征求解。同时,它通过预测具有低张成空间误差的子空间并支持可靠的瑞利-里兹特征对恢复,保持了谱精度。得益于其质量感知神经算子,NEO可以仅在低分辨率数据上训练,却在密集几何上展现出强大的零样本迁移能力,同时在非均匀采样和多种离散化下保持鲁棒性。恢复的特征对可用于标准的谱几何流程,而原始预测函数也为下游学习任务提供了有效的逐点特征。我们将贡献总结如下: - •**神经特征求解框架**。我们提出了一个基于学习的框架,将低频LBO特征求解重新表述为不变子空间预测,随后进行瑞利-里兹精化。该方法能够在一次性训练后实现快速的线性时间推理。 - •**几何学习公式**。我们将质量感知机制集成到神经算子中,使其尊重曲面测度并提高对非均匀采样的鲁棒性。结合旋转不变的张成空间损失,这些公式使得原本不适定的特征向量回归任务变得可行且稳定。 ## 2. 相关工作 ### 2.1. LBO特征求解器 经典的LBO特征分解依赖于大规模GEVP的稀疏特征求解器。Krylov子空间算法,如ARPACK中的隐式重启Lanczos方法 (Lehoucq et al.,1998 (https://arxiv.org/html/2605.24390#bib.bib19)),以及块方法如LOBPCG (Knyazev,2001 (https://arxiv.org/html/2605.24390#bib.bib17)),因其鲁棒性和准确性而被广泛采用。在实践中,它们的性能可以通过预处理和移位-反演方案得到显著提升,尤其是在需要高精度低频模态时。为了提高效率,几何近似方法 (Nasikun et al.,2018 (https://arxiv.org/html/2605.24390#bib.bib32)) 构建显式子空间,但通常依赖于网格连通性。尽管如此,经典的稀疏特征求解器和这些近似方案仍然是逐实例的:它们独立地求解每个GEVP,无法利用形状集合中的统计模式来摊销推理。 物理信息机器学习的最新进展提供了基于优化的替代方案。物理信息神经网络(PINNs)(Raissi et al.,2019 (https://arxiv.org/html/2605.24390#bib.bib39)) 和变分方法如Deep Ritz (Yu et al.,2018 (https://arxiv.org/html/2605.24390#bib.bib52); Ben-Shaul et al.,2023 (https://arxiv.org/html/2605.24390#bib.bib5)) 优化连续目标以恢复特征函数。最近的工作进一步将这些思想扩展到参数化的几何族,并研究频谱如何在形状空间上变化 (Chang et al.,2024 (https://arxiv.org/html/2605.24390#bib.bib9))。虽然当需要对几何可微分时这些方法很有吸引力,但它们通常仍然需要为每个新实例求解一个优化问题。相比之下,我们目标是单次预测低频不变子空间,并可通过一个小的投影求解进行可选精化。 ### 2.2. 神经算子 神经算子学习函数空间之间的映射 (Kovachki et al.,2023 (https://arxiv.org/html/2605.24390#bib.bib18)),提供了一种与分辨率无关的范式,非常适合几何谱问题——其中形状和特征函数被表示为点采样场。开创性工作如DeepONet (Lu et al.,2021 (https://arxiv.org/html/2605.24390#bib.bib28)) 和傅里叶神经算子(FNO)(Li et al.,2020a (https://arxiv.org/html/2605.24390#bib.bib23)) 已在规则网格上证明了其有效性。对于不规则几何,基于图的方法 (Li et al.,2020b (https://arxiv.org/html/2605.24390#bib.bib24); Pfaff et al.,2020 (https://arxiv.org/html/2605.24390#bib.bib36)) 提供局部消息传递,但将其扩展到捕获密集点集上的长程相关性通常需要深层堆叠或全局机制 (Alon and Yahav,2020 (https://arxiv.org/html/2605.24390#bib.bib2))。为了实现更高效的全局交互,诸如Transolver (Wu et al.,2024 (https://arxiv.org/html/2605.24390#bib.bib49)) 和LinearNO (Hu et al.,2025 (https://arxiv.org/html/2605.24390#bib.bib14)) 等方法通过注意力机制将信息路由到一小套潜在标记上,从而在输入点数量上实现近线性缩放。NEO采用了这一可扩展范式,并通过引入质量感知聚合对其进行适配。该设计类似于为形状对应引入的曲面注意力 (Trappolini et al.,2021 (https://arxiv.org/html/2605.24390#bib.bib46))。相比之下,NEO将质量信息注入注意力分数,以在神经算子设置中获得分辨率不变的积分近似。与此同时,Li et al. (2025 (https://arxiv.org/html/2605.24390#bib.bib22)) 通过学习不变子空间来求解参数化非自伴特征值问题。虽然他们的方法侧重于固定离散化下随物理参数变化的谱分析,但我们的工作强调跨形状的几何变异性,并采用质量感知机制在原始点云上保持分辨率不变性。 ### 2.3. 谱几何与几何学习 谱方法为几何处理和形状分析提供了内在表示,植根于流形学习和谱形状分析 (Belkin and Niyogi,2003 (https://arxiv.org/html/2605.24390#bib.bib4); Coifman and Lafon,2006 (https://arxiv.org/html/2605.24390#bib.bib10); Reuter et al.,2006 (https://arxiv.org/html/2605.24390#bib.bib41))。低频LBO特征函数支撑着广泛使用的描述子和基,包括HKS/WKS (Sun et al.,2009 (https://arxiv.org/html/2605.24390#bib.bib45); Aubry et al.,2011 (https://arxiv.org/html/2605.24390#bib.bib3)) 以及通过函数映射及其精化进行对应的谱基 (Ovsjanikov et al.,2012 (https://arxiv.org/html/2605.24390#bib.bib33); Melzi et al.,2019 (https://arxiv.org/html/2605.24390#bib.bib30); Ren et al.,2018 (https://arxiv.org/html/2605.24390#bib.bib40))。在几何学习中,谱构造同样影响了模型设计,从早期的谱卷积 (Bruna et al.,2013 (https://arxiv.org/html/2605.24390#bib.bib7); Yi et al.,2016 (https://arxiv.org/html/2605.24390#bib.bib51)) 到最近使用低频特征向量在曲面上进行特征传播的架构 (Sharp et al.,2022 (https://arxiv.org/html/2605.24390#bib.bib42); Smirnov and Solomon,2021 (https://arxiv.org/html/2605.24390#bib.bib44))。在大多数此类流程中,特征对被假定为预先计算的。神经拉普拉斯算子 (Pang et al.,2024 (https://arxiv.org/html/2605.24390#bib.bib34)) 直接从点云预测高质量离散拉普拉斯算子,使得通过标准特征求解器进行下游计算成为可能。NeuralSound (Jin et al.,2022 (https://arxiv.org/html/2605.24390#bib.bib15)) 类似地使用子空间学习,但专为体素离散化上的快速模态声音合成而设计。相比之下,NEO直接预测
相似文章
UFO: 一种无需域统一的操作符框架,用于通用操作符学习
介绍UFO,一种跨域神经操作符框架,能自适应地学习不同表示域上的操作符,实现与离散化解耦的预测,对分布偏移具有鲁棒性。
通过监督投影流形学习的李群嵌入神经动力学规划
本文提出了一种李群嵌入动态神经网络(LieEDNN)及其基于梯度下降和光滑流形度量投影的学习算法,能够在SO(3)和SE(3)等李群上实现稳定动力学,用于机器人学和控制应用。
基于霍奇分解的拓扑保持神经算子学习
本文提出了一种基于霍奇分解的拓扑保持神经算子学习方法,用于分离拓扑和几何分量,在几何网格上提高了准确性和效率。
神经算子的共形预测:物理模拟中的无分布不确定性量化
提出了将分裂共形预测首次应用于基于神经算子的物理模拟,提供了具有有限样本覆盖保证的无分布预测区间,并利用MC Dropout不确定性生成自适应宽度的区间。
AeroJEPA:学习用于可扩展3D气动场建模的语义潜在表示
本文介绍了AeroJEPA,一种用于可扩展3D气动场建模的联合嵌入预测架构。它通过预测流场的语义潜在表示,解决了当前代理模型在可扩展性和设计实用性方面的局限性,从而实现了高效的高保真分析和设计优化。