TideGS:通过外存优化实现超过十亿3D高斯泼溅原语的可扩展训练

Hugging Face Daily Papers 论文

摘要

TideGS提出了一种外存训练框架,通过块虚拟化、异步流水线和差分流式传输技术,在SSD-CPU-GPU层级管理参数,使得在单个GPU上能够以超过十亿原语进行3D高斯泼溅训练。

在十亿原语规模下训练3D高斯泼溅(3DGS)本质上受限于内存:每个高斯原语携带一个大型属性向量,累积的参数表迅速超出GPU容量,导致此前系统在普通单GPU硬件上只能支持数千万个高斯原语。我们观察到,3DGS训练本质上是稀疏且轨迹相关的:每次迭代仅激活当前摄像机批次中可见的高斯原语,因此GPU内存可以作为工作集缓存而非持久参数存储。基于这一洞察,我们引入了TideGS,一种外存训练框架,通过三种协同技术管理SSD-CPU-GPU层级中的参数:面向SSD对齐空间局部性的块虚拟化几何、将I/O与计算重叠的分层异步流水线、以及仅在迭代间传输增量工作集变化的轨迹自适应差分流。实验表明,TideGS能够在单个24 GB GPU上训练超过十亿个高斯原语,同时在评估的大规模场景单GPU基线中实现最佳重建质量,超越了此前的外存基线(如约1亿高斯原语)和标准内存训练(如约1100万高斯原语)。
查看原文
查看缓存全文

缓存时间: 2026/05/20 10:37

论文页面 - TideGS:通过外核优化实现超十亿3D高斯泼溅基元的可扩展训练

来源:https://huggingface.co/papers/2605.20150

摘要

TideGS 通过块虚拟化、异步流水线和差分流技术,在 SSD-CPU-GPU 层级间管理参数,从而在单张 GPU 上实现超过十亿基元的 3D 高斯泼溅训练。

十亿基元规模的 3D 高斯泼溅 (https://huggingface.co/papers?q=3D%20Gaussian%20Splatting) (3DGS) 训练从根本上受限于内存:每个高斯基元携带大量属性向量,聚合参数表迅速超出 GPU 容量,导致现有系统在消费级单 GPU 硬件上仅限于数千万高斯基元。我们观察到,3DGS 训练本质上是稀疏且轨迹条件化的:每次迭代仅激活当前相机批次可见的高斯基元,因此 GPU 内存可以作为工作集缓存 (https://huggingface.co/papers?q=working-set%20cache) 而非持久参数存储。基于这一洞察,我们提出了 TideGS,一种外核训练 (https://huggingface.co/papers?q=out-of-core%20training) 框架,通过三种协同技术跨 SSD-CPU-GPU 层级 (https://huggingface.co/papers?q=SSD-CPU-GPU%20hierarchy) 管理参数:适用于 SSD 对齐空间局部性的块虚拟化几何 (https://huggingface.co/papers?q=block-virtualized%20geometry)、用于重叠 I/O 与计算的分层异步流水线 (https://huggingface.co/papers?q=hierarchical%20asynchronous%20pipeline),以及仅传输迭代间增量工作集差分的轨迹自适应差分流 (https://huggingface.co/papers?q=trajectory-adaptive%20differential%20streaming)。实验表明,TideGS 能够在单张 24 GB GPU 上训练超过十亿高斯基元,同时在大型场景中达到所有评估的单 GPU 基线中最佳的重建质量,其规模超越了此前的外核基线(例如约 1 亿高斯基元)和标准内存内训练(例如约 1100 万高斯基元)。

查看 arXiv 页面 (https://arxiv.org/abs/2605.20150) 查看 PDF (https://arxiv.org/pdf/2605.20150) 项目页面 (https://sponge-lab.github.io/TideGS/) GitHub12 (https://github.com/sponge-lab/TideGS) 加入收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.20150)

在您的 agent 中获取该论文:

hf papers read 2605.20150

没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash

引用该论文的模型0

无模型链接此论文

在模型 README.md 中引用 arxiv.org/abs/2605.20150 以从此页面链接。

引用该论文的数据集0

无数据集链接此论文

在数据集 README.md 中引用 arxiv.org/abs/2605.20150 以从此页面链接。

引用该论文的 Space0

无 Space 链接此论文

在 Space README.md 中引用 arxiv.org/abs/2605.20150 以从此页面链接。

包含该论文的收藏集0

无收藏集包含此论文

将该论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。

相似文章

高斯点溅射

Hacker News Top

研究人员提出了高斯点溅射(Gaussian Point Splatting),这是一种随机渲染方法,利用像素大小的不透明点和64位GPU原子操作,能够实时渲染数亿个高斯点。该方法已被SIGGRAPH 2026接收,采用层次化剔除与并行编程原语,实现均匀的工作负载分配,与原始高斯溅射相比仅存在轻微的噪声差异。

GlobalSplat: 通过全局场景标记实现高效的前馈式三维高斯散射

Hugging Face Daily Papers

GlobalSplat 引入了一种高效的前馈框架,用于三维高斯散射,通过全局场景标记实现紧凑且一致的场景重建,将计算开销和推理时间降低至78毫秒以下。该方法采用从粗到细的训练策略,防止表示膨胀,同时以显著更少的高斯原语(16K)达到有竞争力的新视角合成性能,与密集基线相比更为高效。

ZipSplat:更少的高斯,更优的 Splats

Hugging Face Daily Papers

ZipSplat 是一种基于 token 的前馈 3D 高斯溅射模型,利用 k-means 聚类将高斯放置与像素网格解耦,在无需真实位姿或内参的情况下,在 DL3DV 和 RealEstate10K 上实现了约 6 倍的高斯减少,同时设立了新的最佳结果。

周末掌握3D Gaussian Splatting

Hacker News Top

一篇使用C++和OpenGL从零构建简化版3D Gaussian Splatting渲染器的教程,涵盖加载和渲染Gaussian splats。

SplatWeaver:学习分配高斯基元以实现可泛化新视角合成

Hugging Face Daily Papers

SplatWeaver 是一种前馈新视角合成框架,它根据空间复杂度动态分配 3D 高斯基元,相比固定分配方法提升了渲染质量与效率。该框架利用基数高斯专家和高频先验引导的像素级路由方案,自适应地在复杂与平滑的场景区域间分配基元。