TideGS:通过外存优化实现超过十亿3D高斯泼溅原语的可扩展训练
摘要
TideGS提出了一种外存训练框架,通过块虚拟化、异步流水线和差分流式传输技术,在SSD-CPU-GPU层级管理参数,使得在单个GPU上能够以超过十亿原语进行3D高斯泼溅训练。
查看缓存全文
缓存时间: 2026/05/20 10:37
论文页面 - TideGS:通过外核优化实现超十亿3D高斯泼溅基元的可扩展训练
来源:https://huggingface.co/papers/2605.20150
摘要
TideGS 通过块虚拟化、异步流水线和差分流技术,在 SSD-CPU-GPU 层级间管理参数,从而在单张 GPU 上实现超过十亿基元的 3D 高斯泼溅训练。
十亿基元规模的 3D 高斯泼溅 (https://huggingface.co/papers?q=3D%20Gaussian%20Splatting) (3DGS) 训练从根本上受限于内存:每个高斯基元携带大量属性向量,聚合参数表迅速超出 GPU 容量,导致现有系统在消费级单 GPU 硬件上仅限于数千万高斯基元。我们观察到,3DGS 训练本质上是稀疏且轨迹条件化的:每次迭代仅激活当前相机批次可见的高斯基元,因此 GPU 内存可以作为工作集缓存 (https://huggingface.co/papers?q=working-set%20cache) 而非持久参数存储。基于这一洞察,我们提出了 TideGS,一种外核训练 (https://huggingface.co/papers?q=out-of-core%20training) 框架,通过三种协同技术跨 SSD-CPU-GPU 层级 (https://huggingface.co/papers?q=SSD-CPU-GPU%20hierarchy) 管理参数:适用于 SSD 对齐空间局部性的块虚拟化几何 (https://huggingface.co/papers?q=block-virtualized%20geometry)、用于重叠 I/O 与计算的分层异步流水线 (https://huggingface.co/papers?q=hierarchical%20asynchronous%20pipeline),以及仅传输迭代间增量工作集差分的轨迹自适应差分流 (https://huggingface.co/papers?q=trajectory-adaptive%20differential%20streaming)。实验表明,TideGS 能够在单张 24 GB GPU 上训练超过十亿高斯基元,同时在大型场景中达到所有评估的单 GPU 基线中最佳的重建质量,其规模超越了此前的外核基线(例如约 1 亿高斯基元)和标准内存内训练(例如约 1100 万高斯基元)。
查看 arXiv 页面 (https://arxiv.org/abs/2605.20150) 查看 PDF (https://arxiv.org/pdf/2605.20150) 项目页面 (https://sponge-lab.github.io/TideGS/) GitHub12 (https://github.com/sponge-lab/TideGS) 加入收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.20150)
在您的 agent 中获取该论文:
hf papers read 2605.20150
没有最新的 CLI?curl -LsSf https://hf.co/cli/install.sh | bash
引用该论文的模型0
无模型链接此论文
在模型 README.md 中引用 arxiv.org/abs/2605.20150 以从此页面链接。
引用该论文的数据集0
无数据集链接此论文
在数据集 README.md 中引用 arxiv.org/abs/2605.20150 以从此页面链接。
引用该论文的 Space0
无 Space 链接此论文
在 Space README.md 中引用 arxiv.org/abs/2605.20150 以从此页面链接。
包含该论文的收藏集0
无收藏集包含此论文
将该论文添加到收藏集 (https://huggingface.co/new-collection) 以从此页面链接。
相似文章
高斯点溅射
研究人员提出了高斯点溅射(Gaussian Point Splatting),这是一种随机渲染方法,利用像素大小的不透明点和64位GPU原子操作,能够实时渲染数亿个高斯点。该方法已被SIGGRAPH 2026接收,采用层次化剔除与并行编程原语,实现均匀的工作负载分配,与原始高斯溅射相比仅存在轻微的噪声差异。
GlobalSplat: 通过全局场景标记实现高效的前馈式三维高斯散射
GlobalSplat 引入了一种高效的前馈框架,用于三维高斯散射,通过全局场景标记实现紧凑且一致的场景重建,将计算开销和推理时间降低至78毫秒以下。该方法采用从粗到细的训练策略,防止表示膨胀,同时以显著更少的高斯原语(16K)达到有竞争力的新视角合成性能,与密集基线相比更为高效。
ZipSplat:更少的高斯,更优的 Splats
ZipSplat 是一种基于 token 的前馈 3D 高斯溅射模型,利用 k-means 聚类将高斯放置与像素网格解耦,在无需真实位姿或内参的情况下,在 DL3DV 和 RealEstate10K 上实现了约 6 倍的高斯减少,同时设立了新的最佳结果。
周末掌握3D Gaussian Splatting
一篇使用C++和OpenGL从零构建简化版3D Gaussian Splatting渲染器的教程,涵盖加载和渲染Gaussian splats。
SplatWeaver:学习分配高斯基元以实现可泛化新视角合成
SplatWeaver 是一种前馈新视角合成框架,它根据空间复杂度动态分配 3D 高斯基元,相比固定分配方法提升了渲染质量与效率。该框架利用基数高斯专家和高频先验引导的像素级路由方案,自适应地在复杂与平滑的场景区域间分配基元。