我们很高兴开源 LIDARLearn [R] [D] [P]

Reddit r/MachineLearning 工具

摘要

LIDARLearn 是一个开源 PyTorch 库,用于 3D 点云深度学习,统一了 56 个预配置模型,内置交叉验证和自动生成出版级 LaTeX 报告的功能。该框架支持有监督学习、自监督学习和参数高效微调方法,适用于 ModelNet40、ShapeNet 和遥感基准等数据集。

这是一个统一的 PyTorch 库,用于 3D 点云深度学习。据我们所知,它是第一个在一个地方支持如此大量模型集合的框架,并内置交叉验证支持。它汇集了 56 个开箱即用的配置,涵盖有监督学习、自监督学习和参数高效微调方法。你可以通过一个简单命令从单个 YAML 文件运行所有内容。最棒的功能之一是:训练后,你可以自动生成出版级的 LaTeX PDF。它创建清晰的表格,突出显示最佳结果,并为你运行统计测试和图表。无需在 Overleaf 中手动构建表格。该库包括 ModelNet40、ShapeNet、S3DIS 和两个遥感数据集(STPCTLS 和 HELIALS)上的基准测试。STPCTLS 已经预处理,你可以直接使用。该项目面向 3D 点云学习、3D 计算机视觉和遥感领域的研究人员。论文 📄:[https://arxiv.org/abs/2604.10780](https://arxiv.org/abs/2604.10780) 它采用 MIT 许可证发布。欢迎贡献和基准测试!GitHub 💻:[https://github.com/said-ohamouddou/LIDARLearn](https://github.com/said-ohamouddou/LIDARLearn)
查看原文

相似文章

robbyant/lingbot-map

Hugging Face Models Trending

LingBot-Map 是一个前馈式 3D 基础模型,用于流式 3D 重建,采用几何上下文转换器架构,在超过 10,000 帧的长序列上实现最先进的性能,并具有高效的 ~20 FPS 推理速度。

刚刚开源 FastVLA

Reddit r/LocalLLaMA

FastVLA,一款开源视觉-语言-动作模型,现可在 L4 GPU 上实现 5 Hz 机器人控制。