以数据为中心的调试：面向训练神经网络的团队 [P]

Reddit r/MachineLearning 2026/06/21 17:47 工具

data-centric debugging pytorch computer-vision open-source training

摘要

WeightsLab 是一个开源、PyTorch 原生的工具，允许团队在训练过程中暂停、检查实时损失信号，并在数据问题（如标签错误和类别不平衡）影响模型性能之前发现它们。它专为处理图像、视频和 LiDAR 点云的计算机视觉工程师而设计。

我们刚刚对 WeightsLab 进行了重大改进，并想在此分享。如果你曾经花数小时调试训练过程，最终却发现一直是数据问题，那么这个工具就是为你准备的。WeightsLab 允许你在运行中暂停训练，检查实时损失信号，并在标签错误、类别不平衡和异常值破坏你的模型之前捕获它们。开源、PyTorch 原生，专为处理图像、视频和 LiDAR 点云数据的计算机视觉工程师打造。非常希望听到社区的看法，以及它是否看起来有用，并帮助更多人找到它：[ https://github.com/GrayboxTech/weightslab]

查看原文

以数据为中心的调试：面向训练神经网络的团队 [P]

相似文章

我为 PyTorch 训练循环构建调试器所学到的东西，以及它如何改变我对故障诊断的思考 [D]

你存在于权重中吗？

Pyrecall 开源工具：检测 LLM 微调中的灾难性遗忘 [P]

我们很高兴开源 LIDARLearn [R] [D] [P]

权重归一化：加速深度神经网络训练的简单重参数化方法

提交意见反馈