低准确率(约50%)的SSL(BYOL/MAE/VICReg)在高光谱作物胁迫数据上——我遗漏了什么?[R]

Reddit r/MachineLearning 新闻

摘要

一位研究者分享其在白菜氮缺乏检测中,使用SSL方法(BYOL、MAE、VICReg)进行高光谱作物胁迫分类时仅获得约50%准确率的困境,寻求关于更适合光谱数据的SSL技术、特征工程和模型架构的建议。

我正在研究一个用于氮缺乏检测的白菜高光谱数据集。数据集包含3个类别:健康、轻度氮胁迫、重度氮胁迫。我尝试使用自监督学习(SSL)进行表示学习,然后进行微调以进行分类。 **已尝试的方法:** - 尝试了多种SSL方法:BYOL、MAE、VICReg - 使用了数据增强(光谱噪声、掩码、缩放等) - 用分类头进行微调 - 使用准确率和F1分数进行评估 **问题:** 无论我怎么尝试,性能都卡在: - 准确率:约45–50% - F1分数:也很低(约0.5) 这几乎不比随机好多少(因为3个类别 ≈ 33%)。 **我的设置:** - 高光谱数据(数百个波段) - 1D/基于块的模型(ViT风格) - SSL预训练 → 微调流程 - 也尝试了k-NN和线性探针(效果仍然很差) **我怀疑的原因:** - 类别之间可能光谱上不太可分 - SSL方法是为RGB设计的,可能不适应 - 数据增强可能反而有害 - 模型没有捕获光谱特有的模式 **我寻求的建议:** 非常希望能得到以下方面的建议: **更好的SSL方法用于高光谱数据** - VICReg真的是这里的最佳选择吗? - 我应该尝试掩码光谱建模吗? **特征工程** - 我应该加入植被指数(NDVI等)吗? - 训练前进行PCA? **模型架构** - 1D CNN vs ViT vs 混合模型? - 是否有经过验证的高光谱专用架构? **评估** - 验证SSL表示的最佳方法? - 有什么技巧能提高线性探针结果吗? **一般建议** - 有人做过植物胁迫/高光谱分类吗?常见做法
查看原文

相似文章

如何获得一个好的目标检测模型?[P]

Reddit r/MachineLearning

一位用户希望获得关于改进其YOLO11n目标检测模型的建议,计划将其部署在Raspberry Pi 5上,但困扰于理论mAP50指标与实际检测性能之间的差距。

EdgeDetect:用于联邦入侵检测的重要性感知梯度压缩与同态聚合

Hugging Face Daily Papers

# 论文页面 - EdgeDetect:用于联邦入侵检测的重要性感知梯度压缩与同态聚合 来源:[https://huggingface.co/papers/2604.14663](https://huggingface.co/papers/2604.14663) ## [https://huggingface.co/papers/2604.14663#edgedetect-importance-aware-gradient-compression-with-homomorphic-aggregation-for-federated-intrusion-detection](https://huggingface.co/papers/2604.14663#edgedetect-importance-aware-gradient-compression-fo