基于实例分割的像素级路面病害评估

Hugging Face Daily Papers 论文

摘要

本文介绍了一种基于视觉的路面病害分析系统,该系统采用Mask R-CNN实例分割方法,在自定义数据集上实现了高精度和高召回率的裂缝检测与量化。

自动化路面病害评估不仅需要图像级分类或粗略的边界框检测,还需要对细长、分叉和不规则裂缝进行精确定位,以实现维护所需量化的几何精度。本文提出了一种基于Mask R-CNN实例分割的视觉路面病害分析系统,并在UWGB-StreetCrack(一个通过车载智能手机采集并手动标注了纵向裂缝、横向裂缝、龟裂和坑洞的多边形标签的自定义现场道路图像数据集)上进行了评估。在一致的微调协议下,考虑了五种基于Detectron2的Mask R-CNN骨干网络变体。性能最佳的模型(采用ResNet-101 FPN骨干网络的Mask R-CNN)在项目特定的边界框匹配协议下,达到了84.23%的精确率、90.04%的召回率和87.04%的F1分数。同一模型生成的聚合预测裂缝面积比为2.164%,与真实裂缝面积比2.170%非常接近。为了将分割系统与以检测器为导向的替代方案进行对比,我们还基于CSPDarknet53的YOLO检测器进行了适配和重新训练,在验证协议下达到了27.5%的精确率和20.7%的召回率。结果表明,实例分割是现场路面图像和聚合裂缝面积估计的一个实用方向,同时也揭示了标注一致性、类别不平衡、混淆因素抑制和掩码级基准测试等方面的开放挑战。
查看原文
查看缓存全文

缓存时间: 2026/05/26 06:42

论文页面 - 基于实例分割的像素级路面病害评估

来源: https://huggingface.co/papers/2605.26095

摘要

一种基于视觉的路面病害分析系统,采用 Mask R-CNN 实例分割技术,在裂缝检测与量化方面展现出优于目标检测方法的性能,在自定义的实地采集数据集上实现了高精度与高召回率。

自动化路面病害评估不仅需要图像级分类或粗糙的边界框检测,更需要精确定位细长、分叉且不规则的裂缝,以达到养护量化所需的几何精度。本文提出了一种基于 Mask R-CNN (https://huggingface.co/papers?q=Mask%20R-CNN) 实例分割 (https://huggingface.co/papers?q=instance%20segmentation) 的视觉路面病害分析系统,并在 UWGB-StreetCrack(一个使用车载智能手机采集、经人工多边形标注 (https://huggingface.co/papers?q=polygon%20labels) 的路面图像数据集,涵盖纵向裂缝、横向裂缝、鳄鱼纹裂缝和坑槽)上进行评估。在一致的微调协议下,考虑了五种基于 Detectron2 (https://huggingface.co/papers?q=Detectron2) 的 Mask R-CNN (https://huggingface.co/papers?q=Mask%20R-CNN) 骨干网络变体。性能最佳的模型——使用 ResNet-101 FPN (https://huggingface.co/papers?q=ResNet-101%20FPN) 骨干网络的 Mask R-CNN (https://huggingface.co/papers?q=Mask%20R-CNN)——在项目特定的边界框匹配协议 (https://huggingface.co/papers?q=bounding-box%20matching%20protocol) 下,达到了 84.23% 的精度、90.04% 的召回率和 87.04% 的 F1 分数 (https://huggingface.co/papers?q=F1%20score)。该模型预测的累计裂缝面积分数 (https://huggingface.co/papers?q=crack-area%20fraction) 为 2.164%,与真实裂缝面积分数 (https://huggingface.co/papers?q=crack-area%20fraction) 的 2.170% 高度吻合。为了将本分割系统与面向检测器的替代方案进行对比,还基于 CSPDarknet53 (https://huggingface.co/papers?q=CSPDarknet53) 的 YOLO (https://huggingface.co/papers?q=YOLO) 检测器进行了适配并在同一数据集上重新训练,其在验证协议下精度为 27.5%,召回率为 20.7%。结果表明,实例分割 (https://huggingface.co/papers?q=instance%20segmentation) 是面向实地路面图像及累计裂缝面积估计的一个实用方向,同时也揭示了标注一致性、类别不平衡、混淆物排除以及掩码级基准测试方面的开放挑战。

查看 arXiv 页面 (https://arxiv.org/abs/2605.26095) 查看 PDF (https://arxiv.org/pdf/2605.26095) 添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2605.26095)

在你的 Agent 中获取此论文:

hf papers read 2605\.26095

没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash

引用此论文的模型0

没有模型关联此论文

请在模型 README.md 中引用 arxiv.org/abs/2605.26095 以在此页面建立链接。

引用此论文的数据集0

没有数据集关联此论文

请在数据集 README.md 中引用 arxiv.org/abs/2605.26095 以在此页面建立链接。

引用此论文的 Space0

没有 Space 关联此论文

请在 Space README.md 中引用 arxiv.org/abs/2605.26095 以在此页面建立链接。

包含此论文的收藏集0

没有收藏集包含此论文

请将此论文添加到收藏集 (https://huggingface.co/new-collection) 中以在此页面建立链接。

相似文章

面向停车位占用识别的自监督方法

Hugging Face Daily Papers

本文提出了一种用于停车位占用识别的自监督迁移学习方法,采用包含 SimCLR 和 ResNet-50 的两阶段训练策略,在仅需极少标注数据的情况下实现了高准确率(最高达 97.8%)。