YOLO26 简介

Hacker News Top 2026/06/23 01:52 模型

yolo26 real-time-vision object-detection instance-segmentation pose-estimation edge-ai computer-vision

摘要

YOLO26 是一个于2026年1月发布的多任务计算机视觉模型系列，具备无需 Non-Maximum Suppression 的端到端检测功能以降低延迟，并针对边缘部署进行了优化，具有改进的CPU推理能力和紧凑设计。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/23 04:40

# YOLO26：面向实时视觉AI的YOLO模型 [2026] 来源: https://blog.roboflow.com/yolo26/ **YOLO26是一个端到端的物体检测与多任务模型系列，支持检测、实例分割、姿态估计、旋转目标检测和图像分类，提供从Nano到Extra Large五种尺寸变体。该模型于2026年1月发布，移除了非极大值抑制以降低延迟，并去掉了分布焦点损失模块，以提高与边缘和低功耗硬件的兼容性。本文介绍其架构、COCO基准测试结果、下载链接，以及与RF-DETR、LW-DETR和D-FINE等模型的对比。** YOLO模型 (https://blog.roboflow.com/guide-to-yolo-models/) 是一系列实时计算机视觉模型，旨在处理广泛的任务，包括物体检测 (https://blog.roboflow.com/object-detection/)、分割 (https://blog.roboflow.com/instance-segmentation/)、姿态估计 (https://blog.roboflow.com/pose-estimation-algorithms-history/)、分类 (https://blog.roboflow.com/image-classification/) 和旋转目标检测 (https://blog.roboflow.com/train-yolov8-obb-model/)。借助流行的架构，这些模型提供了出色的速度和精度，使其非常适合边缘设备、云API等多种应用场景。在这篇博客中，我们将深入探讨YOLO26 (https://github.com/ultralytics/ultralytics?ref=blog.roboflow.com)（2026年1月发布），揭示其关键改进、重要特性，以及与其他领先计算机视觉模型的对比。 💡 Roboflow支持YOLO26的标注、训练和部署，了解更多 (https://blog.roboflow.com/yolo26-in-roboflow/)。 ## 什么是YOLO26？ YOLO26是一个多任务模型系列，旨在处理广泛的计算机视觉任务，包括物体检测、实例分割、图像分类、姿态估计和旋转目标检测。该系列提供多种尺寸变体：Nano (N)、Small (S)、Medium (M)、Large (L) 和 Extra Large (X)，以满足不同的性能和部署需求。与之前的YOLO (https://blog.roboflow.com/guide-to-yolo-models/) 代际相比，YOLO26针对边缘部署进行了优化，具有更快的CPU推理速度、更紧凑的模型设计以及简化的架构，以提升在多种硬件环境中的兼容性。显著的改进包括：通过移除NMS降低延迟，以及在fp16和fp32下结果保持一致，使得模型能够以优化的低延迟方式运行，同时获得与训练时相同的高精度。 ⚡ RF-DETR神经架构搜索 (NAS) 比YOLO26更快、更准确。在此阅读相关博客文章 (https://blog.roboflow.com/train-with-neural-architecture-search/)。 ## 在图像上尝试YOLO26 查看YOLO26在COCO数据集 (https://universe.roboflow.com/microsoft/coco?ref=blog.roboflow.com) 中常见物体上的图像表现。在下方测试模型如何处理你的数据。 ## 下载YOLO26 下表提供YOLO26物体检测模型的下载链接，并概述Ultralytics报告的YOLO26模型系列性能基准，对比从nano到extra-large各变体的关键指标，如精度 (mAP)、延迟和计算成本。 | 模型尺寸 (像素) | mAPval 50-95 | CPU ONNX 速度 (ms) | T4 TensorRT10 速度 (ms) | 参数量 (M) | FLOPs (B) | |---|---|---|---|---|---| | YOLO26n (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26n.pt?ref=blog.roboflow.com) | 640 | 40.9 | 38.9 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 | | YOLO26s (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26s.pt?ref=blog.roboflow.com) | 640 | 48.6 | 87.2 ± 0.9 | 2.5 ± 0.0 | 9.5 | 20.7 | | YOLO26m (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26m.pt?ref=blog.roboflow.com) | 640 | 53.1 | 220.0 ± 1.4 | 4.7 ± 0.1 | 20.4 | 68.2 | | YOLO26l (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26l.pt?ref=blog.roboflow.com) | 640 | 55.0 | 286.2 ± 2.0 | 6.2 ± 0.2 | 24.8 | 86.4 | | YOLO26x (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26x.pt?ref=blog.roboflow.com) | 640 | 57.5 | 525.8 ± 4.0 | 11.8 ± 0.2 | 55.7 | 193.9 | 该对比突出了推理速度与检测精度之间的权衡，帮助你根据具体硬件约束选择最佳的模型尺寸。如需其他任务类型的模型，请访问YOLO26 Github (https://github.com/ultralytics/ultralytics?tab=readme-ov-file&ref=blog.roboflow.com#-models)。 ## YOLO26架构 YOLO26引入了多项重大改进，包括： - **更广泛的设备支持：** 移除了分布焦点损失 (DFL) 模块，简化了推理过程，支持多种导出格式 (TFLite (https://blog.roboflow.com/how-to-train-a-tensorflow-lite-object-detection-model/)、CoreML (https://blog.roboflow.com/what-is-coreml/)、OpenVINO (https://blog.roboflow.com/what-is-openvino/)、TensorRT (https://blog.roboflow.com/what-is-tensorrt/) 和 ONNX (https://blog.roboflow.com/what-is-onnx/))，并扩大了对边缘和低功耗设备的支持。 - **增强的小物体识别：** 采用ProgLoss和STAL损失函数，提高了检测精度，尤其对小物体，为物联网、机器人技术和航拍图像应用提供了显著优势。 - **端到端预测：** 消除了非极大值抑制 (NMS) (https://blog.roboflow.com/how-to-code-non-maximum-suppression-nms-in-plain-numpy/) 作为后处理步骤，直接生成预测结果，从而降低延迟，使在真实系统中的部署更快、更轻量、更可靠。 - **更快的CPU推理：** 模型设计和训练的优化使得YOLO26在CPU上的速度比YOLO11更快。例如，YOLO26-N变体比YOLO11-N的CPU推理速度快了高达43%，使得YOLO26非常适合在没有GPU的设备上实现实时性能。 - **改进的训练：** 引入了MuSGD优化器，这是一种融合了SGD (https://docs.pytorch.org/docs/stable/generated/torch.optim.SGD.html?ref=blog.roboflow.com) 和Muon (https://arxiv.org/abs/2502.16982?ref=blog.roboflow.com) 的混合优化器，灵感来自Kimi K2 (https://moonshotai.github.io/Kimi-K2/?ref=blog.roboflow.com) 大语言模型的突破，通过将大语言模型的优化进展迁移到计算机视觉，确保训练稳定且收敛更快。 ## YOLO26的替代方案除了YOLO26，目前还有其他几种多任务计算机视觉模型被广泛使用，并在物体检测排行榜 (https://leaderboard.roboflow.com/?ref=blog.roboflow.com) 上进行基准测试。 ### RF-DETR RF-DETR (https://roboflow.com/model/rf-detr?ref=blog.roboflow.com) 由Roboflow (https://roboflow.com/?ref=blog.roboflow.com) 开发，于2025年3月发布，是一个实时检测模型系列，支持分割、物体检测和分类任务。RF-DETR在各项基准上优于YOLO26，显示出更强的跨领域泛化能力。 RF-DETR体积小巧，可以使用Inference (https://inference.roboflow.com/?ref=blog.roboflow.com) 在边缘设备上运行，是需要在强精度和实时性能之间取得平衡的部署场景的理想模型。 ### LW-DETR 轻量级检测 Transformer (LW-DETR)，于2024年6月发布，是一种实时物体检测架构，结合了视觉 Transformer (ViT) (https://roboflow.com/model/vision-transformer?ref=blog.roboflow.com) 和DETR解码器 (https://roboflow.com/model/detr?ref=blog.roboflow.com) 的优势。该模型使用ViT将图像分割成更小的patch，并整合多级特征表示，以产生更准确、更鲁棒的预测。凭借这种设计，LW-DETR在精度和推理速度上都优于YOLO11。 ### D-FINE D-FINE (https://roboflow.com/model/d-fine?ref=blog.roboflow.com) 于2024年10月发布，是一种实时物体检测架构，引入了细粒度分布精炼 (FDR) 机制，通过迭代优化边界框的分布来获得更高的定位精度。这种精炼过程增强了模型检测小物体或重叠物体的能力，同时保留了导航和决策应用所必需的实时性能。 ### YOLO26论文 Ultralytics尚未发布，也暂无计划发布YOLO26的正式研究论文。来自康奈尔大学和堪萨斯州立大学的研究人员撰写了一篇YOLO26论文 (https://arxiv.org/abs/2509.25164?ref=blog.roboflow.com)，标题为：*YOLO26: Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection* 虽然这不是YOLO26创造者的官方论文，但它为理解该模型提供了有用的资源。 ## 结论 YOLO26是一个端到端、针对边缘优化的模型，支持五项核心计算机视觉任务：物体检测、实例分割、姿态估计、旋转目标检测 (OBB) 和图像分类。该框架为所有这些任务提供全面的功能，使用户能够无缝地对每个模型变体进行训练、验证、推理和导出。与YOLO11、RF-DETR (https://roboflow.com/model/rf-detr?ref=blog.roboflow.com)、LW-DETR和D-FINE等模型相比，YOLO26在参数利用效率和推理速度方面表现突出。移除分布焦点损失 (DFL) 模块进一步增强了与各种边缘和低功耗设备的兼容性。这些增强使得YOLO26非常适合边缘计算、机器人技术 (https://roboflow.com/industry/robotics?ref=blog.roboflow.com)、物联网应用以及其他计算资源有限的场景。了解更多关于YOLO (https://blog.roboflow.com/guide-to-yolo-models/) 模型的信息。

@Phoenixyin13: 在目标检测界，一直有两个门派： YOLO 派，传统豪强，走的是天下武功，唯快不破的路线。速度极快，是工业界、无人机、监控摄像头的绝对霸主。 Transformer 派，学院派贵族，脑子聪明精度极高，但由于算力消耗太大，过去像个林黛玉，在需…

X AI KOLs Timeline

ICLR2026上提出的RF-DETR模型结合了Transformer的高精度和实时性，在100个真实场景中取得高分，并提供从Nano到2XL的多种规模，有望替代YOLO在实时检测领域的地位。

如何获得一个好的目标检测模型？[P]

Reddit r/MachineLearning

一位用户希望获得关于改进其YOLO11n目标检测模型的建议，计划将其部署在Raspberry Pi 5上，但困扰于理论mAP50指标与实际检测性能之间的差距。

YOLO26 简介

相似文章

Ultralytics YOLO26：统一的实时端到端视觉模型

/yolo

@tenderizzation：这简直超出了预期！YOLOv3 回归

如何获得一个好的目标检测模型？[P]

提交意见反馈