YOLO26 简介

Hacker News Top 模型

摘要

YOLO26 是一个于2026年1月发布的多任务计算机视觉模型系列,具备无需 Non-Maximum Suppression 的端到端检测功能以降低延迟,并针对边缘部署进行了优化,具有改进的CPU推理能力和紧凑设计。

暂无内容
查看原文
查看缓存全文

缓存时间: 2026/06/23 04:40

# YOLO26:面向实时视觉AI的YOLO模型 [2026] 来源: https://blog.roboflow.com/yolo26/ **YOLO26是一个端到端的物体检测与多任务模型系列,支持检测、实例分割、姿态估计、旋转目标检测和图像分类,提供从Nano到Extra Large五种尺寸变体。该模型于2026年1月发布,移除了非极大值抑制以降低延迟,并去掉了分布焦点损失模块,以提高与边缘和低功耗硬件的兼容性。本文介绍其架构、COCO基准测试结果、下载链接,以及与RF-DETR、LW-DETR和D-FINE等模型的对比。** YOLO模型 (https://blog.roboflow.com/guide-to-yolo-models/) 是一系列实时计算机视觉模型,旨在处理广泛的任务,包括物体检测 (https://blog.roboflow.com/object-detection/)、分割 (https://blog.roboflow.com/instance-segmentation/)、姿态估计 (https://blog.roboflow.com/pose-estimation-algorithms-history/)、分类 (https://blog.roboflow.com/image-classification/) 和旋转目标检测 (https://blog.roboflow.com/train-yolov8-obb-model/)。 借助流行的架构,这些模型提供了出色的速度和精度,使其非常适合边缘设备、云API等多种应用场景。 在这篇博客中,我们将深入探讨YOLO26 (https://github.com/ultralytics/ultralytics?ref=blog.roboflow.com)(2026年1月发布),揭示其关键改进、重要特性,以及与其他领先计算机视觉模型的对比。 💡 Roboflow支持YOLO26的标注、训练和部署,了解更多 (https://blog.roboflow.com/yolo26-in-roboflow/)。 ## 什么是YOLO26? YOLO26是一个多任务模型系列,旨在处理广泛的计算机视觉任务,包括物体检测、实例分割、图像分类、姿态估计和旋转目标检测。该系列提供多种尺寸变体:Nano (N)、Small (S)、Medium (M)、Large (L) 和 Extra Large (X),以满足不同的性能和部署需求。 与之前的YOLO (https://blog.roboflow.com/guide-to-yolo-models/) 代际相比,YOLO26针对边缘部署进行了优化,具有更快的CPU推理速度、更紧凑的模型设计以及简化的架构,以提升在多种硬件环境中的兼容性。显著的改进包括:通过移除NMS降低延迟,以及在fp16和fp32下结果保持一致,使得模型能够以优化的低延迟方式运行,同时获得与训练时相同的高精度。 ⚡ RF-DETR神经架构搜索 (NAS) 比YOLO26更快、更准确。在此阅读相关博客文章 (https://blog.roboflow.com/train-with-neural-architecture-search/)。 ## 在图像上尝试YOLO26 查看YOLO26在COCO数据集 (https://universe.roboflow.com/microsoft/coco?ref=blog.roboflow.com) 中常见物体上的图像表现。在下方测试模型如何处理你的数据。 ## 下载YOLO26 下表提供YOLO26物体检测模型的下载链接,并概述Ultralytics报告的YOLO26模型系列性能基准,对比从nano到extra-large各变体的关键指标,如精度 (mAP)、延迟和计算成本。 | 模型尺寸 (像素) | mAPval 50-95 | CPU ONNX 速度 (ms) | T4 TensorRT10 速度 (ms) | 参数量 (M) | FLOPs (B) | |---|---|---|---|---|---| | YOLO26n (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26n.pt?ref=blog.roboflow.com) | 640 | 40.9 | 38.9 ± 0.7 | 1.7 ± 0.0 | 2.4 | 5.4 | | YOLO26s (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26s.pt?ref=blog.roboflow.com) | 640 | 48.6 | 87.2 ± 0.9 | 2.5 ± 0.0 | 9.5 | 20.7 | | YOLO26m (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26m.pt?ref=blog.roboflow.com) | 640 | 53.1 | 220.0 ± 1.4 | 4.7 ± 0.1 | 20.4 | 68.2 | | YOLO26l (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26l.pt?ref=blog.roboflow.com) | 640 | 55.0 | 286.2 ± 2.0 | 6.2 ± 0.2 | 24.8 | 86.4 | | YOLO26x (https://github.com/ultralytics/assets/releases/download/v8.4.0/yolo26x.pt?ref=blog.roboflow.com) | 640 | 57.5 | 525.8 ± 4.0 | 11.8 ± 0.2 | 55.7 | 193.9 | 该对比突出了推理速度与检测精度之间的权衡,帮助你根据具体硬件约束选择最佳的模型尺寸。如需其他任务类型的模型,请访问YOLO26 Github (https://github.com/ultralytics/ultralytics?tab=readme-ov-file&ref=blog.roboflow.com#-models)。 ## YOLO26架构 YOLO26引入了多项重大改进,包括: - **更广泛的设备支持:** 移除了分布焦点损失 (DFL) 模块,简化了推理过程,支持多种导出格式 (TFLite (https://blog.roboflow.com/how-to-train-a-tensorflow-lite-object-detection-model/)、CoreML (https://blog.roboflow.com/what-is-coreml/)、OpenVINO (https://blog.roboflow.com/what-is-openvino/)、TensorRT (https://blog.roboflow.com/what-is-tensorrt/) 和 ONNX (https://blog.roboflow.com/what-is-onnx/)),并扩大了对边缘和低功耗设备的支持。 - **增强的小物体识别:** 采用ProgLoss和STAL损失函数,提高了检测精度,尤其对小物体,为物联网、机器人技术和航拍图像应用提供了显著优势。 - **端到端预测:** 消除了非极大值抑制 (NMS) (https://blog.roboflow.com/how-to-code-non-maximum-suppression-nms-in-plain-numpy/) 作为后处理步骤,直接生成预测结果,从而降低延迟,使在真实系统中的部署更快、更轻量、更可靠。 - **更快的CPU推理:** 模型设计和训练的优化使得YOLO26在CPU上的速度比YOLO11更快。例如,YOLO26-N变体比YOLO11-N的CPU推理速度快了高达43%,使得YOLO26非常适合在没有GPU的设备上实现实时性能。 - **改进的训练:** 引入了MuSGD优化器,这是一种融合了SGD (https://docs.pytorch.org/docs/stable/generated/torch.optim.SGD.html?ref=blog.roboflow.com) 和Muon (https://arxiv.org/abs/2502.16982?ref=blog.roboflow.com) 的混合优化器,灵感来自Kimi K2 (https://moonshotai.github.io/Kimi-K2/?ref=blog.roboflow.com) 大语言模型的突破,通过将大语言模型的优化进展迁移到计算机视觉,确保训练稳定且收敛更快。 ## YOLO26的替代方案 除了YOLO26,目前还有其他几种多任务计算机视觉模型被广泛使用,并在物体检测排行榜 (https://leaderboard.roboflow.com/?ref=blog.roboflow.com) 上进行基准测试。 ### RF-DETR RF-DETR (https://roboflow.com/model/rf-detr?ref=blog.roboflow.com) 由Roboflow (https://roboflow.com/?ref=blog.roboflow.com) 开发,于2025年3月发布,是一个实时检测模型系列,支持分割、物体检测和分类任务。RF-DETR在各项基准上优于YOLO26,显示出更强的跨领域泛化能力。 RF-DETR体积小巧,可以使用Inference (https://inference.roboflow.com/?ref=blog.roboflow.com) 在边缘设备上运行,是需要在强精度和实时性能之间取得平衡的部署场景的理想模型。 ### LW-DETR 轻量级检测 Transformer (LW-DETR),于2024年6月发布,是一种实时物体检测架构,结合了视觉 Transformer (ViT) (https://roboflow.com/model/vision-transformer?ref=blog.roboflow.com) 和DETR解码器 (https://roboflow.com/model/detr?ref=blog.roboflow.com) 的优势。 该模型使用ViT将图像分割成更小的patch,并整合多级特征表示,以产生更准确、更鲁棒的预测。凭借这种设计,LW-DETR在精度和推理速度上都优于YOLO11。 ### D-FINE D-FINE (https://roboflow.com/model/d-fine?ref=blog.roboflow.com) 于2024年10月发布,是一种实时物体检测架构,引入了细粒度分布精炼 (FDR) 机制,通过迭代优化边界框的分布来获得更高的定位精度。 这种精炼过程增强了模型检测小物体或重叠物体的能力,同时保留了导航和决策应用所必需的实时性能。 ### YOLO26论文 Ultralytics尚未发布,也暂无计划发布YOLO26的正式研究论文。来自康奈尔大学和堪萨斯州立大学的研究人员撰写了一篇YOLO26论文 (https://arxiv.org/abs/2509.25164?ref=blog.roboflow.com),标题为:*YOLO26: Key Architectural Enhancements and Performance Benchmarking for Real-Time Object Detection* 虽然这不是YOLO26创造者的官方论文,但它为理解该模型提供了有用的资源。 ## 结论 YOLO26是一个端到端、针对边缘优化的模型,支持五项核心计算机视觉任务:物体检测、实例分割、姿态估计、旋转目标检测 (OBB) 和图像分类。该框架为所有这些任务提供全面的功能,使用户能够无缝地对每个模型变体进行训练、验证、推理和导出。 与YOLO11、RF-DETR (https://roboflow.com/model/rf-detr?ref=blog.roboflow.com)、LW-DETR和D-FINE等模型相比,YOLO26在参数利用效率和推理速度方面表现突出。移除分布焦点损失 (DFL) 模块进一步增强了与各种边缘和低功耗设备的兼容性。 这些增强使得YOLO26非常适合边缘计算、机器人技术 (https://roboflow.com/industry/robotics?ref=blog.roboflow.com)、物联网应用以及其他计算资源有限的场景。 了解更多关于YOLO (https://blog.roboflow.com/guide-to-yolo-models/) 模型的信息。

相似文章

Ultralytics YOLO26:统一的实时端到端视觉模型

Hugging Face Daily Papers

Ultralytics YOLO26 引入了一个统一的实时视觉模型家族,具有无需NMS的推理、改进的训练策略以及用于检测、分割和姿态估计的多任务能力,实现了最先进的精度与延迟权衡。

/yolo

Reddit r/LocalLLaMA

关于YOLO这一广泛使用的实时目标检测模型系列的文章。

@Phoenixyin13: 在目标检测界,一直有两个门派: YOLO 派,传统豪强,走的是天下武功,唯快不破的路线。速度极快,是工业界、无人机、监控摄像头的绝对霸主。 Transformer 派,学院派贵族,脑子聪明精度极高,但由于算力消耗太大,过去像个林黛玉,在需…

X AI KOLs Timeline

ICLR2026上提出的RF-DETR模型结合了Transformer的高精度和实时性,在100个真实场景中取得高分,并提供从Nano到2XL的多种规模,有望替代YOLO在实时检测领域的地位。

如何获得一个好的目标检测模型?[P]

Reddit r/MachineLearning

一位用户希望获得关于改进其YOLO11n目标检测模型的建议,计划将其部署在Raspberry Pi 5上,但困扰于理论mAP50指标与实际检测性能之间的差距。