object-detection

#object-detection

@VincentLogic: 英伟达开源了一个视觉定位模型：LocateAnything-3B 几十个小黄人密密麻麻堆在一起它一个不漏，全部框出来了这背后的技术变化比"更准"这两个字值得多说一句

X AI KOLs Timeline ↗ · 4天前缓存

英伟达开源了视觉定位模型 LocateAnything-3B，能够在密集场景中精准检测并框出所有目标对象。

0 人收藏 0 人点赞

#object-detection

@pattssun: @nyknicks 的夺冠激励我打造了一个 AI 篮球教练来提升我的 1v1 技术。使用技术：- Robloflow R…

X AI KOLs Following ↗ · 6天前缓存

一位开发者利用 Roboflow RF-DETR 进行检测、MediaPipe 捕捉身体角度、OpenCV 进行分析和标注，构建了一个 AI 篮球教练。

0 人收藏 0 人点赞

#object-detection

YOLO26 简介

Hacker News Top ↗ · 2026-06-23 缓存

YOLO26 是一个于2026年1月发布的多任务计算机视觉模型系列，具备无需 Non-Maximum Suppression 的端到端检测功能以降低延迟，并针对边缘部署进行了优化，具有改进的CPU推理能力和紧凑设计。

0 人收藏 0 人点赞

#object-detection

@DataChaz：@NVIDIA 刚刚发布了 LocateAnything，通过修复一个核心瓶颈使物体检测速度提升约10倍：模型如何…

X AI KOLs Following ↗ · 2026-06-17 缓存

NVIDIA发布了LocateAnything，这是一个开源模型，通过同时预测所有坐标而非顺序预测，实现了约10倍的物体检测速度提升，在单块H100上达到12.7 FPS，并超越了320亿参数模型。

0 人收藏 0 人点赞

#object-detection

Ultralytics YOLO26：统一的实时端到端视觉模型

Hugging Face Daily Papers ↗ · 2026-06-02 缓存

Ultralytics YOLO26 引入了一个统一的实时视觉模型家族，具有无需NMS的推理、改进的训练策略以及用于检测、分割和姿态估计的多任务能力，实现了最先进的精度与延迟权衡。

0 人收藏 0 人点赞

#object-detection

@ZhidingYu：感谢 NVIDIA！我将在 #CVPR2026 上于 NVIDIA 展台展示 LocateAnything：6月5日 MDT 下午4:20-4:40（周五…

X AI KOLs Following ↗ · 2026-05-28 缓存

NVIDIA 推出了 LocateAnything，这是一个统一的生成式定位与检测框架，采用并行框解码（Parallel Box Decoding）来提升解码吞吐量和定位精度。该工作将在 CVPR 2026 上进行展示。

0 人收藏 0 人点赞

#object-detection

LocateAnything: 快速高质量的视觉-语言定位与并行框解码

Hugging Face Daily Papers ↗ · 2026-05-26 缓存

LocateAnything 提出并行框解码用于统一视觉定位与目标检测，将几何元素解码为原子单元，以提高吞吐量和定位精度，并得到包含1.38亿样本的大规模数据集的支持。

0 人收藏 0 人点赞

#object-detection

@Phoenixyin13: 在目标检测界，一直有两个门派： YOLO 派，传统豪强，走的是天下武功，唯快不破的路线。速度极快，是工业界、无人机、监控摄像头的绝对霸主。 Transformer 派，学院派贵族，脑子聪明精度极高，但由于算力消耗太大，过去像个林黛玉，在需…

X AI KOLs Timeline ↗ · 2026-05-24 缓存

ICLR2026上提出的RF-DETR模型结合了Transformer的高精度和实时性，在100个真实场景中取得高分，并提供从Nano到2XL的多种规模，有望替代YOLO在实时检测领域的地位。

0 人收藏 0 人点赞

#object-detection

@tenderizzation：这简直超出了预期！YOLOv3 回归

X AI KOLs Following ↗ · 2026-05-09 缓存

这条社交媒体帖子表达了对 YOLOv3 目标检测模型回归或重新受到关注的兴奋之情。

0 人收藏 0 人点赞

#object-detection

/yolo

Reddit r/LocalLLaMA ↗ · 2026-04-21

关于YOLO这一广泛使用的实时目标检测模型系列的文章。

0 人收藏 0 人点赞

#object-detection

@ycombinator：LLM 在人机协同场景中表现出色，却在确定性开发者任务上屡屡翻车。@interfaze_ai 推出的新 AI…

X AI KOLs Following ↗ · 2026-04-20 缓存

Interfaze AI 发布专用模型，在 OCR、目标检测、网页抓取、语音转文字、分类等确定性开发者任务上全面超越通用 LLM。

0 人收藏 0 人点赞

#object-detection

如何获得一个好的目标检测模型？[P]

Reddit r/MachineLearning ↗ · 2026-04-20

一位用户希望获得关于改进其YOLO11n目标检测模型的建议，计划将其部署在Raspberry Pi 5上，但困扰于理论mAP50指标与实际检测性能之间的差距。

0 人收藏 0 人点赞

#object-detection

SAM 3.1：通过多路复用和全局推理实现更快、更易用的实时视频检测与跟踪

Meta AI Blog ↗ · 2026-03-26

Meta AI 发布了 SAM 3.1，这是 Segment Anything Model（分割一切模型）的一次更新，通过引入多路复用和全局推理能力，增强了实时视频检测与跟踪性能。

0 人收藏 0 人点赞

#object-detection

生成式AI赋能穿透障碍物的无线视觉系统

MIT News — Artificial Intelligence ↗ · 2026-03-19 缓存

MIT研究人员开发了一种由生成式AI增强的无线视觉系统，该系统利用毫米波信号重建隐藏物体及完整房间场景，突破了以往在形状重建方面的局限性，为仓储机器人与智能家居应用带来了新的可能性。

0 人收藏 0 人点赞

#object-detection

在树莓派上使用Hailo进行物体检测的Frigate设置

Jeff Geerling ↗ · 2026-02-18 缓存

这篇博客文章详细介绍了如何在树莓派上使用Hailo AI协处理器设置Frigate进行物体检测，包括修复PCIe描述符页面大小错误的步骤。该设置可与更便宜的Hailo-8L配合使用，并实现低推理时间。

0 人收藏 0 人点赞

#object-detection

SAM 3: Segment Anything with Concepts

Papers with Code Trending ↗ · 2025-11-20 缓存

SAM 3 引入了一个统一的模型，用于基于提示的概念分割与跟踪，通过解耦的识别与定位架构以及可扩展的数据引擎，实现了最先进的性能。

0 人收藏 0 人点赞

#object-detection

RF-DETR：面向实时检测Transformer的神经架构搜索

Papers with Code Trending ↗ · 2025-11-12 缓存

RF-DETR提出了一种轻量级检测Transformer，通过权重共享神经架构搜索实现最先进的实时目标检测，在COCO和Roboflow100-VL上优于先前方法，同时运行速度快达20倍。

0 人收藏 0 人点赞

#object-detection

blakeblackshear/frigate

GitHub Trending (daily) ↗ · 2026-05-24 缓存

Frigate 是一个为 Home Assistant 设计的开源 NVR，通过 OpenCV 和 TensorFlow 在本地对 IP 摄像头进行实时 AI 物体检测。它具有与 Home Assistant 紧密集成、基于运动的检测以及高效资源利用的特点。

0 人收藏 0 人点赞

#object-detection

adirik/grounding-dino

Replicate Explore ↗ · 2026-05-08 缓存

Grounding DINO 是一个开放词汇的目标检测模型，能够根据文本描述检测任意对象，现已在 Replicate 上可用。

0 人收藏 0 人点赞

object-detection

提交意见反馈