computer-vision

#computer-vision

@AYi_AInotes: 分享一个计算机视觉开发者必藏神器，4 万星GitHub开源！不用自己写几百行画框跟踪代码，一行命令搞定所有可视化， Supervision，CV 界真正的瑞士军刀。它到底有多强？自动画框加标签，支持编号、自定义样式，视频对象永久…

X AI KOLs Timeline ↗ · 18小时前缓存

Supervision 是一个开源计算机视觉可视化工具，支持一行命令完成画框、跟踪、数据集格式转换、热力图等，被6500+项目使用，GitHub 4万星。

0 人收藏 0 人点赞

#computer-vision

@NielsRogge：所有15篇@CVPR 2026论文决赛入选作品现可在以下网址轻松浏览：https://paperswithcode.co/conferences/cvpr-2026/best-…

X AI KOLs Following ↗ · 2天前

包含所有15篇CVPR 2026论文决赛入选作品的完整列表现已在PapersWithCode上发布，提供GitHub仓库、Hugging Face模型工件和评估结果的链接。

0 人收藏 0 人点赞

#computer-vision

@skalskip92: supervision 刚刚达到了 40,000 个 GitHub 星标！现在它服务于超过 6.5k 个开源计算机视觉项目，包括所有 m…

X AI KOLs Following ↗ · 3天前缓存

supervision 库是一个重要的计算机视觉开源工具包，现已获得 40,000 个 GitHub 星标，并服务于超过 6,500 个计算机视觉项目。

0 人收藏 0 人点赞

#computer-vision

OpenCV 5 正式发布：计算机视觉多年来的最大飞跃

Hacker News Top ↗ · 3天前缓存

OpenCV 5 是计算机视觉库的重大版本更新，包含全新的 DNN 引擎、改进的 ONNX 支持、硬件加速以及更简洁的架构。对于从事经典视觉、深度学习及边缘部署的开发者而言，这标志着一次重要的现代化升级。

0 人收藏 0 人点赞

#computer-vision

视频外扩技术越来越出色

Reddit r/ArtificialInteligence ↗ · 3天前

视频外扩技术已显著提升，能够更好地将视频内容扩展到原始边界之外。

0 人收藏 0 人点赞

#computer-vision

@DanKornas：深入学习PyTorch的更好方式——跟随完整的YouTube课程系列，而非零散片段。……

X AI KOLs Timeline ↗ · 4天前缓存

一份精心策划的指南，通过完整的YouTube直播课程系列来学习使用PyTorch进行深度学习，内容涵盖从张量到生成对抗网络，共分为六个部分。

0 人收藏 0 人点赞

#computer-vision

我们是否低估了小型边缘AI模型？[D]

Reddit r/MachineLearning ↗ · 4天前

一位开发者认为，边缘AI社区忽视了那些可以在智能手机等设备上本地运行的小型专门模型，并以自建的离线摩尔斯电码识别功能为例。该项目使用了小于5MB的AI模型，基于TensorFlow/Keras和LiteRT，从数据生成到移动端集成的整个流程均为自建。

0 人收藏 0 人点赞

#computer-vision

AnchorWorld: 具身自我中心世界模拟与基于视角的演化定制

Hugging Face Daily Papers ↗ · 4天前缓存

AnchorWorld是一个用于自我中心世界模拟的框架，通过3D人体运动和锚点视角定义增强了交互完整性并实现了灵活的世界定制，性能优于最先进的基线。

0 人收藏 0 人点赞

#computer-vision

UniSHARP：通用锐利单目视图合成

Hugging Face Daily Papers ↗ · 4天前缓存

UniSHARP 将 SHARP 扩展到通用单目视图合成，适用于多种相机系统（透视、鱼眼、全向），通过在全方位潜在空间中对齐图像，并结合特征空间和高斯空间的联合对齐。该方法在一个新基准测试上优于其他替代方法。

0 人收藏 0 人点赞

#computer-vision

AI系统通过寻找严重男性不育症病例中罕见的可存活精子细胞，帮助实现首次临床妊娠

Reddit r/artificial ↗ · 5天前

一个AI辅助的微流控系统成功在严重男性不育症病例中仅识别出两个可存活的精子细胞，从而通过该技术实现了首次临床妊娠。虽然基于单一病例报告，但这代表了AI辅助生殖医学的一个重要里程碑。

0 人收藏 0 人点赞

#computer-vision

@drfeifei: https://x.com/drfeifei/status/2062247238143996275

X AI KOLs Timeline ↗ · 6天前缓存

Fei-Fei Li与World Labs团队提出了世界模型的功能分类法，区分了渲染器、物理引擎以及在强化学习循环中的其他组件，并论证空间智能是人工智能的下一个前沿。

0 人收藏 0 人点赞

#computer-vision

@svlevine: 今天（6月3日），我将在CVPR的Test-Time Scaling for Computer Vision WS（太平洋时间下午1:30）上发言，讨论我们如何…

X AI KOLs Following ↗ · 6天前缓存

Sergey Levine宣布他将在CVPR研讨会上就计算机视觉和机器人策略泛化的测试时缩放以及基础模型的部署发表演讲。

0 人收藏 0 人点赞

#computer-vision

NVIDIA研究解锁高级抓取、更智能的自动驾驶和大规模智能体训练

NVIDIA Blog ↗ · 6天前缓存

NVIDIA研究在CVPR上展示三篇论文：GraspGen-X（零样本抓取基础模型）、LCDrive（高效自动驾驶推理）和NitroGen（通用游戏AI基础模型），强调物理AI系统的大规模训练。

0 人收藏 0 人点赞

#computer-vision

Stateful Visual Encoders for Vision-Language Models

Hugging Face Daily Papers ↗ · 6天前缓存

本文介绍了一种用于视觉-语言模型的有状态视觉编码器，该编码器基于先前的特征来调节视觉表示，从而在多图像和智能体设置中实现更好的视觉比较。该方法在跨图像空间聚合、纵向放射学等任务上展现出一致的改进。

0 人收藏 0 人点赞

#computer-vision

我们已经到了无需卷尺的阶段。AI 通过你的相机即可测量。

Reddit r/artificial ↗ · 2026-06-02

AI 现在可以利用智能手机摄像头测量距离，许多任务不再需要物理卷尺。

0 人收藏 0 人点赞

#computer-vision

@NielsRogge：在此找到所有CVPR论文：

X AI KOLs Following ↗ · 2026-06-02 缓存

NielsRogge 发推文分享所有CVPR论文的链接。

0 人收藏 0 人点赞

#computer-vision

在PapersWithCode上浏览CVPR 2026论文 [P]

Reddit r/MachineLearning ↗ · 2026-06-02

一位Hugging Face团队成员宣布为重启的PapersWithCode网站增加会议支持功能，用户可浏览所有CVPR 2026论文及其arXiv ID，按任务分类，并关联GitHub、项目页面和Hugging Face资源。

0 人收藏 0 人点赞

#computer-vision

Hoeffding Concept Bottleneck Models 及其在高空图像中的应用

arXiv cs.LG ↗ · 2026-06-02 缓存

介绍了Hoeffding概念瓶颈模型（HCBM），这是一种利用梯度提升树的Hoeffding函数分解对概念分数进行非线性稀疏聚合的方法，旨在提高分类和目标检测任务的可解释性和准确性，并应用于高空图像。

0 人收藏 0 人点赞

#computer-vision

男子训练本地模型用激光检测并消灭蚊子

Reddit r/LocalLLaMA ↗ · 2026-06-02

一位开发者训练了一个本地AI模型来识别蚊子并用激光瞄准它们，提供了一种新颖的害虫防治方法。

0 人收藏 0 人点赞

#computer-vision

@NielsRogge: 在 http://paperswithcode.co 上推出会议论文功能！轻松按领域浏览所有被 @CVPR 2026 接受的论文，从…

X AI KOLs Following ↗ · 2026-06-01 缓存

Papers With Code 推出了一项功能，可按领域浏览所有 CVPR 2026 被接受的论文，并提供代码、项目页面和 Hugging Face 工件的链接，包括 Oral 和 Spotlight 论文。

0 人收藏 0 人点赞

computer-vision

提交意见反馈