标签
Supervision 是一个开源计算机视觉可视化工具,支持一行命令完成画框、跟踪、数据集格式转换、热力图等,被6500+项目使用,GitHub 4万星。
包含所有15篇CVPR 2026论文决赛入选作品的完整列表现已在PapersWithCode上发布,提供GitHub仓库、Hugging Face模型工件和评估结果的链接。
supervision 库是一个重要的计算机视觉开源工具包,现已获得 40,000 个 GitHub 星标,并服务于超过 6,500 个计算机视觉项目。
OpenCV 5 是计算机视觉库的重大版本更新,包含全新的 DNN 引擎、改进的 ONNX 支持、硬件加速以及更简洁的架构。对于从事经典视觉、深度学习及边缘部署的开发者而言,这标志着一次重要的现代化升级。
一份精心策划的指南,通过完整的YouTube直播课程系列来学习使用PyTorch进行深度学习,内容涵盖从张量到生成对抗网络,共分为六个部分。
一位开发者认为,边缘AI社区忽视了那些可以在智能手机等设备上本地运行的小型专门模型,并以自建的离线摩尔斯电码识别功能为例。该项目使用了小于5MB的AI模型,基于TensorFlow/Keras和LiteRT,从数据生成到移动端集成的整个流程均为自建。
AnchorWorld是一个用于自我中心世界模拟的框架,通过3D人体运动和锚点视角定义增强了交互完整性并实现了灵活的世界定制,性能优于最先进的基线。
UniSHARP 将 SHARP 扩展到通用单目视图合成,适用于多种相机系统(透视、鱼眼、全向),通过在全方位潜在空间中对齐图像,并结合特征空间和高斯空间的联合对齐。该方法在一个新基准测试上优于其他替代方法。
一个AI辅助的微流控系统成功在严重男性不育症病例中仅识别出两个可存活的精子细胞,从而通过该技术实现了首次临床妊娠。虽然基于单一病例报告,但这代表了AI辅助生殖医学的一个重要里程碑。
Fei-Fei Li与World Labs团队提出了世界模型的功能分类法,区分了渲染器、物理引擎以及在强化学习循环中的其他组件,并论证空间智能是人工智能的下一个前沿。
Sergey Levine宣布他将在CVPR研讨会上就计算机视觉和机器人策略泛化的测试时缩放以及基础模型的部署发表演讲。
NVIDIA研究在CVPR上展示三篇论文:GraspGen-X(零样本抓取基础模型)、LCDrive(高效自动驾驶推理)和NitroGen(通用游戏AI基础模型),强调物理AI系统的大规模训练。
本文介绍了一种用于视觉-语言模型的有状态视觉编码器,该编码器基于先前的特征来调节视觉表示,从而在多图像和智能体设置中实现更好的视觉比较。该方法在跨图像空间聚合、纵向放射学等任务上展现出一致的改进。
一位Hugging Face团队成员宣布为重启的PapersWithCode网站增加会议支持功能,用户可浏览所有CVPR 2026论文及其arXiv ID,按任务分类,并关联GitHub、项目页面和Hugging Face资源。
介绍了Hoeffding概念瓶颈模型(HCBM),这是一种利用梯度提升树的Hoeffding函数分解对概念分数进行非线性稀疏聚合的方法,旨在提高分类和目标检测任务的可解释性和准确性,并应用于高空图像。
Papers With Code 推出了一项功能,可按领域浏览所有 CVPR 2026 被接受的论文,并提供代码、项目页面和 Hugging Face 工件的链接,包括 Oral 和 Spotlight 论文。