@ZhidingYu: 我们刚刚为 LocateAnything 采用了一个超酷的新空间模板,由伟大的 @_akhaliq 制作。谢谢 AK!试试看…
摘要
NVIDIA 的 LocateAnything 是一个重新思考边界框预测的视觉语言检测模型,现已成为 Hugging Face Space 并在该平台上排名第一。该空间模板由 @_akhaliq 创建。
查看缓存全文
缓存时间: 2026/05/31 10:45
我们刚刚为 LocateAnything 采用了一个超酷的新空间模板,由 @_akhaliq 大神制作。感谢 AK!快来试试:https://huggingface.co/spaces/nvidia/LocateAnything… 感谢 AK 的空间示例:https://huggingface.co/spaces/akhaliq/LocateAnything…
LocateAnything - 一个由 nvidia 创建的 Hugging Face 空间
来源:https://huggingface.co/spaces/nvidia/LocateAnything 正在从 HF Docker 仓库获取元数据……
NVIDIA AI (@NVIDIAAI): 我们研究团队的这篇 #CVPR2026 论文正在 @HuggingFace 上排名第一 🤗
认识一下 LocateAnything:一种重新思考边界框预测的视觉语言检测模型。对于 AI 智能体和机器人来说,只有当模型能够足够快地精确定位物体的位置时,“看见”才有意义。
相似文章
@NVIDIAAI: 我们的研究团队在 #CVPR2026 发表的论文在 @HuggingFace 上排名第一。认识一下 LocateAnything:一个视觉语言检测模型……
NVIDIA 研究团队发布了 LocateAnything,一种重新定义边界框预测的视觉语言检测模型,该模型在 HuggingFace 上排名第一。
@ZhidingYu:感谢 NVIDIA!我将在 #CVPR2026 上于 NVIDIA 展台展示 LocateAnything:6月5日 MDT 下午4:20-4:40(周五…
NVIDIA 推出了 LocateAnything,这是一个统一的生成式定位与检测框架,采用并行框解码(Parallel Box Decoding)来提升解码吞吐量和定位精度。该工作将在 CVPR 2026 上进行展示。
@VincentLogic: NVIDIA 刚开源的这个 LocateAnything 模型,真的有点强。 以前那种视觉定位模型,生成坐标是一个数字一个数字往外蹦(像挤牙膏一样),又慢又不稳定。 这个新模型用了“并行边界框解码”,直接一步预测完整坐标,速度快多了,框得…
NVIDIA 开源了 LocateAnything 模型,采用并行边界框解码技术,一步预测完整坐标,速度快且准确。模型仅 3B 参数,可在消费级显卡上运行,支持视频物体定位、UI 识别和 OCR 等任务。
@ClementDelangue:Hugging Face 正成为代理使用和构建 AI 的平台,现在它们可以调用 100 万个 HF Spaces,完成最新专用模型所能做的一切……
Hugging Face 现允许 AI 代理调用 100 万个 Spaces,把 Hub 变成可编程平台,代理可随手调用任何专用模型或应用。
@haofeiyu44:我们能否将 Hugging Face Hub——这个拥有海量工件的平台——转变为一个自我进化的发现机器?我们可以……
介绍 ArtifactLinker,这是一个将 HuggingFace 建模为工件图,并利用 GNN 和 LLM 代理自动发现最先进模型和研究见解的框架。