text-guided

#text-guided

Count Anything

Hugging Face Daily Papers ↗ · 2026-05-29 缓存

Count Anything 是一个通用的视觉模型，用于跨多个领域的文本引导目标计数，采用双粒度实例枚举和互补计数融合。它实现了高精度和跨领域泛化能力，优于现有的开放世界计数方法。

0 人收藏 0 人点赞

#text-guided

Hugging Face Daily Papers ↗ · 2026-05-28 缓存

UniSteer 提出了一种文本引导的激活流匹配方法，在激活空间中学习通用条件速度场，无需特定任务干预模块即可实现多功能的 LLM 行为控制与分类任务。

0 人收藏 0 人点赞

#text-guided

Replicate Explore ↗ · 2026-05-08 缓存

Grounding DINO 是一个开放词汇的目标检测模型，能够根据文本描述检测任意对象，现已在 Replicate 上可用。

0 人收藏 0 人点赞