visual-quantization

标签

Cards List
#visual-quantization

ViQ:任意分辨率下的文本对齐视觉量化表示

Hugging Face Daily Papers · 2026-06-25 缓存

ViQ提出了一种视觉量化框架,在离散表示中平衡了语义丰富性和细节保留,通过文本对齐预训练和邻近表示学习,支持原生分辨率输入,实现高效的多模态训练。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈