visual-tokenizer

标签

Cards List
#visual-tokenizer

统一多模态自回归建模:共享上下文-视觉分词器是实现统一的关键

Hugging Face Daily Papers · 2026-06-16 缓存

UniAR提出了一个统一的自回归框架,使用单个离散视觉分词器桥接视觉理解与生成,在图像生成和编辑方面取得了最佳成果。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈