visual-tokenizer

标签

#visual-tokenizer

统一多模态自回归建模：共享上下文-视觉分词器是实现统一的关键

Hugging Face Daily Papers ↗ · 2026-06-16 缓存

UniAR提出了一个统一的自回归框架，使用单个离散视觉分词器桥接视觉理解与生成，在图像生成和编辑方面取得了最佳成果。

0 人收藏 0 人点赞

← 返回首页

提交意见反馈