token-level-analysis

#token-level-analysis

DyCo-RL: 动态跨模态协调用于视觉推理

Hugging Face Daily Papers ↗ · 2026-06-06 缓存

本文指出，视觉推理中的失败往往源于思维链生成过程中视觉与文本证据之间的动态跨模态协调崩溃。它介绍了DyCo-RL，一个强化学习框架，通过奖励有效的跨模态协调来提升推理性能。

0 人收藏 0 人点赞