mental-reasoning

标签

Cards List
#mental-reasoning

MindZero:零标注下的在线心智推理学习

arXiv cs.AI · 2天前 缓存

MindZero 提出了一种自监督强化学习框架,用于训练多模态大语言模型,使其能够高效且鲁棒地进行在线心智推理,而无需心智状态标注,在准确性和效率上均优于基于模型的方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈