explicit-boundary-tokens

标签

Cards List
#explicit-boundary-tokens

揭秘隐藏状态递归:基于在策略强化学习的可切换隐式推理

Hugging Face Daily Papers · 2026-06-11 缓存

SWITCH 是一种可切换隐式推理框架,它使用显式边界标记,通过基于在策略的强化学习实现可训练且可解释的递归隐状态推理,优于先前的方法。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈