arithmetic-reasoning

标签

Cards List
#arithmetic-reasoning

读出捷径:位置数字复制主导小型语言模型中的算术CoT读出

arXiv cs.LG · 2026-05-25 缓存

本文发现了一种‘位置复制’捷径:小型语言模型通过复制答案分隔符前的最后一个数字来回答算术问题,绕过了实际推理。该效应解释了为何打乱CoT步骤仍能保持性能;在GSM8K上,它占1-3B模型教师强制准确率的89-92%。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈