activation-transfer

标签

Cards List
#activation-transfer

跨模型激活迁移在Pythia多跳设置中的负面结果

arXiv cs.AI · 2026-06-03 缓存

本文研究语言模型之间直接激活迁移是否能改善推理能力,使用从Pythia-160M到Pythia-410M的线性翻译层。尽管实现了高表示对齐,但迁移的激活并未改善多跳问答,产生了负面结果。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈