activation-transfer

#activation-transfer

A Negative Result on Cross-Model Activation Transfer in a Pythia Multi-Hop Setting

arXiv cs.AI ↗ · 2026-06-03 Cached

This paper investigates whether direct activation transfer between language models can improve reasoning, using a linear translation layer from Pythia-160M to Pythia-410M. Despite achieving high representational alignment, the transferred activations do not improve multi-hop question answering, yielding a negative result.

0 favorites 0 likes

activation-transfer

A Negative Result on Cross-Model Activation Transfer in a Pythia Multi-Hop Setting

Submit Feedback