标签
本文证明,当Transformer领悟模乘时,先前工作中观察到的密集傅里叶谱是使用加法傅里叶变换产生的伪影;使用乘法特征变换则揭示出稀疏表示,从而得出一个逆向工程的'离散对数时钟'算法,类似于模加的时钟算法。