标签
该研究揭示了LLM文本嵌入被高频token(如句号、冠词)绑架的问题,提出EmbedFilter方法通过对unembedding矩阵进行SVD分解并减去投影分量来释放真实语义,实现零训练开销的降维和检索效率提升。
本文研究了变系数波动方程中傅里叶神经算子与深度算子网络在分布偏移下的泛化行为,发现FNO难以处理高频输入,而DeepONet的性能下降较为平缓。