标签
本文通过受控的多种子实验,检验根据输入难度调整冻结句子嵌入是否有助于提升性能。研究发现,逐句复杂度调节无效,而通过交叉编码器难度信号门控的句子对级别残差在语义相似度任务上带来了一致的提升。
本文介绍了 jina-embeddings-v5-omni,这是一套多模态嵌入模型,通过冻结塔组合技术将文本嵌入扩展至图像、音频和视频。该方法仅训练总权重的 0.35%,在保持文本几何结构的同时,以显著降低的计算成本实现了极具竞争力的最先进性能。