EvoEmbedding:面向长上下文检索与智能体记忆的可演化表示
摘要
EvoEmbedding是一种动态嵌入模型,它维护一个持续更新的潜在记忆,为长上下文检索生成自适应表示,性能优于更大的专业模型,并改进智能体工作流。
查看缓存全文
缓存时间: 2026/06/23 05:41
论文页面 - EvoEmbedding: 面向长上下文检索与智能体记忆的可演化表征
来源: https://huggingface.co/papers/2606.21649
摘要
EvoEmbedding 是一种动态嵌入模型,通过维护持续更新的隐式记忆生成自适应表征,从而在长上下文场景中提升检索性能。
现有嵌入模型本质上是静态的:它们孤立地对文本片段进行编码,忽略了其周围上下文与时间顺序。本文提出 EvoEmbedding,一种新颖的嵌入模型,用于生成可演化表征 (https://huggingface.co/papers?q=evolvable%20representations) 以进行检索。它专为长上下文场景量身定制,这些场景中信息是动态、顺序性的,并需要持续的状态追踪。我们的设计简洁:EvoEmbedding 在顺序处理输入时维护一个持续更新的隐式记忆 (https://huggingface.co/papers?q=latent%20memory),并将其与原始内容共同用于生成可演化的嵌入。因此,对于同一查询,我们的模型会根据不断演化的上下文调整其表征以检索不同的目标,从而超越静态语义搜索。为了赋予模型这种能力,我们构建了 EvoTrain-180K,一个多样化的数据集,用于隐式记忆 (https://huggingface.co/papers?q=latent%20memory) 与检索的联合优化。此外,我们引入了记忆队列以防止循环编码过程中的表征坍塌 (https://huggingface.co/papers?q=representation%20collapse),同时采用分段批处理 (https://huggingface.co/papers?q=segment-batching) 技术应对显著的长度差异,并将训练加速了 3.8 倍。大量实验表明,我们的模型不仅在多项长上下文检索 (https://huggingface.co/papers?q=long-context%20retrieval) 基准上优于更大规模的专业模型(例如 Qwen3-Embedding-8B 和 KaLM-Embedding-Gemma3-12B),而且在上下文长度超出训练窗口 10 倍的下游任务(例如个性化)中也具有良好的泛化能力。值得注意的是,EvoEmbedding 能够无缝集成到智能体工作流 (https://huggingface.co/papers?q=agentic%20workflows) 中以提升性能。例如,配备我们模型的简单 RAG 流水线 (https://huggingface.co/papers?q=RAG%20pipeline) 超越了专用的智能体记忆系统。项目页面: https://clare-nie.github.io/EvoEmbedding/。
查看 arXiv 页面 (https://arxiv.org/abs/2606.21649)查看 PDF (https://arxiv.org/pdf/2606.21649)项目页面 (https://clare-nie.github.io/EvoEmbedding/)GitHub14 (https://github.com/MiG-NJU/EvoEmbedding)添加到收藏 (https://huggingface.co/login?next=%2Fpapers%2F2606.21649)
在您的智能体中获取此论文:
hf papers read 2606\.21649
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型6
MiG-NJU/EvoEmbedding-4B 特征提取 • 5B • 更新于约 4 小时前 • 50 • 4 (https://huggingface.co/MiG-NJU/EvoEmbedding-4B)
ClareNie/EvoEmbedding-0.8B 特征提取 • 1B • 更新于约 4 小时前 • 71 • 2 (https://huggingface.co/ClareNie/EvoEmbedding-0.8B)
ClareNie/EvoEmbedding-4B 特征提取 • 5B • 更新于约 4 小时前 • 127 (https://huggingface.co/ClareNie/EvoEmbedding-4B)
ClareNie/EvoEmbedding-2B 特征提取 • 3B • 更新于约 4 小时前 • 54 (https://huggingface.co/ClareNie/EvoEmbedding-2B)
浏览引用此论文的 6 个模型 (https://huggingface.co/models?other=arxiv:2606.21649)## 引用此论文的数据集1
MiG-NJU/EvoTrain-180K 查看器 • 更新于约 1 小时前 • 184k • 35 • 1 (https://huggingface.co/datasets/MiG-NJU/EvoTrain-180K)
引用此论文的 Space0
没有 Space 链接此论文
请在 Space 的 README.md 中引用 arxiv.org/abs/2606.21649,以便从此页面链接。
包含此论文的收藏0
没有收藏包含此论文
请将此论文添加到收藏 (https://huggingface.co/new-collection) 中,以从此页面链接。
相似文章
EviMem: 证据差距驱动的迭代检索用于长期对话记忆
EviMem结合了用于证据差距检测的IRIS和用于分层记忆的LaceMem,以改进长期对话记忆检索,在时间和多跳问题上实现了更高准确率和更低延迟。
Q-RAG:通过基于价值的 Embedder 训练实现长上下文多步检索
Q-RAG 引入了一种基于强化学习的 Embedder 模型微调方法,以实现高效的多步检索,并在长达 10M token 的长上下文基准测试中取得了最先进的结果。该方法为微调小型 LLM 以处理复杂的多步搜索任务提供了一种资源高效的替代方案。
EvoArena:追踪记忆演化以实现动态环境中鲁棒的LLM智能体
EvoArena引入了一个基准测试,用于评估LLM智能体在动态环境中的表现,该环境在终端、软件和社交领域具有渐进式更新;同时EvoMem提出了一种基于补丁的记忆范式,记录结构化的演化;实验表明,当前智能体在EvoArena上仅达到39.6%的准确率,而EvoMem在该基准测试上平均提升1.5%,并在GAIA和LoCoMo上也有所改进。
更少的上下文,更高的准确性:一种用于LLM代理的双时态记忆引擎,其中精简检索的上下文胜过了完整历史
本文介绍了Engram,一个开源的用于LLM代理的双时态记忆引擎,它通过检索一个紧凑的上下文片段(约9.6k token),在LongMemEval上以混合读取路径融合稠密、词汇、图和时间信号,比完整历史基线(79k token)高出10.4个准确率点。
@dair_ai:// 驾驭智能体进化 // 如果你运行迭代式智能体搜索循环,请注意这一点。(收藏它)一……
AEvo 是一个元编辑框架,通过将提议和评估分为两个角色,并利用累积的记忆指导未来搜索,改进了迭代式智能体搜索。它在开放式优化任务上相比基线实现了26%的相对提升,并取得了最先进的结果。