CASCADE:大语言模型在部署期间的基于案例的持续自适应
摘要
本文介绍了 CASCADE,这是一个部署时学习框架,允许大型语言模型通过情境记忆和上下文赌博机优化实现持续自适应,而无需修改模型参数。
查看缓存全文
缓存时间: 2026/05/11 02:43
论文页面 - CASCADE:大型语言模型部署期间的基于案例的持续适应
来源:https://huggingface.co/papers/2605.06702
摘要
部署时学习(Deployment-time learning)使大型语言模型智能体能够通过情景记忆(episodic memory)和上下文多臂老虎机优化(contextual bandit optimization)在运行期间持续适应,从而在各种任务中提升性能。
大型语言模型(LLMs)已成为现代人工智能的核心基础,但其生命周期仍受限于训练与部署之间的严格分离,部署后学习过程实际上便停止了。这一局限性与自然智能形成鲜明对比,后者通过与环境交互不断适应。在本文中,我们将部署时学习(DTL)形式化为 LLM 生命周期的第三阶段,使 LLM 智能体能够在部署期间从经验中获益而无需修改模型参数。我们提出了 CASCADE(部署期间的基于案例的持续适应,CASe-based Continual Adaptation During DEployment),这是一个通用且严谨的框架,为 LLM 智能体配备了一个显式的、不断演化的情景记忆。CASCADE 将经验复用形式化为上下文多臂老虎机问题,实现了原则性的探索与利用权衡,并在长期交互中建立了无遗憾(no-regret)保证。这种设计允许智能体积累、选择并优化与任务相关的案例,将过去的经验转化为可操作的知识。在涵盖医疗诊断、法律分析、代码生成、网络搜索、工具使用以及具身交互的 16 项多样化任务中,CASCADE 将宏观平均成功率提高了 20.9%(相较于零样本提示),并始终优于基于梯度和基于记忆的基线方法。通过将部署重新定义为一种自适应学习过程,这项工作为持续改进的人工智能系统奠定了基础。
查看 arXiv 页面 (https://arxiv.org/abs/2605.06702)查看 PDF (https://arxiv.org/pdf/2605.06702)GitHub1 (https://github.com/guosyjlu/CASCADE)添加到收藏夹 (https://huggingface.co/login?next=%2Fpapers%2F2605.06702)
在您的智能体中获取此论文:
hf papers read 2605\.06702
没有最新的 CLI?curl \-LsSf https://hf\.co/cli/install\.sh \| bash
引用此论文的模型0
没有链接此论文的模型
在模型 README.md 中引用 arxiv.org/abs/2605.06702 即可从此页面建立链接。
引用此论文的数据集1
guosy/DTLBench 查看器• 更新于1小时前 • 32.7k • 103 (https://huggingface.co/datasets/guosy/DTLBench)
引用此论文的 Spaces0
没有链接此论文的 Space
在 Space README.md 中引用 arxiv.org/abs/2605.06702 即可从此页面建立链接。
包含此论文的合集0
没有包含此论文的合集
将此论文添加到合集 (https://huggingface.co/new-collection) 即可从此页面建立链接。
相似文章
面向大型语言模型归因引导的持续学习
本文提出了一种面向大型语言模型的归因引导持续微调框架,该框架能够估计 Transformer 层中特定任务相关的参数重要性并相应地调节梯度,在保持新任务性能的同时缓解了灾难性遗忘。
小语言模型顺序个性化的持续学习:稳定性监测分析
本文针对小语言模型的顺序LoRA个性化展开研究,通过检查点级评估来监测任务性能和遗忘情况,并表明轻量级参考集诊断可以揭示不稳定性模式。
ReAD:面向大型语言模型的强化引导能力蒸馏
本文提出了 ReAD,这是一种强化引导的能力蒸馏框架,通过考虑大型语言模型中的跨能力迁移来优化 token 预算。与现有基线相比,该方法在提升下游效用的同时,减少了有害溢出。
TALAN:面向大语言模型定向后训练的任务对齐潜在自适应网络
TALAN 引入了一种序列条件潜在侧路径,用于大语言模型的定向后训练,在 STEM/代码基准上以最小的开销实现了显著改进。
小型RL控制器与大型语言模型:RL引导的测试时自适应采样
本文将大型语言模型的自适应采样建模为马尔可夫决策过程,并训练一个轻量级强化学习控制器来平衡正确性、延迟和计算成本,从而实现了更好的权衡。