@MihaelaVDS: 能否让LLMs在不更新权重的情况下持续学习新技能?现代LLMs已经能够掌握并组合许多技能。…
摘要
介绍了一种名为'skill neologisms'的方法,它能使LLMs在不更新权重的情况下学习新技能,解决了灾难性遗忘问题。该方法在ICML上提出。
能否让LLMs在不更新权重的情况下持续学习新技能?
现代LLMs已经能够掌握并组合许多技能。但如何以可扩展的方式教会它们新技能而不发生灾难性遗忘,仍是一个未解决的挑战。
@icmlconf 我们介绍了一种新方法:skill neologisms https://t.co/xtHizOPqPV
查看缓存全文
缓存时间: 2026/06/29 22:32
LLMs能在不更新权重的情况下持续学习新技能吗? 现代 LLMs 已经能够掌握并组合多种技能,但如何以可扩展的方式教授它们新技能、同时避免灾难性遗忘,仍是一个开放挑战。 在 @icmlconf 上,我们提出了一种新方法:skill neologisms https://t.co/xtHizOPqPV
相似文章
学习,快与慢:走向持续适应的LLMs
一种针对LLMs的快慢学习框架,将固定的慢权重与优化的快上下文权重相结合,在持续学习场景中实现了高达3倍的样本效率提升,并减少了灾难性遗忘。
无需GPU的LLMs个人持续学习——立场论文[OC]
作者提出了两种架构,即内部KV-Sphere架构(IKSA)和背景微调(BMFT),使得LLMs能够从个人互动中持续学习,无需GPU且无灾难性遗忘。
技能并非通用:面向LLM智能体的模型感知技能对齐
本文提出MASA框架,该框架在不修改模型权重的情况下,通过分层进化和模型条件重写器将技能适配到每个LLM骨干网络,相比基线方法最高提升25.8个点。
快慢学习:迈向持续适应的大语言模型 [R]
本文提出了一种用于大语言模型的快慢训练框架,该框架结合参数更新与上下文优化,以提高样本效率并减少持续学习过程中的灾难性遗忘。
LatentSkill:从上下文文本技能到LLM智能体的权值潜技能
LatentSkill将文本技能转换为存储在权值空间中的LoRA适配器,减少上下文开销,同时保持LLM智能体的模块化和可组合性,在ALFWorld和Search-QA基准测试上取得了显著改进。