@MihaelaVDS: 能否让LLMs在不更新权重的情况下持续学习新技能？现代LLMs已经能够掌握并组合许多技能。…

X AI KOLs Timeline 2026/06/29 11:24 论文

llm skill-learning catastrophic-forgetting weight-update icml skill-neologisms

摘要

介绍了一种名为'skill neologisms'的方法，它能使LLMs在不更新权重的情况下学习新技能，解决了灾难性遗忘问题。该方法在ICML上提出。

能否让LLMs在不更新权重的情况下持续学习新技能？现代LLMs已经能够掌握并组合许多技能。但如何以可扩展的方式教会它们新技能而不发生灾难性遗忘，仍是一个未解决的挑战。 @icmlconf 我们介绍了一种新方法：skill neologisms https://t.co/xtHizOPqPV

查看原文

查看缓存全文

缓存时间: 2026/06/29 22:32

LLMs能在不更新权重的情况下持续学习新技能吗？现代 LLMs 已经能够掌握并组合多种技能，但如何以可扩展的方式教授它们新技能、同时避免灾难性遗忘，仍是一个开放挑战。在 @icmlconf 上，我们提出了一种新方法：skill neologisms https://t.co/xtHizOPqPV

相似文章

学习，快与慢：走向持续适应的LLMs

Hugging Face Daily Papers

一种针对LLMs的快慢学习框架，将固定的慢权重与优化的快上下文权重相结合，在持续学习场景中实现了高达3倍的样本效率提升，并减少了灾难性遗忘。

无需GPU的LLMs个人持续学习——立场论文[OC]

Reddit r/AI_Agents

作者提出了两种架构，即内部KV-Sphere架构（IKSA）和背景微调（BMFT），使得LLMs能够从个人互动中持续学习，无需GPU且无灾难性遗忘。

技能并非通用：面向LLM智能体的模型感知技能对齐

arXiv cs.CL

本文提出MASA框架，该框架在不修改模型权重的情况下，通过分层进化和模型条件重写器将技能适配到每个LLM骨干网络，相比基线方法最高提升25.8个点。

快慢学习：迈向持续适应的大语言模型 [R]

Reddit r/MachineLearning

本文提出了一种用于大语言模型的快慢训练框架，该框架结合参数更新与上下文优化，以提高样本效率并减少持续学习过程中的灾难性遗忘。

LatentSkill：从上下文文本技能到LLM智能体的权值潜技能

Hugging Face Daily Papers

LatentSkill将文本技能转换为存储在权值空间中的LoRA适配器，减少上下文开销，同时保持LLM智能体的模块化和可组合性，在ALFWorld和Search-QA基准测试上取得了显著改进。

提交意见反馈