continual-learning

#continual-learning

从权重到特征：SAE引导的激活正则化用于LLM持续学习

arXiv cs.LG ↗ · 10小时前缓存

本文提出了一种用于大语言模型的持续学习方法，该方法使用预训练的稀疏自编码器（SAEs）在激活空间而非权重空间中进行正则化，从而在无需存储先前数据的同时避免灾难性遗忘，并实现了更好的内存效率和更强的基准性能。

0 人收藏 0 人点赞

#continual-learning

@TheAhmadOsman：持续学习将在本地运行，这就是为什么大型实验室不谈论它。不是你的权重，不是你的模型，实际上……

X AI KOLs Following ↗ · 19小时前缓存

一条推文主张持续学习将在本地运行，并解释了为什么主要AI实验室避免讨论它：因为数据保留在设备上。

0 人收藏 0 人点赞

#continual-learning

@neural_avb: 给他们一大笔钱，这样他们就能进行这些扩展到70亿参数及以上的大语言模型的实验。从中学到的东西太多了…

X AI KOLs Timeline ↗ · 昨天缓存

Zyphra 分享了他们在大型语言模型持续学习方面的首项工作，研究模型是否能够从新数据中持续学习，并推导出在高达70亿参数的扩展实验中塑性丧失开始的缩放定律。

0 人收藏 0 人点赞

#continual-learning

摘要：Gemini 联合负责人谈世界模型、强化学习的下一个领域与持续学习

Reddit r/artificial ↗ · 昨天缓存

奥里奥尔·维尼亚尔斯（Oriol Vinyals）关于 Google Gemini 模型、世界模型、多模态 AI、智能体以及持续学习和真正创新等挑战的讨论摘要。

1 人收藏 1 人点赞

#continual-learning

面向连续功率预测：非平稳时间序列中现实世界能源系统的实用持续学习

arXiv cs.LG ↗ · 昨天缓存

本文提出连续功率预测，将功率预测视为持续学习问题以处理非平稳条件。它在真实世界数据集上评估了六种持续学习方法，展示了在适应性和缓解灾难性遗忘方面的优势。

0 人收藏 0 人点赞

#continual-learning

产业规模生态系统中的LLM演进：持续学习的生命周期视角

arXiv cs.LG ↗ · 昨天缓存

本综述将面向LLM的工业持续学习重新定义为版本化生态系统中的闭环更新与发布问题，识别了关键挑战，并提出了五个生命周期设计原则，以实现可持续的模型演进。

0 人收藏 0 人点赞

#continual-learning

快速与慢速变分持续学习

arXiv cs.LG ↗ · 2天前缓存

本文介绍了持续IVON（CoVON）优化器，它将快速和慢速适应整合到变分持续学习中，以平衡稳定性和可塑性，在领域增量学习、持续预训练以及大型语言模型的微调中优于现有方法。

0 人收藏 0 人点赞

#continual-learning

@SnorkelAI: Benchtalks 第3集——与 @pgasawa 探讨持续学习基准，即将上线，@vincentsunnchen 参与

X AI KOLs Timeline ↗ · 2天前缓存

SnorkelAI 宣布即将推出 Benchtalks 第3集，邀请 @pgasawa 讨论持续学习基准，@vincentsunnchen 也将加入。

0 人收藏 0 人点赞

#continual-learning

@EngramLab: https://x.com/EngramLab/status/2069465879696576844

X AI KOLs Timeline ↗ · 2天前缓存

Engram推出了一种从用户上下文中学习的人工智能，通过在个人和企业数据上扩展计算能力，创建理解特定工作环境的模型。他们为代理提供API，并与Notion、Harvey和Microsoft建立了合作关系。

0 人收藏 0 人点赞

#continual-learning

RNNs vs Transformers vs SSMs：面向持续学习场景下AI记忆应存放于何处？

Reddit r/artificial ↗ · 2026-06-18

一篇比较RNNs、Transformers和SSMs中记忆设计的技术分析，主张关键问题在于序列状态应存储于何处，而非哪种架构更优。讨论了压缩隐状态、增长的KV缓存以及模型连接中类突触记忆之间的权衡。

0 人收藏 0 人点赞

#continual-learning

@VukRosic99: DeepSeek 研究员刚刚开源了他的个人项目 AutoResearch。该项目首次实现了自动化研究代理...

X AI KOLs Timeline ↗ · 2026-06-18 缓存

DeepSeek 研究员开源了 AutoResearch，这是一个自主框架，能够在无需人工干预的情况下，为 DeepSeek 285B 模型规划、执行并调试强化学习实验，并附带了一篇关于自我对弈的综述论文。

0 人收藏 0 人点赞

#continual-learning