@neural_avb: 给他们一大笔钱,这样他们就能进行这些扩展到70亿参数及以上的大语言模型的实验。从中学到的东西太多了…

X AI KOLs Timeline 论文

摘要

Zyphra 分享了他们在大型语言模型持续学习方面的首项工作,研究模型是否能够从新数据中持续学习,并推导出在高达70亿参数的扩展实验中塑性丧失开始的缩放定律。

给他们一大笔钱,这样他们就能进行这些扩展到70亿参数及以上的大语言模型实验。 从这些论文中可以学到很多东西 https://t.co/VhZvCJH0nk
查看原文
查看缓存全文

缓存时间: 2026/06/26 10:11

给他们一大笔钱,这样他们就能进行这些扩展到7B大语言模型甚至更大的缩放实验

从这些论文中可以学到很多 https://t.co/VhZvCJH0nk

Zyphra (@ZyphraAI): Zyphra正在分享我们在持续学习方面的首项工作,研究的是:大语言模型能否从新数据中不断学习?

许多人将持续学习视为通过递归自我改进(RSI)通往AGI的路径。

第一个障碍是可塑性丧失。我们推导出了其出现的缩放定律 🧵

相似文章

神经语言模型的缩放规律

OpenAI Blog

基础性实证研究,展示了语言模型性能与模型规模、数据集大小和计算预算之间的幂律缩放关系,对最优训练资源分配和样本效率有重要启示。