@NielsRogge:刚刚在 Papers with Code 的 Scaling Laws 方法中添加了 Lilian Weng 的博客作为推荐读物
摘要
Niels Rogge 在 Papers with Code 上添加了 Lilian Weng 关于扩展定律的博客作为推荐读物,并附上了原始论文及引用链接。
查看缓存全文
缓存时间: 2026/06/27 09:53
刚刚将Lilian Weng的博客添加为Papers with Code上Scaling Laws方法的推荐阅读
在此处找到原始论文及其所有引用论文:https://t.co/Dbxr8oroc6 https://t.co/yvz2gjxRqD
Lilian Weng (@lilianweng): 一篇超级迟来的(3年以上?)关于缩放定律的博文。
计算成本很高。缩放定律是一种帮助我们推理在投入大规模运行之前,数据和模型大小之间的最优计算分配的方法。
这篇博文涵盖了缩放定律预测的内容、如何
相似文章
@lilianweng: 一篇超级迟到的(3年以上?)关于扩展定律的帖子。计算很昂贵。扩展定律是一种帮助我们推理…
Lilian Weng的博客文章全面概述了深度学习中的扩展定律,涵盖了它们的推导、计算最优分配以及Kaplan等人与Chinchilla之间的争论。
扩展定律,谨慎解读(25分钟阅读)
全面概述深度学习中的扩展定律,追溯其理论基础和实证发现,并解释损失如何随模型大小、数据和计算量可预测地降低。
@drummatick: I owe my entire ML career to @lilianweng and her blogs Specially on beta-VAE. That blog changed the way I saw generativ…
A user credits Lilian Weng's blog on beta-VAE for their entire ML career, while another praises her technical blog Lil'Log as highly influential in AI engineering.
@NielsRogge: 刚把这篇文章作为项目页面添加到 https://paperswithcode.co/paper/2410.00037…!希望更多人能了解……
NielsRogge 将一篇介绍 Moshi 全双工语音模型的博客作为项目页面添加到了 Papers With Code,旨在让更多人了解这一先进架构。
@NielsRogge:宣布PapersWithCode复兴!正如@ilyasut所说,我们回到了“研究时代”。因此,重要的是要……
NielsRogge宣布PapersWithCode复兴,该平台按领域提供SOTA、排行榜和方法,并使用AI智能体大规模解析。