scaling-law

标签

Cards List
#scaling-law

权重范数确定Grokking时间尺度:一个因果延迟定律

arXiv cs.LG · 8小时前 缓存

本文证明权重范数因果性地控制神经网络中grokking的时间尺度,调和了相互矛盾的论述。通过干预实验,它表明grokking遵循指数延迟定律,且范数大小在不同架构中比学习率更主导grokking时间。

0 人收藏 0 人点赞
#scaling-law

@gntalktalk: 这是最近ai开发领域最好的方法论:软件工程的scaling law --- Channel AI 创始人Luke Orthwine 提出了一种全新的思维范式:丢掉单线程线性思考的“象棋思维”,转向高并发、宏观调度、饱和攻击的“实时战略游戏…

X AI KOLs Timeline · 18小时前 缓存

Channel AI创始人Luke Orthwine提出一种新的软件开发方法论:将编程思维从传统的象棋式单线程线性思考,转向实时战略游戏(RTS)式的高并发、宏观调度和饱和攻击,以实现AI Agent时代的高效率开发。

0 人收藏 0 人点赞
#scaling-law

@snowboat84: https://x.com/snowboat84/status/2062686432335184321

X AI KOLs Timeline · 2026-06-05 缓存

这篇文章探讨了物理学与深度学习之间的深层联系,分析了Scaling Law、涌现等现象与物理学中临界标度律、相变等概念的同构性,并梳理了物理方法论在AI中的应用现状与前景。

0 人收藏 0 人点赞
#scaling-law

多智能体推理中的流式通信

Hugging Face Daily Papers · 2026-06-03 缓存

StreamMA 提出了一种用于多智能体推理的流式通信范式,通过管道化中间结果来降低延迟,并利用更可靠的早期步骤提升效果,在多个基准测试中优于基线方法,同时揭示了步骤级别的缩放定律。

0 人收藏 0 人点赞
#scaling-law

又一个‘DeepSeek时刻’?分析师称华为里程碑改变中国芯片竞赛轨迹

Reddit r/ArtificialInteligence · 2026-05-31 缓存

华为推出Tau缩放定律,这是一种绕过美国制裁的芯片架构变通方案,旨在到2031年实现相当于1.4纳米工艺的晶体管密度,标志着中国半导体自给自足迈出重要一步,并改变了与华盛顿的技术竞争格局。

0 人收藏 0 人点赞
#scaling-law

@snowboat84: 今天讨论点硬核的。一个问题:AI用到了什么程度的数学? 从工具和模型本身看,AI用到的数学平均年龄150岁,绝大部分是19世纪中叶之前就有的:矩阵乘法、梯度下降、链式求导、傅里叶、内积、概率,大都是本科前两年的内容。 但AI涌现出的一些现…

X AI KOLs Timeline · 2026-05-23 缓存

讨论AI用到的数学主要是19世纪之前的线性代数、微积分等,但涌现现象如Scaling Law、涌现能力、双下降、情境学习和表示几何缺乏数学解释,类比1900年物理学的乌云,认为可能推动21世纪数学发展。

0 人收藏 0 人点赞
#scaling-law

@jinchenma_ai: 看了张小珺那期访谈姚顺宇,4 个小时,干货密度很高。 他有个判断特别反主流。 很多人说预训练撞墙了、Scaling Law 到头了。他说没有,接下来几个月也看不到到头的迹象。 那为什么这么多人觉得撞墙?他直说:绝大多数喊撞墙的人,是自己代…

X AI KOLs Timeline · 2026-05-21 缓存

姚顺宇在访谈中提出反主流观点,认为预训练并未撞墙、Scaling Law也未到头,声称多数喊撞墙的人是因为代码中有bug。

0 人收藏 0 人点赞
#scaling-law

@Valley101_Qian: 恭喜Yuandong @tydsh ,在之前我们采访的尾声,他说的“新方向”今天官宣了:融资6.5亿、估值46.5亿美元的neolab Recursive_SI. 期待行业更多的research freedom与research tast…

X AI KOLs Timeline · 2026-05-14 缓存

田渊栋在Meta裁员后宣布新方向,融资6.5亿美元成立neolab Recursive_SI,估值46.5亿美元,并在采访中分享了关于AI趋势、LLM局限、强化学习和研究自由的见解。

0 人收藏 0 人点赞
← 返回首页

提交意见反馈