@mubeitech: Transformer根本不是AI的终局。 这是英伟达AI研究副总裁Sanja Fidler给出的断言。 这位掌管英伟达空间智能实验室的负责人,看到的是当前架构的死穴。 现在的模型训练成本太昂贵。 对海量数据的依赖深不见底。 必须在架构底…
摘要
英伟达AI研究副总裁Sanja Fidler断言Transformer并非AI的终局架构,指出当前模型训练成本过高、对海量数据依赖严重,需要在架构底层寻求新突破,新一代架构变种已开始涌现。
Transformer根本不是AI的终局。 这是英伟达AI研究副总裁Sanja Fidler给出的断言。 这位掌管英伟达空间智能实验室的负责人,看到的是当前架构的死穴。 现在的模型训练成本太昂贵。 对海量数据的依赖深不见底。 必须在架构底层撕开新的突破口。 新一代变种已经开始冒头。
相似文章
@dongxi_nlp: 好有价值的文章,最后的 6 条 take away 值得思考。 其中最后两条: 5. 数据行业远未发达。 Anthropic 和 OpenAI为单个环境花费1000万美元以上,而中国 AI 实验室基本上是“自建而非购买”心态。 6. 无数…
文章总结了AI数据行业的现状,指出数据行业尚未成熟,Anthropic和OpenAI为单个环境花费超过1000万美元,而中国AI实验室倾向于自建而非购买;此外,许多实验室虽能使用华为芯片但仍渴望更多英伟达芯片。
@runes_leo: Karpathy 4/30 在 Sequoia Ascent 把今年最有用的 AI 解释,压缩成三个论点。读完你看 AI 的方式会变。 1. AI 不只是"更快",是新范式 过去 2 年大家都在讲 AI 让事情变快。 Karpathy 说…
本文总结了Karpathy在Sequoia Ascent大会上的核心观点,指出AI是重塑任务流的新范式而非单纯加速工具,通过可验证性与经济价值划分了模型能力的“参差不齐边界”,并预言未来软件将演变为以LLM为逻辑层、传统代码为传感器/执行器的智能体原生架构。
@Kangwook_Lee: https://x.com/Kangwook_Lee/status/2052925157606568217
作者主张,为 AI Agent 设计的人工结构框架应被 AI 自主构建的工程架构所取代。文中引入 Three Regimes Framework,阐述这一转变如何释放中型模型的潜能。结合 Meta Harness 等项目的实践,作者预测 AI 将很快实现对其自身系统架构的自主优化。
AI 新闻:Anthropic 泄露揭示 AI 未来
泄露的 Claude Code 仓库曝光 Anthropic 的自主“恶魔模式”智能体与三层记忆系统,同时 OpenAI 完成创纪录的 1220 亿美元融资,微软发布 MAI-Transcribe-1。
我曾是人工智能的忠实信徒。现在我认为整个行业正在从内部腐烂。
一位前AI倡导者详细阐述了对大语言模型的幻灭,指出可靠性问题、版本间退化、企业工作流崩溃,以及部署在关键行业的AI系统缺乏问责制。