@Raytar:他在谷歌用一整年测试了5760种架构。胜出的是2017年的原始Transformer。Hyung Won Ch…
摘要
Hyung Won Chung在MIT分享,他在谷歌测试了5760种架构后,认为2017年的原始Transformer是最好的。随后他加入OpenAI训练了o1。他声称99%的AI研究都是演戏。
查看缓存全文
缓存时间: 2026/05/25 14:57
他在谷歌用一整年时间测试了5760种架构。胜出的是2017年的原始Transformer。
Hyung Won Chung在麻省理工讲这个故事时带着淡淡的微笑。随后他去了OpenAI,训练了o1。
1小时。免费。由地球上少数真正推动前沿的人之一主讲。
与此同时,你的信息流里充斥着写架构长文的人,他们从未训练过任何人使用的模型。他刚刚在麻省理工说,99%的AI研究都是表演。
你的AI世界观是由那些读过他论文的人构建的——还读得很烂。现在你可以直接听他本人讲。
你会再看一遍这段内容。现在收藏吧。
Raytar (@Raytar): “我绝对是Anthropic的第一位提示工程师。可能是全世界第一位。”
Alex Albert刚刚花了35分钟解释他们如何从内部训练Claude的个性。
35分钟。免费。由发明这个角色的人亲自讲解。
大多数人认为
相似文章
@_avichawla: 排名第一的深度研究系统用一个Claude和ChatGPT都没用的技巧击败了它们。我研究了其开源架构……
Onyx开源深度研究系统通过从其编排代理中移除搜索权限,迫使其将查询分解为聚焦的研究线程,从而获得最高排名。其三阶段流水线和两级架构防止了信息失真和过早回答,性能优于OpenAI、Anthropic和Google的专有解决方案。
@berryxia: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2…
Moonshot AI创始人杨植麟发布40分钟视频,详细拆解Kimi K2模型训练过程,仅花费460万美元,并在8模型编程大战中击败GPT-5.5等夺得第一,展现小团队通过架构优化颠覆传统堆算力模式。
@mubeitech: Transformer根本不是AI的终局。 这是英伟达AI研究副总裁Sanja Fidler给出的断言。 这位掌管英伟达空间智能实验室的负责人,看到的是当前架构的死穴。 现在的模型训练成本太昂贵。 对海量数据的依赖深不见底。 必须在架构底…
英伟达AI研究副总裁Sanja Fidler断言Transformer并非AI的终局架构,指出当前模型训练成本过高、对海量数据依赖严重,需要在架构底层寻求新突破,新一代架构变种已开始涌现。
@kirillk_web3: Anthropic CEO 在观看一位200亿美元中国AI创始人免费提供击败Claude的精确架构后,仅用40分钟…
一条推文强调了一位200亿美元中国AI公司创始人举办的40分钟大师班,解释了Agent Swarms和大规模AI系统,暗示该架构击败了Anthropic的Claude。
@akshay_pachaar: 人工智能研究实验室的操作系统。TransformerLab 可在任何云端编排 GPU,并运行任何训练或评估流程…
TransformerLab 是一个开源平台,可在各云端编排 GPU,并提供预构建模板,用于 LoRA、DPO 和 MMLU 等 AI 训练与评估工作流。