@Raytar：他在谷歌用一整年测试了5760种架构。胜出的是2017年的原始Transformer。Hyung Won Ch…

X AI KOLs Timeline 2026/05/25 08:08 新闻

transformer architecture-search google openai o1 prompt-engineering anthropic

摘要

Hyung Won Chung在MIT分享，他在谷歌测试了5760种架构后，认为2017年的原始Transformer是最好的。随后他加入OpenAI训练了o1。他声称99%的AI研究都是演戏。

他在谷歌用一整年测试了5760种架构。胜出的是2017年的原始Transformer。 Hyung Won Chung在MIT微笑着说出了这个故事。然后他去了OpenAI并训练了o1。 1小时。免费。由地球上少数真正推动前沿的人之一讲述。与此同时，你的信息流里满是那些撰写架构文章、却从未训练过任何人使用的模型的人。他刚刚在MIT说99%的AI研究都是演戏。你的AI世界观是由那些糟糕地阅读过他论文的人建立的。现在你可以直接看他了。你会重看这个的。现在收藏吧。

查看原文

查看缓存全文

缓存时间: 2026/05/25 14:57

他在谷歌用一整年时间测试了5760种架构。胜出的是2017年的原始Transformer。

Hyung Won Chung在麻省理工讲这个故事时带着淡淡的微笑。随后他去了OpenAI，训练了o1。

1小时。免费。由地球上少数真正推动前沿的人之一主讲。

与此同时，你的信息流里充斥着写架构长文的人，他们从未训练过任何人使用的模型。他刚刚在麻省理工说，99%的AI研究都是表演。

你的AI世界观是由那些读过他论文的人构建的——还读得很烂。现在你可以直接听他本人讲。

你会再看一遍这段内容。现在收藏吧。

Raytar (@Raytar): “我绝对是Anthropic的第一位提示工程师。可能是全世界第一位。”

Alex Albert刚刚花了35分钟解释他们如何从内部训练Claude的个性。

35分钟。免费。由发明这个角色的人亲自讲解。

大多数人认为

相似文章

@_avichawla: 排名第一的深度研究系统用一个Claude和ChatGPT都没用的技巧击败了它们。我研究了其开源架构……

X AI KOLs Timeline

Onyx开源深度研究系统通过从其编排代理中移除搜索权限，迫使其将查询分解为聚焦的研究线程，从而获得最高排名。其三阶段流水线和两级架构防止了信息失真和过早回答，性能优于OpenAI、Anthropic和Google的专有解决方案。

@berryxia: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者，前Google Brain和Meta研究员，坐在镜头前平静拆解了Kimi K2…

X AI KOLs Timeline

Moonshot AI创始人杨植麟发布40分钟视频，详细拆解Kimi K2模型训练过程，仅花费460万美元，并在8模型编程大战中击败GPT-5.5等夺得第一，展现小团队通过架构优化颠覆传统堆算力模式。

@mubeitech: Transformer根本不是AI的终局。这是英伟达AI研究副总裁Sanja Fidler给出的断言。这位掌管英伟达空间智能实验室的负责人，看到的是当前架构的死穴。现在的模型训练成本太昂贵。对海量数据的依赖深不见底。必须在架构底…

X AI KOLs Timeline

英伟达AI研究副总裁Sanja Fidler断言Transformer并非AI的终局架构，指出当前模型训练成本过高、对海量数据依赖严重，需要在架构底层寻求新突破，新一代架构变种已开始涌现。

@kirillk_web3: Anthropic CEO 在观看一位200亿美元中国AI创始人免费提供击败Claude的精确架构后，仅用40分钟…

X AI KOLs Timeline

一条推文强调了一位200亿美元中国AI公司创始人举办的40分钟大师班，解释了Agent Swarms和大规模AI系统，暗示该架构击败了Anthropic的Claude。

@akshay_pachaar: 人工智能研究实验室的操作系统。TransformerLab 可在任何云端编排 GPU，并运行任何训练或评估流程…

X AI KOLs Following

TransformerLab 是一个开源平台，可在各云端编排 GPU，并提供预构建模板，用于 LoRA、DPO 和 MMLU 等 AI 训练与评估工作流。

相似文章

@_avichawla: 排名第一的深度研究系统用一个Claude和ChatGPT都没用的技巧击败了它们。我研究了其开源架构……

@berryxia: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者，前Google Brain和Meta研究员，坐在镜头前平静拆解了Kimi K2…

@kirillk_web3: Anthropic CEO 在观看一位200亿美元中国AI创始人免费提供击败Claude的精确架构后，仅用40分钟…

@akshay_pachaar: 人工智能研究实验室的操作系统。TransformerLab 可在任何云端编排 GPU，并运行任何训练或评估流程…

提交意见反馈

@berryxia: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者，前Google Brain和Meta研究员，坐在镜头前平静拆解了Kimi K2…