@Raytar:他在谷歌用一整年测试了5760种架构。胜出的是2017年的原始Transformer。Hyung Won Ch…

X AI KOLs Timeline 新闻

摘要

Hyung Won Chung在MIT分享,他在谷歌测试了5760种架构后,认为2017年的原始Transformer是最好的。随后他加入OpenAI训练了o1。他声称99%的AI研究都是演戏。

他在谷歌用一整年测试了5760种架构。胜出的是2017年的原始Transformer。 Hyung Won Chung在MIT微笑着说出了这个故事。然后他去了OpenAI并训练了o1。 1小时。免费。由地球上少数真正推动前沿的人之一讲述。 与此同时,你的信息流里满是那些撰写架构文章、却从未训练过任何人使用的模型的人。他刚刚在MIT说99%的AI研究都是演戏。 你的AI世界观是由那些糟糕地阅读过他论文的人建立的。现在你可以直接看他了。 你会重看这个的。现在收藏吧。
查看原文
查看缓存全文

缓存时间: 2026/05/25 14:57

他在谷歌用一整年时间测试了5760种架构。胜出的是2017年的原始Transformer。

Hyung Won Chung在麻省理工讲这个故事时带着淡淡的微笑。随后他去了OpenAI,训练了o1。

1小时。免费。由地球上少数真正推动前沿的人之一主讲。

与此同时,你的信息流里充斥着写架构长文的人,他们从未训练过任何人使用的模型。他刚刚在麻省理工说,99%的AI研究都是表演。

你的AI世界观是由那些读过他论文的人构建的——还读得很烂。现在你可以直接听他本人讲。

你会再看一遍这段内容。现在收藏吧。

Raytar (@Raytar): “我绝对是Anthropic的第一位提示工程师。可能是全世界第一位。”

Alex Albert刚刚花了35分钟解释他们如何从内部训练Claude的个性。

35分钟。免费。由发明这个角色的人亲自讲解。

大多数人认为

相似文章

@berryxia: Moonshot AI创始人杨植麟最近放出了一个40分钟视频。 这位92年生、清华计算机本科第一、CMU博士、Transformer-XL和XLNet共同作者,前Google Brain和Meta研究员,坐在镜头前平静拆解了Kimi K2…

X AI KOLs Timeline

Moonshot AI创始人杨植麟发布40分钟视频,详细拆解Kimi K2模型训练过程,仅花费460万美元,并在8模型编程大战中击败GPT-5.5等夺得第一,展现小团队通过架构优化颠覆传统堆算力模式。

@mubeitech: Transformer根本不是AI的终局。 这是英伟达AI研究副总裁Sanja Fidler给出的断言。 这位掌管英伟达空间智能实验室的负责人,看到的是当前架构的死穴。 现在的模型训练成本太昂贵。 对海量数据的依赖深不见底。 必须在架构底…

X AI KOLs Timeline

英伟达AI研究副总裁Sanja Fidler断言Transformer并非AI的终局架构,指出当前模型训练成本过高、对海量数据依赖严重,需要在架构底层寻求新突破,新一代架构变种已开始涌现。