@AYi_AInotes：想学 AI 的同学，别再只会死磕现成库了。如今从零手写一个大语言模型，比熟练掌握 PyTorch 还要简单。来看看这两位 19 岁的本科生，仅用四个月就从零搭建了完整的机器学习框架和大模型。两位滑铁卢大学的学生，四个月前对机器学习还一无所知，现…

X AI KOLs Timeline 2026/04/19 09:48 新闻

摘要

两名19岁的滑铁卢大学本科生在4个月内从零实现了完整的机器学习框架与大语言模型，证明了通过底层手动实现而非单纯依赖现成库来掌握AI技术的可行性。

想学 AI 的伙伴们，别再只会死磕现成库和接口调用了。如今从零手写一个大语言模型，其实比熟练掌握 PyTorch 还要简单。来看看这两位 19 岁的本科生，仅仅用了四个月，就从零搭建出了一整套完整的机器学习框架和大模型。这两位来自滑铁卢大学的学生，四个月前还对机器学习一无所知，但现在他们已经从零实现了一套完整的机器学习框架，

查看原文导出为 Word 导出为 PDF

查看缓存全文

缓存时间: 2026/04/20 09:39

学 AI的兄弟们,别再死磕调包了, 现在从零写一个大语言模型,比学会怎么熟练使用PyTorch还简单看看这两个19岁本科生,四个月从零造了完整的机器学习框架和大模型。两个19岁的滑铁卢大学本科小哥哥, 四个月前对机器学习一窍不通, 现在他们从零造了一套完整的机器学习框架,

相似文章

@NFTCPS: 兄弟们，搞AI不搞大模型，等于白干！今天必须给你们安利一本开源神书《大模型基础》，别等了，看它就够了！这书不跟你整那些虚的，一招打透！从大语言模型入门到架构演化，再一口气给你拆解Prompt工程、参数高效微调、模型编辑、RAG（检索增…

X AI KOLs Timeline

该文章推广了开源书籍《大模型基础》，系统讲解大语言模型相关知识，并介绍了多智能体开发框架Agent-Kernel。

@cyber_cat7: 一个大学生，把 2400 美元奖学金全砸在一台 iPad 和一台 Mac Mini 上。父母以为：买电脑学习用的。室友以为：挖矿的。真相？他从 GitHub 上克隆了 39 个 AI 代理，敲下回车，然后睡觉去了。醒来时，终端已经…

X AI KOLs Timeline

A Chinese college student spent his $2,400 scholarship on an iPad and Mac Mini to run 39 open-source AI agents overnight, completing four days of junior-developer work with zero bugs or supervision.

@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...

X AI KOLs Timeline

Yann LeCun的团队发布了LeWorldModel，一个仅有1500万参数的物理模型，在单张GPU上训练数小时，在规划速度和物理合理性上超越了价值数十亿美元的基础模型，挑战了主流的规模扩展范式。

@AI_jacksaku: GitHub本周黑马：Unsloth AI模型训练速度提升2-5倍，显存占用减少80%。这意味着什么？以前微调一个大模型，需要A100集群+几万美金。现在一张4090，几小时就能搞定。 Unsloth做了什么？优化了注意力机…

X AI KOLs Timeline

Unsloth开源工具将大模型微调速度提升2-5倍、显存降低80%，使单张RTX 4090几小时完成原本需A100集群的任务。

@AYi_AInotes: 看完这个开源项目整个人都懵了，Anthropic藏得严严实实的Claude Mythos模型黑箱，被一个22岁的创业者扒开还全开源了这个 22岁的AI创业小哥把Claude Mythos的黑箱给扒开了。他猜Anthropic最新的这个…

X AI KOLs Timeline

一位22岁创业者据称通过开源项目揭开了Anthropic Claude Mythos模型的架构黑箱，并推测其采用了循环深度Transformer设计而非单纯扩大参数规模。

相似文章

@cyber_cat7: 一个大学生，把 2400 美元奖学金全砸在一台 iPad 和一台 Mac Mini 上。 父母以为：买电脑学习用的。 室友以为：挖矿的。 真相？他从 GitHub 上克隆了 39 个 AI 代理，敲下回车，然后睡觉去了。 醒来时，终端已经…

@heyrobinai: 整个AI行业刚刚被羞辱了——一个仅用单张显卡训练几小时的微型模型正在规划...

@AI_jacksaku: GitHub本周黑马：Unsloth AI模型训练速度提升2-5倍， 显存占用减少80%。 这意味着什么？ 以前微调一个大模型， 需要A100集群+几万美金。 现在一张4090， 几小时就能搞定。 Unsloth做了什么？ 优化了注意力机…

@AYi_AInotes: 看完这个开源项目整个人都懵了，Anthropic藏得严严实实的Claude Mythos模型黑箱，被一个22岁的创业者扒开还全开源了 这个 22岁的AI创业小哥把Claude Mythos的黑箱给扒开了。 他猜Anthropic最新的这个…

提交意见反馈

@cyber_cat7: 一个大学生，把 2400 美元奖学金全砸在一台 iPad 和一台 Mac Mini 上。父母以为：买电脑学习用的。室友以为：挖矿的。真相？他从 GitHub 上克隆了 39 个 AI 代理，敲下回车，然后睡觉去了。醒来时，终端已经…

@AI_jacksaku: GitHub本周黑马：Unsloth AI模型训练速度提升2-5倍，显存占用减少80%。这意味着什么？以前微调一个大模型，需要A100集群+几万美金。现在一张4090，几小时就能搞定。 Unsloth做了什么？优化了注意力机…

@AYi_AInotes: 看完这个开源项目整个人都懵了，Anthropic藏得严严实实的Claude Mythos模型黑箱，被一个22岁的创业者扒开还全开源了这个 22岁的AI创业小哥把Claude Mythos的黑箱给扒开了。他猜Anthropic最新的这个…