@GitHub_Daily: 想搞懂大语言模型底层原理，大部分资料只介绍理论知识，或者只给源码，看完还是一头雾水。偶然看到 EveryonesLLM 这个开源教程，手把手带我们在 Google Colab 上从零搭建一个完整的大语言模型，全程动手写代码。整套教程分…

X AI KOLs Timeline 2026/06/16 04:00 工具

open-source tutorial llm colab transformer fine-tuning education

摘要

EveryonesLLM 是一个开源教程，提供29个章节的Colab笔记本，手把手教用户从零在Google Colab上搭建完整的大语言模型，包括预训练和指令微调，并支持中文。

想搞懂大语言模型底层原理，大部分资料只介绍理论知识，或者只给源码，看完还是一头雾水。偶然看到 EveryonesLLM 这个开源教程，手把手带我们在 Google Colab 上从零搭建一个完整的大语言模型，全程动手写代码。整套教程分成 29 个章节，从最基础的数据加载、词嵌入，一步步搭到注意力机制、Transformer 模块，最后完成预训练和指令微调。 GitHub：http://github.com/HayatoHongo/EveryonesLLM… 每个章节都是独立的 Colab 笔记本，打开浏览器就能跑，不用折腾本地环境。而且采用「练习+答案」的模式，先自己填代码再对答案，学得更扎实。教程一直在持续更新，最近还新增了视觉大模型（Vision LLM）的章节。学完教程之后，我们能训练出一个能对话的小型 AI，还能在线体验效果。

查看原文

查看缓存全文

缓存时间: 2026/06/16 13:38

想搞懂大语言模型底层原理，大部分资料只介绍理论知识，或者只给源码，看完还是一头雾水。

偶然看到 EveryonesLLM 这个开源教程，手把手带我们在 Google Colab 上从零搭建一个完整的大语言模型，全程动手写代码。

整套教程分成 29 个章节，从最基础的数据加载、词嵌入，一步步搭到注意力机制、Transformer 模块，最后完成预训练和指令微调。

GitHub：http://github.com/HayatoHongo/EveryonesLLM…

每个章节都是独立的 Colab 笔记本，打开浏览器就能跑，不用折腾本地环境。

而且采用「练习+答案」的模式，先自己填代码再对答案，学得更扎实。

教程一直在持续更新，最近还新增了视觉大模型（Vision LLM）的章节。

学完教程之后，我们能训练出一个能对话的小型 AI，还能在线体验效果。

HayatoHongo/EveryonesLLM

Source: https://github.com/HayatoHongo/EveryonesLLM

🌐 Select Language / 日本語 🇯🇵 | 中文 🇨🇳

Build LLM on Google Colab from scratch

Click-> AI YOU build in Chapter29😘

WebApp Released (Now only in Japanese)

EveryonesLLM

Chapter	Estimated Time	Notebook
Chapter 00: Start Tutorial	1-2 hours
Chapter 01: Dataloader	1-2 hours
Chapter 02: TokenEmbedding	0.5-1 hour
Chapter 03: PositionEmbedding	0.5-1 hour
Chapter 04: EmbeddingModule	0.5-1 hour
Chapter 05: LayerNorm	1-2 hours
Chapter 06: AttentionHead	3-4 hours
Chapter 07: MultiHeadAttention	1-2 hours
Chapter 08: FeedForward	1-2 hours
Chapter 09: TransformerBlock	0.5-1 hour
Chapter 10: VocabularyLogits	0.5-1 hour
Chapter 11: nanoGPT	1-2 hours
Chapter 12: Trainer	1-2 hours
Chapter 13: Tokens per second(CPU)	1-2 hours
Chapter 14: Tokens per second(T4 GPU)	0.5-1 hour
Chapter 15: Train nanoGPT with GPU	0.5-1 hour
Chapter 16: Make only the model size bigger	0.5-1 hour (+ 1 hour model training)
Chapter 17: Make the dataset bigger	1-2 hours (+ 1 hour model training)
Chapter 18: tiktoken	1-2 hours (+ 1 hour model training)
Chapter 19: Long Train	1-2 hours (+ 6 hours model training)
Chapter 20: Learning rate	0.5-1 hour
Chapter 21: Scaling Law	1-2 hours
Chapter 22: TinyStories(Main)	1-2 hours
Chapter 22: TinyStories(Model Training)	1 hour
Chapter 23: RPE(OverSimplified)	2-3 hours
Chapter 24: RPE(Simplified)	1-2 hours (+ 1 hour model training)
Chapter 25: LR schedule	1 hour
Chapter 26: Checkpoint	1 hour
Chapter 27: Pretraining	0.5 hour (+ 20 hours model training)
Chapter 28: Instruction Tuning	0.5 hour (+ 0.5 hour model training)
Chapter 29: Magpie (Prompt mask)	1.5 hours (+ 2 hours model training)

2026/6/5 Vision LLM beta is now available!

Explanations and exercises are not available yet. Evaluation on major benchmarks is also not available yet.

Please use it for early preview learning. We plan to update it from time to time, so we recommend working on it after future updates.

Chapter	Estimated time	Notebook
Chapter 30: Vision Pretraining (Beta)	3 hours model training
Chapter 31: Vision Instruction Tuning (Beta)	2 hours model training

EveryonesVLM_demo

Link to Web App (Vision LLM)

Tensor Map (Full Tensor Overview)

Try making the tensor map below by yourself!
Do not worry, I prepared lots of hints for you.
View the full-resolution Tensor Map of the nanoGPT model on Canva

Everyones TensorMap

About the Development Environment

To keep setup easy, please try running all the samples on Google Colab.

However, Google Colab does not save checkmarks in checkboxes.
If you want to track your progress, or if you want to work little by little, say every 30 minutes, I recommend VS Code.
In that case, fork this repository and clone it to your own PC. Just use Google Colab extension for your VS code, then you can use Colab CPU and GPU.

Answers

Chapter	Estimated Time	Notebook
Chapter 00: Start Tutorial	1-2 hours
Chapter 01: Dataloader	1-2 hours
Chapter 02: TokenEmbedding	0.5-1 hour
Chapter 03: PositionEmbedding	0.5-1 hour
Chapter 04: EmbeddingModule	0.5-1 hour
Chapter 05: LayerNorm	1-2 hours
Chapter 06: AttentionHead	3-4 hours
Chapter 07: MultiHeadAttention	1-2 hours
Chapter 08: FeedForward	1-2 hours
Chapter 09: TransformerBlock	0.5-1 hour
Chapter 10: VocabularyLogits	0.5-1 hour
Chapter 11: nanoGPT	1-2 hours
Chapter 12: Trainer	1-2 hours
Chapter 13: Tokens per second(CPU)	1-2 hours
Chapter 14: Tokens per second(T4 GPU)	0.5-1 hour
Chapter 15: Train nanoGPT with GPU	0.5-1 hour
Chapter 16: Make only the model size bigger	0.5-1 hour (+ 1 hour model training)
Chapter 17: Make the dataset bigger	1-2 hours (+ 1 hour model training)
Chapter 18: tiktoken	1-2 hours (+ 1 hour model training)
Chapter 19: Long Train	1-2 hours (+ 6 hours model training)
Chapter 20: Learning rate	0.5-1 hour
Chapter 21: Scaling Law	1-2 hours
Chapter 22: TinyStories(Main)	1-2 hours
Chapter 22: TinyStories(Model Training)	1 hour
Chapter 23: RPE(OverSimplified)	2-3 hours
Chapter 24: RPE(Simplified)	1-2 hours (+ 1 hour model training)
Chapter 25: LR schedule	1 hour
Chapter 26: Checkpoint	1 hour
Chapter 27: Pretraining	0.5 hour (+ 20 hours model training)
Chapter 28: Instruction Tuning	0.5 hour (+ 1 hour model training)
Chapter 29: Magpie (Prompt mask)	1.5 hours (+ 2 hours model training)

Sources

This tutorial is based on Andrej Karpathy’s nanoGPT and jingyaogong’s Minimind. For Instruction Tuning, it refers to Sebastian Raschka’s book Build a Large Language Model (From Scratch). For Vision LLM, it refers to LLaVA. I would like to take this opportunity to express my sincere gratitude.

Notice

This project is a community-based open-source educational project and is not affiliated with Google in any way.

About Project EveryonesLLM

EveryonesLLM Logo
EveryonesLLM Goal
EveryonesLLM Idea
EveryonesLLM Prerequites

相似文章

@GitHub_Daily: 想了解大语言模型到底是怎么工作的，找到的资料都太过于学术看不懂，或者说的太浅只讲概念，就没一个从头到尾讲清楚的内容。无独有偶，看到 how-llms-work 这个项目，把大模型的完整流程做成了一个可视化交互网页，内容基于 Karpat…

X AI KOLs Timeline

An interactive visual guide, 'how-llms-work', breaks down the entire lifecycle of Large Language Models based on Andrej Karpathy's lectures, covering data collection to post-training.

@GitHub_Daily: 大语言模型内部是如何工作的，为什么会产生幻觉，为什么有时答非所问，想深入了解这些。可以看下 Awesome LLM Interpretability 这份资源合集，提供一整套拆解 AI 黑盒的系统路径。涵盖从注意力可视化、神经元分析到…

X AI KOLs Timeline

介绍了一个名为 Awesome LLM Interpretability 的资源合集，汇集了多种可解释性工具、论文和社区资源，帮助理解大语言模型的内部工作机制。

@Jolyne_AI: 一本开源实战书：《Hands-On Large Language Models》（《动手学大模型》）。全书 12 章，从语言模型基础到提示词工程、语义搜索、模型微调，再到多模态应用，循序渐进，覆盖大模型落地的关键路径。 GitHub：h…

X AI KOLs Timeline

一本开源实战书《Hands-On Large Language Models》（《动手学大模型》），全书12章，覆盖语言模型基础、提示词工程、语义搜索、模型微调及多模态应用，提供可运行代码示例，适合实战学习。

@Xx15573208: 看了很多 Transformer 的文章，能听懂原理，但真正坐下来写代码，完全无从下手。 LLMs-from-scratch 专门解决这个问题：配套《Build a Large Language Model》一书，带你用 PyTorch …

X AI KOLs Timeline

LLMs-from-scratch 是一个 GitHub 仓库，配套《Build a Large Language Model》一书，提供从零用 PyTorch 实现 GPT 的完整代码，涵盖预训练、微调、RLHF 等全流程，已获 93K+ stars，适合想深入理解大模型原理的开发者。

@XAMTO_AI: 别再收藏那些看着热闹、用不上的 AI 教程了。这本《动手学大模型》才是真正需要的——开源、免费、代码能跑。全书 12 章，手把手带你走完大模型落地的完整流程： ① 语言模型基础 ② 提示词工程 ③ 语义搜索 ④ 模型微调 ⑤ 多模…

X AI KOLs Timeline

推荐一本开源免费的《动手学大模型》教程，涵盖语言模型基础、提示词工程、语义搜索、模型微调、多模态应用等12章，所有代码可直接在Colab中运行。

HayatoHongo/EveryonesLLM

Build LLM on Google Colab from scratch

Click-> AI YOU build in Chapter29😘

Table of Contents

WebApp Released (Now only in Japanese)

EveryonesLLM

Link to Web App (Vision LLM)

Tensor Map (Full Tensor Overview)

About the Development Environment

Answers

Sources

Notice

About Project EveryonesLLM

相似文章

@Jolyne_AI: 一本开源实战书：《Hands-On Large Language Models》（《动手学大模型》）。全书 12 章，从语言模型基础到提示词工程、语义搜索、模型微调，再到多模态应用，循序渐进，覆盖大模型落地的关键路径。 GitHub：h…

@Xx15573208: 看了很多 Transformer 的文章，能听懂原理，但真正坐下来写代码，完全无从下手。 LLMs-from-scratch 专门解决这个问题：配套《Build a Large Language Model》一书，带你用 PyTorch …

提交意见反馈