@wsl8297: 分享一本通俗好读的开源书《大模型基础》。从大语言模型入门到架构演化，再到 Prompt 工程、参数高效微调、模型编辑、检索增强生成（RAG）等关键技术，一本串起来。 GitHub：https://github.com/ZJU-LLMs/…

X AI KOLs Timeline 2026/05/07 04:59 论文

open-source llm-tutorial educational-resource prompt-engineering rag fine-tuning

摘要

浙江大学团队开源了一本通俗易懂的大模型教材《大模型基础》，涵盖从架构演化到RAG等关键技术，并附带Agent-Kernel多智能体框架。

分享一本通俗好读的开源书《大模型基础》。从大语言模型入门到架构演化，再到 Prompt 工程、参数高效微调、模型编辑、检索增强生成（RAG）等关键技术，一本串起来。 GitHub：https://t.co/lxF5YCMY0X 全书 6 章，每章以一种动物为线索，配合案例讲透核心方法，读起来更直观、更容易上手。 https://t.co/1iONdBeiB1

查看原文

查看缓存全文

缓存时间: 2026/05/08 10:46

分享一本通俗好读的开源书《大模型基础》。

从大语言模型入门到架构演化，再到 Prompt 工程、参数高效微调、模型编辑、检索增强生成（RAG）等关键技术，一本串起来。

GitHub：https://t.co/lxF5YCMY0X

全书 6 章，每章以一种动物为线索，配合案例讲透核心方法，读起来更直观、更容易上手。 https://t.co/1iONdBeiB1

ZJU-LLMs/Foundations-of-LLMs

Source: https://github.com/ZJU-LLMs/Foundations-of-LLMs

✨ News: 我们开源了一款多智能体开发框架Agent-Kernel，让大家轻松玩转大规模多智能体系统！一百个智能体在自己的笔记本电脑上就能跑起来哦~ 科研、毕设、大创、SRTP都是让人眼前一亮的创新神器！ Github 地址: https://github.com/ZJU-LLMs/Agent-Kernel 快来看看吧！

大模型基础

本书旨在为对大语言模型感兴趣的读者系统地讲解相关基础知识、介绍前沿技术。作者团队将认真听取开源社区以及广大专家学者的建议，持续进行月度更新，致力打造易读、严谨、有深度的大模型教材。并且，本书还将针对每章内容配备相关的Paper List，以跟踪相关技术的最新进展。

本书第一版包括传统语言模型、大语言模型架构演化、Prompt工程、参数高效微调、模型编辑、检索增强生成等六章内容。为增加本书的易读性，每章分别以一种动物为背景，对具体技术进行举例说明，故此本书以六种动物作为封面。当前版本所含内容均来源于作者团队对相关方向的探索与理解，如有谬误，恳请大家多提issue，多多赐教。后续，作者团队还将继续探索大模型推理加速、大模型智能体等方向。相关内容也将陆续补充到本书的后续版本中，期待封面上的动物越来越多。

当前完整的本书PDF版本路径为大模型基础.pdf。另外，我们还提供了两个文件夹，大语言模型分章节内容文件夹中包含了各章节的PDF版本。而大语言模型相关论文文件夹中包含了各章节的相关论文，当前正处于不断更新中。

其中每个章节的内容目录如下表所示。

本书目录

章节	所含内容
第 1 章：语言模型基础	1.1 基于统计方法的语言模型	1.2 基于 RNN 的语言模型	1.3 基于 Transformer 的语言模型
第 1 章：语言模型基础	1.4 语言模型的采样方法	1.5 语言模型的评测
第 2 章：大语言模型	2.1 大数据 + 大模型 → 新智能	2.2 大语言模型架构概览	2.3 基于 Encoder-only 架构的大语言模型
第 2 章：大语言模型	2.4 基于 Encoder-Decoder 架构的大语言模型	2.5 基于 Decoder-only 架构的大语言模型	2.6 非 Transformer 架构
第 3 章：Prompt 工程	3.1 Prompt 工程简介	3.2 上下文学习	3.3 思维链
第 3 章：Prompt 工程	3.4 Prompt 技巧	3.5 相关应用
第 4 章：参数高效微调	4.1 参数高效微调简介	4.2 参数附加方法	4.3 参数选择方法
第 4 章：参数高效微调	4.4 低秩适配方法	4.5 实践与应用
第 5 章：模型编辑	5.1 模型编辑简介	5.2 模型编辑经典方法	5.3 附加参数法：T-Patcher
第 5 章：模型编辑	5.4 定位编辑法：ROME	5.5 模型编辑应用
第 6 章：检索增强生成	6.1 检索增强生成简介	6.2 检索增强生成架构	6.3 知识检索
第 6 章：检索增强生成	6.4 生成增强	6.5 实践与应用

致谢

本书的不断优化，将仰仗各位读者的帮助与支持。您的建议将成为我们持续向前的动力！

所有提出issue的人，我们都列举在此，以表达我们深深的谢意。

如果有此书相关的其他问题，请随时联系我们，可发送邮件至：[email protected]。

相似文章

@NFTCPS: 兄弟们，搞AI不搞大模型，等于白干！今天必须给你们安利一本开源神书《大模型基础》，别等了，看它就够了！这书不跟你整那些虚的，一招打透！从大语言模型入门到架构演化，再一口气给你拆解Prompt工程、参数高效微调、模型编辑、RAG（检索增…

X AI KOLs Timeline

该文章推广了开源书籍《大模型基础》，系统讲解大语言模型相关知识，并介绍了多智能体开发框架Agent-Kernel。

@XAMTO_AI: 别再收藏那些看着热闹、用不上的 AI 教程了。这本《动手学大模型》才是真正需要的——开源、免费、代码能跑。全书 12 章，手把手带你走完大模型落地的完整流程： ① 语言模型基础 ② 提示词工程 ③ 语义搜索 ④ 模型微调 ⑤ 多模…

X AI KOLs Timeline

推荐一本开源免费的《动手学大模型》教程，涵盖语言模型基础、提示词工程、语义搜索、模型微调、多模态应用等12章，所有代码可直接在Colab中运行。

@GitHub_Daily: 想搞懂大语言模型底层原理，大部分资料只介绍理论知识，或者只给源码，看完还是一头雾水。偶然看到 EveryonesLLM 这个开源教程，手把手带我们在 Google Colab 上从零搭建一个完整的大语言模型，全程动手写代码。整套教程分…

X AI KOLs Timeline

EveryonesLLM 是一个开源教程，提供29个章节的Colab笔记本，手把手教用户从零在Google Colab上搭建完整的大语言模型，包括预训练和指令微调，并支持中文。

Lordog/dive-into-llms

GitHub Trending (daily)

《动手学大模型》是由上海交通大学课程讲义拓展而来的开源编程实践教程，涵盖微调、提示学习、知识编辑、数学推理、模型水印、越狱攻击、隐写术等大模型相关主题，面向初学者完全免费开放。

@Michaelzsguo: https://x.com/Michaelzsguo/status/2053217839729791221

X AI KOLs Timeline

本文是一份本地大模型部署指南，涵盖硬件选择、内存计算、Runtime 工具对比及模型量化选择，帮助用户从入门到优化本地推理体验。

ZJU-LLMs/Foundations-of-LLMs

大模型基础

本书目录

致谢

相似文章

Lordog/dive-into-llms

@Michaelzsguo: https://x.com/Michaelzsguo/status/2053217839729791221

提交意见反馈