@tom_doerr:17个阶段的AI工程课程,包含51个项目 https://github.com/PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026…
摘要
一个全面的17阶段AI工程路线图,包含51个项目,覆盖从Python到多LLM编排、RAG和智能代理系统等主题,旨在让学习者从零起步,掌握生产级AI系统的技能。
查看缓存全文
缓存时间: 2026/05/16 23:23
17 阶段 AI 工程课程体系,含 51 个项目 https://github.com/PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026…
PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026
来源:https://github.com/PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026
2026 终极 AI 工程师路线图 🔥
从零到生产级 AI 系统
2026 终极 AI 工程师路线图——专为你作为 AI 架构师(正在构建 PrinceSinghAI、PrinceSinghDev、多 LLM 编排、RoadmapAI、CodeLLM、AskAI、Global AI Search)的上下文量身打造。
🎥 观看完整视频
观看视频 (https://www.youtube.com/watch?v=7Gxu-VCPJ0A)
内含内容(17 个阶段 + 结业项目):
路线图从绝对零基础开始,一直延伸到生产级 AI 架构。以下是各部分内容:
- 第 0 阶段 – 心态:AI 工程师 vs 机器学习工程师,2026 年市场需求
- 第 1 阶段 – Python(包括 async/await 用于 AI API——大多数路线图遗漏了这一点)
- 第 2 阶段 – 数学与统计(线性代数、微积分、概率、优化)
- 第 3 阶段 – 机器学习基础(理解 LLM 的基础)
- 第 4 阶段 – 深度学习(理解 LLM 的基础)
- 第 5 阶段 – NLP 与 Transformer(架构深入详解)
- 第 6 阶段 – LLM 工程(所有主要 API:OpenAI、Claude、Gemini、Mistral、Groq、NVIDIA)
- 第 7 阶段 – 多 LLM 编排(你的专长——路由、回退、MCP、LangGraph、LangChain、CrewAI、AutoGen)
- 第 8 阶段 – RAG 与向量数据库(高级技术:HyDE、重排序、混合搜索)
- 第 9 阶段 – AI 智能体与 Agentic 系统(AskAI 框架)
- 第 10 阶段 – 微调(LoRA、QLoRA、DPO、RLHF)
- 第 11 阶段 – 生成式 AI(扩散、多模态、语音、视频)
- 第 12 阶段 – MLOps 与 LLMOps(生产、监控、Kubernetes、CI/CD)
- 第 13 阶段 – AI 系统设计(面试就绪 + 真实架构模式)
- 第 14 阶段 – SQL + pgvector 用于 AI
- 第 15 阶段 – 量化与优化(vLLM、GGUF、SLM)
- 第 16 阶段 – 强化学习(RLHF、DPO、PPO)
- 第 17 阶段 – AI 伦理、安全与治理
每个阶段都有 3 个项目 – 简单 🟢 – 中等 🟡 – 困难 🔴),共 51 个项目。结业项目是完整的多 LLM 平台架构。
📌 如何使用本路线图
新手 → 按第 1 → 2 → 3 → 4 阶段顺序(打好基础)
中级 → 从第 3 阶段开始,回头补第 1-2 阶段不足
专家 → 第 5 → 6 → 7 → 8 阶段(高级系统与架构)
每个阶段以项目驱动学习结尾:
- 🟢 简单 – 建立信心,巩固基础
- 🟡 中等 – 真实世界模式,生产思维
- 🔴 困难 – 生产级、多系统、可扩展
🗺️ 第 0 阶段 – 心态与定位
什么是 AI 工程师(2026 年)?
AI 工程师不是数据科学家或机器学习研究人员。你是强大的 AI 模型与现实世界产品之间的桥梁。你要:
- 将 AI 模型集成、编排并部署到生产系统中
- 设计包含路由、回退和成本优化的多 LLM 管道
- 构建 RAG 系统、AI 智能体和 agentic 工作流
- 知道何时使用 OpenAI vs Claude vs Gemini vs Mistral vs 开源方案
- 交付可靠、安全、可扩展的 AI 驱动软件
AI 工程师 vs 机器学习工程师
| AI 工程师 | 机器学习工程师 |
|---|---|
| 通过 API 使用预训练模型 | 从头训练模型 |
| API 集成、提示工程 | 数据管道、模型评估 |
| 更快上市 | 昂贵、研究密集 |
| 产品 + 开发专长 | 深度机器学习/数学专长 |
| 你就是这个角色 | 数据科学角色 |
2026 年市场需求
公司正在积极招聘的技能:
- 多 LLM 编排(OpenAI + Claude + Gemini 路由)
- RAG 架构与向量数据库
- AI 智能体与 agentic 系统
- LLMOps 与生产监控
- 规模化提示工程
- 微调与 PEFT 方法
- MCP(模型上下文协议)
- 多模态 AI 系统
- 成本优化与推理效率
🗺️ 第 1 阶段 – 编程基础
目标: 编写干净、生产质量的 Python。这是不容商量的。
1.1 Python 基础
数据类型与变量
- 整数、浮点数、字符串、布尔值、None
- 类型转换:
int()、float()、str()、bool() type()和isinstance()- 可变 vs 不可变类型 – 对 AI 管道至关重要
字符串
- 字符串切片:
s[start:stop:step] - 方法:
split、join、strip、replace、find、startswith、endswith - f-string:
f"value is {x:.2f}" - 三引号多行字符串
集合
- 列表 – 索引、切片、
append、extend、pop、sort、reverse - 元组 – 不可变性和何时优先于列表
- 字典 – 增删改查、
.keys()、.values()、.items()、.get() - 集合 – 唯一性、并集、交集、差集
- 嵌套集合 – 字典列表、列表字典
控制流
if / elif / elsefor循环 – 遍历列表、字典、范围while循环和break / continuerange()、enumerate()、zip()
1.2 函数
- 用
def定义函数 - 位置参数 vs 关键字参数
- 默认参数值
*args和**kwargs– 在 AI SDK 中经常使用- 返回值、元组解包
- Lambda 函数
- 递归
- 文档字符串 Docstrings
1.3 面向对象编程
- 类和实例
__init__构造器- 实例方法和
self - 类变量 vs 实例变量
- 继承和
super() - 方法覆盖
__repr__、__str__、__len__、__getitem__@property、@staticmethod、@classmethod- 使用
ABC的抽象类 – 在 LangChain、LlamaIndex 中大量使用
1.4 Pythonic 代码与惯用法
- 列表、字典、集合推导式
- 生成器表达式 – 对大数据集内存友好
map()、filter()、reduce()- 解包:
a, b, *rest = lst any()、all()、带key=的sorted()collections模块:Counter、defaultdict、deque
1.5 文件 I/O 与数据处理
- 使用
open()和上下文管理器读写文本文件 - 使用
csv模块读取 CSV - 读写 JSON:
json.load()、json.dump() - Pickle:
pickle.dump()、pickle.load() os模块:路径拼接、列出目录、创建目录pathlib.Path– 现代文件路径处理glob– 模式匹配文件(对批量处理有用)
1.6 错误处理与调试
try / except / finally- 捕获特定异常
- 抛出异常:
raise ValueError("message") - 自定义异常类
logging模块 – DEBUG、INFO、WARNING、ERRORpdb和breakpoint()- 阅读 traceback
1.7 性能与内存
- 生成器和
yield– 对流式 AI 响应至关重要 itertools模块timeit和cProfile用于基准测试- 浅拷贝 vs 深拷贝
- 优先使用向量化而非 Python 循环
1.8 NumPy(AI 不可妥协)
- 数组创建:
np.array()、np.zeros()、np.ones()、np.eye() - 数组形状、ndim、dtype
- 重塑:
reshape()、flatten()、ravel() - 堆叠:
np.stack()、np.hstack()、np.vstack() - 布尔索引、
np.where() - 广播规则
np.dot()和@运算符- 矩阵操作:
np.linalg.inv()、np.linalg.eig() - 带
axis=参数的聚合 np.random模块
1.9 Pandas(数据处理必备)
- DataFrame 和 Series 创建
df.head()、df.info()、df.describe()、df.shapelocvsiloc索引- 布尔过滤
- 处理缺失值:
isna()、dropna()、fillna() groupby()、agg()、pivot_table()、value_counts()merge()、concat()、melt()、pivot()- 解析日期:
pd.to_datetime()
1.10 代码质量与项目结构
- 虚拟环境:
venv或conda requirements.txt和pip freeze- 编写模块化代码 – 拆分到文件和模块
__init__.py– 将文件夹变成包- 类型提示:
def fn(x: int) -> str: dataclasses– 更清晰的数据容器- 使用
pytest的单元测试 - 使用
ruff或flake8的代码检查,black格式化
1.11 Python 用于 AI 工作流
- Jupyter Notebook – 单元格、魔术命令
- Google Colab – GPU 访问
tqdm– 训练循环的进度条argparse– 脚本的命令行参数hydra或yaml配置 – 管理实验配置dotenv– 管理 API 密钥(对 AI 项目至关重要)- 可重复性种子:
random、numpy、torch - 保存/加载模型:
pickle、joblib、torch.save()
1.12 异步 Python(对 AI API 至关重要)
async/await语法asyncio事件循环aiohttp– 对 AI API 的异步 HTTP 调用- 使用
asyncio.gather()的并发 API 调用 httpx– 生产 AI 应用中使用的异步优先 HTTP 客户端- 理解为什么流式 LLM 响应需要异步
📦 第 1 阶段项目
🟢 简单:Python AI 工具包 CLI
- 构建一个接受文本输入并调用 OpenAI API 的 CLI 工具
- 功能:摘要、翻译、情感分析
- 技术栈:Python、
argparse、openaiSDK、.env
🟡 中等:异步多 API 调用器
- 使用
asyncio.gather()同时调用 OpenAI + Anthropic + Gemini - 并排比较响应
- 添加错误处理、指数退避重试
- 技术栈:Python、
httpx、asyncio、rich(终端显示)
🔴 困难:生产级数据管道
- 构建一个管道:读取 CSV、清理数据、分块成批次、发送到嵌入 API
- 功能:进度条、错误恢复、从检查点恢复、异步批处理
- 技术栈:Python、Pandas、NumPy、
tqdm、asyncio、OpenAI Embeddings API
🗺️ 第 2 阶段 – AI 数学与统计
目标: 理解模型背后的数学原理——你不需要推导所有内容,但必须理解它们。
2.1 线性代数
向量
- 向量是什么——几何和代数角度
- 向量加法、标量乘法
- 点积——几何直觉(相似性、投影)
- 向量模/范数(
L1、L2、Lp范数) - 单位向量与归一化
- 余弦相似度——嵌入如何工作
- 正交性
矩阵
- 矩阵运算:加法、乘法、转置
- 逐元素乘积 vs 矩阵乘积
- 单位矩阵、逆矩阵
- 行列式——几何直觉
- 矩阵的秩
机器学习中的矩阵运算
- 线性变换
- 线性方程组:
Ax = b - 超定系统与最小二乘法
- 矩阵的迹
分解
- 特征值和特征向量
- 为什么特征值在 PCA 中重要
- 奇异值分解(SVD)——高层直觉
- SVD 如何与维度约简相关
2.2 微积分
导数
- 导数是什么——变化率、斜率
- 幂法则、链式法则、乘积法则
log、exp、sigmoid的导数- 最小值、最大值、鞍点
- 二阶导数——凹凸性、凸性
偏导数与多变量
- 偏导数——关于一个变量的变化率
- 梯度——所有偏导数的向量
- 梯度指向上升方向——最小化意味着反向移动
- 雅可比矩阵
- 海森矩阵
链式法则(对机器学习至关重要)
- 单变量链式法则
- 多变量链式法则——反向传播如何工作
- 计算图——前向和后向传递
需要求导的关键函数
- Sigmoid:
σ(x) = 1/(1+e^-x)及其导数 - ReLU 及其导数
- Softmax 梯度
- 交叉熵损失梯度
- MSE 损失梯度
2.3 概率与统计
概率基础
- 样本空间、事件、结果
- 联合、边缘、条件概率
- 独立性
- 全概率公式
贝叶斯定理
- 公式:
P(A|B) = P(B|A) * P(A) / P(B) - 先验、似然、后验
- 贝叶斯更新
- 朴素贝叶斯作为直接应用
随机变量与分布
- 离散 vs 连续随机变量
- 概率质量函数、概率密度函数、累积分布函数
- 期望、方差、标准差
- 协方差与相关性
关键分布
- 伯努利分布、二项分布、高斯分布(正态分布)、均匀分布
- 泊松分布、指数分布、多项分布(用于 NLP)
统计概念
- 中心极限定理
- 大数定律
- 最大似然估计
- 最大后验估计
- 熵、KL 散度、交叉熵
2.4 优化
核心概念
- 目标/损失函数
- 凸函数 vs 非凸函数
- 局部最小值 vs 全局最小值 vs 鞍点
- 有约束 vs 无约束优化
梯度下降
- 直觉——球滚下山坡
- 更新规则:
θ = θ - α * ∇L(θ) - 学习率——过高 vs 过低
- 批量梯度下降 vs 随机梯度下降 vs 小批量梯度下降
优化器
- 动量
- RMSProp
- Adam——结合动量 + RMSProp(最常用)
- 学习率调整策略:步长衰减、余弦退火、预热
关键挑战
- 梯度消失
- 梯度爆炸 + 梯度裁剪
- 高维空间中的鞍点
- 平台区域
正则化
- L2 正则化(权重衰减)
- L1 正则化——促进稀疏性
- Dropout
- 早停
2.5 信息论
- 熵
H(X) = -Σ p(x) log p(x) - 交叉熵损失——分类的自然损失
- KL 散度——用于 VAE、模型蒸馏、强化学习
- 互信息
- 比特 vs 纳特
📦 第 2 阶段项目
🟢 简单:余弦相似度搜索
- 使用 NumPy 从头实现余弦相似度
- 构建一个迷你语义搜索:给定查询,找到最相似的句子
- 使用 matplotlib 可视化向量空间
🟡 中等:梯度下降可视化器
- 为线性回归和逻辑回归从头实现梯度下降
- 可视化损失曲线、决策边界
- 比较 SGD vs Adam vs RMSProp 的收敛
- 技术栈:Python、NumPy、Matplotlib
🔴 困难:从头构建自己的神经网络
- 实现前向传播、反向传播(反向传播)、权重更新
- 支持:线性层、ReLU、Sigmoid、Softmax 层
- 在 MNIST 上训练,达到 >95% 准确率
- 无 PyTorch/TensorFlow——纯 NumPy
- 技术栈:Python、NumPy、Matplotlib
🗺️ 第 3 阶段 – 机器学习基础
目标: 理解经典机器学习算法,它们为 AI 特征工程和评估提供动力。
3.1 核心机器学习概念
- 监督学习 vs 无监督学习 vs 强化学习
- 训练集、验证集、测试集
- 过拟合与欠拟合
- 偏差-方差权衡
- 交叉验证(k 折)
- 评估指标:准确率、精确率、召回率、F1 分数、AUC-ROC
3.2 线性回归与逻辑回归
- 线性回归——封闭解和梯度下降
- 逻辑回归——sigmoid 输出、二分类
- 损失函数:均方误差、二分类交叉熵
- 正则化:岭回归(L2)、套索回归(L1)
- 多分类:一对多
3.3 决策树与集成方法
- 决策树——分裂准则(基尼系数、熵)
- 随机森林——决策树的袋装(Bagging)
- 梯度提升——XGBoost、LightGBM(用于机器学习特征)
- 特征重要性
3.4 无监督学习
- K-Means 聚类
- DBSCAN
- PCA——维度约简(与嵌入相关)
- t-SNE / UMAP——高维数据可视化(嵌入可视化)
3.5 超参数调优
- 网格搜索、随机搜索
- 贝叶斯优化
- 学习率、批次大小、迭代次数、层数
- 早停
3.6 使用 Scikit-Learn 的机器学习
- 流水线:
Pipeline()类 - 预处理器:
StandardScaler、MinMaxScaler、OneHotEncoder - 模型选择:
GridSearchCV、cross_val_score - 保存模型:
joblib - 理解 sklearn API 模式(fit/transform/predict)
📦 第 3 阶段项目
🟢 简单:垃圾邮件分类器
- 使用 TF-IDF + 逻辑回归构建垃圾/非垃圾邮件分类器
- 用精确率、召回率、F1 进行评估
- 技术栈:Scikit-learn、Pandas、NLTK
🟡 中等:客户流失预测系统
- 完整流水线:数据清洗 → 特征工程 → 模型训练 → 评估
- 尝试逻辑回归 vs 随机森林 vs XGBoost
- 添加 SHAP 进行可解释性
- 技术栈:Scikit-learn、XGBoost、SHAP、Pandas、Matplotlib
🔴 困难:AutoML 迷你框架
- 构建
相似文章
@tom_doerr: 500小时AI基础设施工程课程 https://github.com/ai-infra-curriculum/ai-infra-engineer-learning…
一个全面的500小时学习路径,涵盖AI基础设施工程,包括Docker、Kubernetes、MLOps、LLM基础设施等,通过动手项目和实验进行学习。
@tom_doerr:AI、机器学习和大语言模型学习的结构化路线图 https://github.com/bishwaghimire/ai-learning-roadmaps…
一个全面且开源的 GitHub 仓库,提供结构化的学习路线图与精选资源,助力学习者从入门到精通掌握 AI、机器学习、深度学习及大语言模型。该资源面向学生与专业人士设计,内容涵盖基础概念、编程框架、职业发展路径以及前沿 AI 议题。
rohitg00/ai-engineering-from-scratch
一个全面、免费、开源的人工智能工程课程,包含20个阶段的428节课程,涵盖从数学基础到使用Python、TypeScript、Rust和Julia实现的自主集群。
@techyoutbe: 阶段00:设置与工具(12课时)阶段01:数学基础(22课时)阶段02:机器学习基础(18课时)P…
由@ghumare64创建的19阶段AI/ML学习课程结构,涵盖从设置与数学到毕业项目的主题。
@tom_doerr: 构建自主AI智能体的免费课程和代码 https://github.com/avinash201999/free-ai-agents-resources…
一个精心整理的GitHub仓库,聚合了构建自主AI智能体的免费课程、代码示例、教程和资源,面向从初学者到高级开发者的各层次开发者。