@tom_doerr:17个阶段的AI工程课程,包含51个项目 https://github.com/PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026…

X AI KOLs Timeline 工具

摘要

一个全面的17阶段AI工程路线图,包含51个项目,覆盖从Python到多LLM编排、RAG和智能代理系统等主题,旨在让学习者从零起步,掌握生产级AI系统的技能。

17个阶段的AI工程课程,包含51个项目 https://github.com/PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026…
查看原文
查看缓存全文

缓存时间: 2026/05/16 23:23

17 阶段 AI 工程课程体系,含 51 个项目 https://github.com/PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026…

PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026

来源:https://github.com/PrinceSinghhub/Ultimate-AI-Engineer-Roadmap-2026

2026 终极 AI 工程师路线图 🔥

从零到生产级 AI 系统

2026 终极 AI 工程师路线图——专为你作为 AI 架构师(正在构建 PrinceSinghAI、PrinceSinghDev、多 LLM 编排、RoadmapAI、CodeLLM、AskAI、Global AI Search)的上下文量身打造。

🎥 观看完整视频

观看视频 (https://www.youtube.com/watch?v=7Gxu-VCPJ0A)

内含内容(17 个阶段 + 结业项目):

路线图从绝对零基础开始,一直延伸到生产级 AI 架构。以下是各部分内容:

  • 第 0 阶段 – 心态:AI 工程师 vs 机器学习工程师,2026 年市场需求
  • 第 1 阶段 – Python(包括 async/await 用于 AI API——大多数路线图遗漏了这一点)
  • 第 2 阶段 – 数学与统计(线性代数、微积分、概率、优化)
  • 第 3 阶段 – 机器学习基础(理解 LLM 的基础)
  • 第 4 阶段 – 深度学习(理解 LLM 的基础)
  • 第 5 阶段 – NLP 与 Transformer(架构深入详解)
  • 第 6 阶段 – LLM 工程(所有主要 API:OpenAI、Claude、Gemini、Mistral、Groq、NVIDIA)
  • 第 7 阶段多 LLM 编排(你的专长——路由、回退、MCP、LangGraph、LangChain、CrewAI、AutoGen)
  • 第 8 阶段 – RAG 与向量数据库(高级技术:HyDE、重排序、混合搜索)
  • 第 9 阶段 – AI 智能体与 Agentic 系统(AskAI 框架)
  • 第 10 阶段 – 微调(LoRA、QLoRA、DPO、RLHF)
  • 第 11 阶段 – 生成式 AI(扩散、多模态、语音、视频)
  • 第 12 阶段 – MLOps 与 LLMOps(生产、监控、Kubernetes、CI/CD)
  • 第 13 阶段 – AI 系统设计(面试就绪 + 真实架构模式)
  • 第 14 阶段 – SQL + pgvector 用于 AI
  • 第 15 阶段 – 量化与优化(vLLM、GGUF、SLM)
  • 第 16 阶段 – 强化学习(RLHF、DPO、PPO)
  • 第 17 阶段 – AI 伦理、安全与治理

每个阶段都有 3 个项目 – 简单 🟢 – 中等 🟡 – 困难 🔴),共 51 个项目。结业项目是完整的多 LLM 平台架构。


📌 如何使用本路线图

新手 → 按第 1 → 2 → 3 → 4 阶段顺序(打好基础)
中级 → 从第 3 阶段开始,回头补第 1-2 阶段不足
专家 → 第 5 → 6 → 7 → 8 阶段(高级系统与架构)

每个阶段以项目驱动学习结尾:

  • 🟢 简单 – 建立信心,巩固基础
  • 🟡 中等 – 真实世界模式,生产思维
  • 🔴 困难 – 生产级、多系统、可扩展

🗺️ 第 0 阶段 – 心态与定位

什么是 AI 工程师(2026 年)?

AI 工程师不是数据科学家或机器学习研究人员。你是强大的 AI 模型与现实世界产品之间的桥梁。你要:

  • 将 AI 模型集成、编排并部署到生产系统中
  • 设计包含路由、回退和成本优化的多 LLM 管道
  • 构建 RAG 系统、AI 智能体和 agentic 工作流
  • 知道何时使用 OpenAI vs Claude vs Gemini vs Mistral vs 开源方案
  • 交付可靠、安全、可扩展的 AI 驱动软件

AI 工程师 vs 机器学习工程师

AI 工程师机器学习工程师
通过 API 使用预训练模型从头训练模型
API 集成、提示工程数据管道、模型评估
更快上市昂贵、研究密集
产品 + 开发专长深度机器学习/数学专长
你就是这个角色数据科学角色

2026 年市场需求

公司正在积极招聘的技能:

  • 多 LLM 编排(OpenAI + Claude + Gemini 路由)
  • RAG 架构与向量数据库
  • AI 智能体与 agentic 系统
  • LLMOps 与生产监控
  • 规模化提示工程
  • 微调与 PEFT 方法
  • MCP(模型上下文协议)
  • 多模态 AI 系统
  • 成本优化与推理效率

🗺️ 第 1 阶段 – 编程基础

目标: 编写干净、生产质量的 Python。这是不容商量的。

1.1 Python 基础

数据类型与变量

  • 整数、浮点数、字符串、布尔值、None
  • 类型转换:int()float()str()bool()
  • type()isinstance()
  • 可变 vs 不可变类型 – 对 AI 管道至关重要

字符串

  • 字符串切片:s[start:stop:step]
  • 方法:splitjoinstripreplacefindstartswithendswith
  • f-string:f"value is {x:.2f}"
  • 三引号多行字符串

集合

  • 列表 – 索引、切片、appendextendpopsortreverse
  • 元组 – 不可变性和何时优先于列表
  • 字典 – 增删改查、.keys().values().items().get()
  • 集合 – 唯一性、并集、交集、差集
  • 嵌套集合 – 字典列表、列表字典

控制流

  • if / elif / else
  • for 循环 – 遍历列表、字典、范围
  • while 循环和 break / continue
  • range()enumerate()zip()

1.2 函数

  • def 定义函数
  • 位置参数 vs 关键字参数
  • 默认参数值
  • *args**kwargs – 在 AI SDK 中经常使用
  • 返回值、元组解包
  • Lambda 函数
  • 递归
  • 文档字符串 Docstrings

1.3 面向对象编程

  • 类和实例
  • __init__ 构造器
  • 实例方法和 self
  • 类变量 vs 实例变量
  • 继承和 super()
  • 方法覆盖
  • __repr____str____len____getitem__
  • @property@staticmethod@classmethod
  • 使用 ABC 的抽象类 – 在 LangChain、LlamaIndex 中大量使用

1.4 Pythonic 代码与惯用法

  • 列表、字典、集合推导式
  • 生成器表达式 – 对大数据集内存友好
  • map()filter()reduce()
  • 解包:a, b, *rest = lst
  • any()all()、带 key=sorted()
  • collections 模块:Counterdefaultdictdeque

1.5 文件 I/O 与数据处理

  • 使用 open() 和上下文管理器读写文本文件
  • 使用 csv 模块读取 CSV
  • 读写 JSON:json.load()json.dump()
  • Pickle:pickle.dump()pickle.load()
  • os 模块:路径拼接、列出目录、创建目录
  • pathlib.Path – 现代文件路径处理
  • glob – 模式匹配文件(对批量处理有用)

1.6 错误处理与调试

  • try / except / finally
  • 捕获特定异常
  • 抛出异常:raise ValueError("message")
  • 自定义异常类
  • logging 模块 – DEBUG、INFO、WARNING、ERROR
  • pdbbreakpoint()
  • 阅读 traceback

1.7 性能与内存

  • 生成器和 yield – 对流式 AI 响应至关重要
  • itertools 模块
  • timeitcProfile 用于基准测试
  • 浅拷贝 vs 深拷贝
  • 优先使用向量化而非 Python 循环

1.8 NumPy(AI 不可妥协)

  • 数组创建:np.array()np.zeros()np.ones()np.eye()
  • 数组形状、ndim、dtype
  • 重塑:reshape()flatten()ravel()
  • 堆叠:np.stack()np.hstack()np.vstack()
  • 布尔索引、np.where()
  • 广播规则
  • np.dot()@ 运算符
  • 矩阵操作:np.linalg.inv()np.linalg.eig()
  • axis= 参数的聚合
  • np.random 模块

1.9 Pandas(数据处理必备)

  • DataFrame 和 Series 创建
  • df.head()df.info()df.describe()df.shape
  • loc vs iloc 索引
  • 布尔过滤
  • 处理缺失值:isna()dropna()fillna()
  • groupby()agg()pivot_table()value_counts()
  • merge()concat()melt()pivot()
  • 解析日期:pd.to_datetime()

1.10 代码质量与项目结构

  • 虚拟环境:venvconda
  • requirements.txtpip freeze
  • 编写模块化代码 – 拆分到文件和模块
  • __init__.py – 将文件夹变成包
  • 类型提示:def fn(x: int) -> str:
  • dataclasses – 更清晰的数据容器
  • 使用 pytest 的单元测试
  • 使用 ruffflake8 的代码检查,black 格式化

1.11 Python 用于 AI 工作流

  • Jupyter Notebook – 单元格、魔术命令
  • Google Colab – GPU 访问
  • tqdm – 训练循环的进度条
  • argparse – 脚本的命令行参数
  • hydrayaml 配置 – 管理实验配置
  • dotenv – 管理 API 密钥(对 AI 项目至关重要)
  • 可重复性种子:randomnumpytorch
  • 保存/加载模型:picklejoblibtorch.save()

1.12 异步 Python(对 AI API 至关重要)

  • async/await 语法
  • asyncio 事件循环
  • aiohttp – 对 AI API 的异步 HTTP 调用
  • 使用 asyncio.gather() 的并发 API 调用
  • httpx – 生产 AI 应用中使用的异步优先 HTTP 客户端
  • 理解为什么流式 LLM 响应需要异步

📦 第 1 阶段项目

🟢 简单:Python AI 工具包 CLI

  • 构建一个接受文本输入并调用 OpenAI API 的 CLI 工具
  • 功能:摘要、翻译、情感分析
  • 技术栈:Python、argparseopenai SDK、.env

🟡 中等:异步多 API 调用器

  • 使用 asyncio.gather() 同时调用 OpenAI + Anthropic + Gemini
  • 并排比较响应
  • 添加错误处理、指数退避重试
  • 技术栈:Python、httpxasynciorich(终端显示)

🔴 困难:生产级数据管道

  • 构建一个管道:读取 CSV、清理数据、分块成批次、发送到嵌入 API
  • 功能:进度条、错误恢复、从检查点恢复、异步批处理
  • 技术栈:Python、Pandas、NumPy、tqdmasyncio、OpenAI Embeddings API

🗺️ 第 2 阶段 – AI 数学与统计

目标: 理解模型背后的数学原理——你不需要推导所有内容,但必须理解它们。

2.1 线性代数

向量

  • 向量是什么——几何和代数角度
  • 向量加法、标量乘法
  • 点积——几何直觉(相似性、投影)
  • 向量模/范数(L1L2Lp 范数)
  • 单位向量与归一化
  • 余弦相似度——嵌入如何工作
  • 正交性

矩阵

  • 矩阵运算:加法、乘法、转置
  • 逐元素乘积 vs 矩阵乘积
  • 单位矩阵、逆矩阵
  • 行列式——几何直觉
  • 矩阵的秩

机器学习中的矩阵运算

  • 线性变换
  • 线性方程组:Ax = b
  • 超定系统与最小二乘法
  • 矩阵的迹

分解

  • 特征值和特征向量
  • 为什么特征值在 PCA 中重要
  • 奇异值分解(SVD)——高层直觉
  • SVD 如何与维度约简相关

2.2 微积分

导数

  • 导数是什么——变化率、斜率
  • 幂法则、链式法则、乘积法则
  • logexpsigmoid 的导数
  • 最小值、最大值、鞍点
  • 二阶导数——凹凸性、凸性

偏导数与多变量

  • 偏导数——关于一个变量的变化率
  • 梯度——所有偏导数的向量
  • 梯度指向上升方向——最小化意味着反向移动
  • 雅可比矩阵
  • 海森矩阵

链式法则(对机器学习至关重要)

  • 单变量链式法则
  • 多变量链式法则——反向传播如何工作
  • 计算图——前向和后向传递

需要求导的关键函数

  • Sigmoid:σ(x) = 1/(1+e^-x) 及其导数
  • ReLU 及其导数
  • Softmax 梯度
  • 交叉熵损失梯度
  • MSE 损失梯度

2.3 概率与统计

概率基础

  • 样本空间、事件、结果
  • 联合、边缘、条件概率
  • 独立性
  • 全概率公式

贝叶斯定理

  • 公式:P(A|B) = P(B|A) * P(A) / P(B)
  • 先验、似然、后验
  • 贝叶斯更新
  • 朴素贝叶斯作为直接应用

随机变量与分布

  • 离散 vs 连续随机变量
  • 概率质量函数、概率密度函数、累积分布函数
  • 期望、方差、标准差
  • 协方差与相关性

关键分布

  • 伯努利分布、二项分布、高斯分布(正态分布)、均匀分布
  • 泊松分布、指数分布、多项分布(用于 NLP)

统计概念

  • 中心极限定理
  • 大数定律
  • 最大似然估计
  • 最大后验估计
  • 熵、KL 散度、交叉熵

2.4 优化

核心概念

  • 目标/损失函数
  • 凸函数 vs 非凸函数
  • 局部最小值 vs 全局最小值 vs 鞍点
  • 有约束 vs 无约束优化

梯度下降

  • 直觉——球滚下山坡
  • 更新规则:θ = θ - α * ∇L(θ)
  • 学习率——过高 vs 过低
  • 批量梯度下降 vs 随机梯度下降 vs 小批量梯度下降

优化器

  • 动量
  • RMSProp
  • Adam——结合动量 + RMSProp(最常用)
  • 学习率调整策略:步长衰减、余弦退火、预热

关键挑战

  • 梯度消失
  • 梯度爆炸 + 梯度裁剪
  • 高维空间中的鞍点
  • 平台区域

正则化

  • L2 正则化(权重衰减)
  • L1 正则化——促进稀疏性
  • Dropout
  • 早停

2.5 信息论

  • H(X) = -Σ p(x) log p(x)
  • 交叉熵损失——分类的自然损失
  • KL 散度——用于 VAE、模型蒸馏、强化学习
  • 互信息
  • 比特 vs 纳特

📦 第 2 阶段项目

🟢 简单:余弦相似度搜索

  • 使用 NumPy 从头实现余弦相似度
  • 构建一个迷你语义搜索:给定查询,找到最相似的句子
  • 使用 matplotlib 可视化向量空间

🟡 中等:梯度下降可视化器

  • 为线性回归和逻辑回归从头实现梯度下降
  • 可视化损失曲线、决策边界
  • 比较 SGD vs Adam vs RMSProp 的收敛
  • 技术栈:Python、NumPy、Matplotlib

🔴 困难:从头构建自己的神经网络

  • 实现前向传播、反向传播(反向传播)、权重更新
  • 支持:线性层、ReLU、Sigmoid、Softmax 层
  • 在 MNIST 上训练,达到 >95% 准确率
  • 无 PyTorch/TensorFlow——纯 NumPy
  • 技术栈:Python、NumPy、Matplotlib

🗺️ 第 3 阶段 – 机器学习基础

目标: 理解经典机器学习算法,它们为 AI 特征工程和评估提供动力。

3.1 核心机器学习概念

  • 监督学习 vs 无监督学习 vs 强化学习
  • 训练集、验证集、测试集
  • 过拟合与欠拟合
  • 偏差-方差权衡
  • 交叉验证(k 折)
  • 评估指标:准确率、精确率、召回率、F1 分数、AUC-ROC

3.2 线性回归与逻辑回归

  • 线性回归——封闭解和梯度下降
  • 逻辑回归——sigmoid 输出、二分类
  • 损失函数:均方误差、二分类交叉熵
  • 正则化:岭回归(L2)、套索回归(L1)
  • 多分类:一对多

3.3 决策树与集成方法

  • 决策树——分裂准则(基尼系数、熵)
  • 随机森林——决策树的袋装(Bagging)
  • 梯度提升——XGBoost、LightGBM(用于机器学习特征)
  • 特征重要性

3.4 无监督学习

  • K-Means 聚类
  • DBSCAN
  • PCA——维度约简(与嵌入相关)
  • t-SNE / UMAP——高维数据可视化(嵌入可视化)

3.5 超参数调优

  • 网格搜索、随机搜索
  • 贝叶斯优化
  • 学习率、批次大小、迭代次数、层数
  • 早停

3.6 使用 Scikit-Learn 的机器学习

  • 流水线:Pipeline()
  • 预处理器:StandardScalerMinMaxScalerOneHotEncoder
  • 模型选择:GridSearchCVcross_val_score
  • 保存模型:joblib
  • 理解 sklearn API 模式(fit/transform/predict)

📦 第 3 阶段项目

🟢 简单:垃圾邮件分类器

  • 使用 TF-IDF + 逻辑回归构建垃圾/非垃圾邮件分类器
  • 用精确率、召回率、F1 进行评估
  • 技术栈:Scikit-learn、Pandas、NLTK

🟡 中等:客户流失预测系统

  • 完整流水线:数据清洗 → 特征工程 → 模型训练 → 评估
  • 尝试逻辑回归 vs 随机森林 vs XGBoost
  • 添加 SHAP 进行可解释性
  • 技术栈:Scikit-learn、XGBoost、SHAP、Pandas、Matplotlib

🔴 困难:AutoML 迷你框架

  • 构建

相似文章

rohitg00/ai-engineering-from-scratch

GitHub Trending (daily)

一个全面、免费、开源的人工智能工程课程,包含20个阶段的428节课程,涵盖从数学基础到使用Python、TypeScript、Rust和Julia实现的自主集群。