@pauliusztin_: 我们刚刚开源了完整的 @aiDotEngineer 研讨会！你可以克隆它并自行运行所有内容... → https://github…

X AI KOLs Timeline 2026/05/07 12:30 工具

open-source multi-agent mcp workshop ai-agents claude-code pydantic

摘要

一个开源研讨会仓库，用于构建真实世界的多智能体 AI 系统，包括深度研究智能体和 LinkedIn 写作工作流，使用 MCP 服务器、Pydantic 结构化输出以及带有 Claude Code 子智能体的智能体工程。

我们刚刚开源了完整的 @aiDotEngineer 研讨会！你可以克隆它并自行运行所有内容... → https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop… 你将构建： • 一个深度研究智能体（基于搜索 + YouTube 分析） • 一个 LinkedIn 写作工作流（生成 → 审核 → 编辑循环） • 一个评估层，用于衡量质量而非猜测但这不仅仅是一组脚本。它是一个完整的围绕以下内容构建的多智能体系统： • MCP 服务器（工具、资源、提示） • 使用 Pydantic 的结构化输出 • 自主决定流程的工具使用智能体 • 你可以实际检查的端到端管道你可以通过 3 个步骤完成： 1. 观看完整的约 2 小时研讨会 2. 在真实输入上运行系统 3. 使用 24 个引导工单自行重建所有内容但有趣的是...你不需要手动重建。你使用智能体工程来完成。我们设置了： • 一个软件工程师智能体 • Claude Code 子智能体 • 一个编排技能这处理所有 24 个工单并： • 实现它们 • 测试它们 • 逐步迭代所以你既学习智能体如何工作，也学习如何将智能体作为协作者进行构建。这就是我们在 Agentic AI Engineering 课程中使用和教授的系统...只是压缩到约 2 小时内。如果你阅读代码，你会比观看 10 个演示理解得更多。链接：https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop…

查看原文导出为 Word 导出为 PDF

查看缓存全文

缓存时间: 2026/05/08 11:30

我们刚刚开源了完整的 @aiDotEngineer 研讨会！你可以克隆它并自己运行所有内容…… → https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop… 你将构建：
• 一个深度研究智能体（基于真实搜索 + YouTube 分析）
• 一个 LinkedIn 写作工作流（生成→审阅→编辑循环）
• 一个评估层来量化质量，而不是靠猜测

但这不仅仅是一组脚本。它是一个完整的多智能体系统，围绕以下内容构建：
• MCP 服务器（工具、资源、提示）
• 基于 Pydantic 的结构化输出
• 自主决策流程的工具使用智能体
• 可实际检查的端到端管道

你可以分三步走：

观看完整的约 2 小时研讨会
在实际输入上运行系统
按照 24 个指导工单从头重建一切

但有趣的部分来了……
你不需要手动重建。而是使用智能体工程来重建。
我们设置了：
• 一个软件工程师智能体
• Claude Code 子智能体
• 一个编排技能

这会处理所有 24 个工单并：
• 实现它们
• 测试它们
• 逐步迭代

因此你既能了解智能体如何工作，又能学习如何将智能体作为协作者来构建。
这正是我们在智能体 AI 工程课程中使用的系统……只是压缩到了大约 2 小时。
如果你阅读代码，会比观看 10 场演示理解得更深。

链接：https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop…

iusztinpaul/designing-real-world-ai-agents-workshop

来源：https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop

构建你自己的深度研究智能体 + 技术写作多智能体系统

这是一个实践研讨会，在 AI Engineering Conference Europe (https://www.ai.engineer/europe) 上展示，构建一个包含两个 MCP 服务器的多智能体 AI 系统：深度研究智能体 和 LinkedIn 写作工作流。两者都连接到类似 Claude Code 或 Cursor 的工具框架。

🎬 完整研讨会可在 YouTube (https://www.youtube.com/watch?v=mYSRn6PC1mc) 观看
↓
📑 幻灯片在此 (https://drive.google.com/file/d/1RWdS5VQYjz7a9y7NzHhAnyhGtxi6e0vt/view?usp=sharing)。

当你准备好了，这里是如何深入

这个研讨会是一个 2-4 小时的尝鲜。如果你想从零开始到交付生产级 AI 智能体，请查看我们的 智能体 AI 工程课程 (https://academy.towardsai.net/courses/agent-engineering?utm_source=github&utm_medium=aieng&utm_campaign=2026_aieng_workshop&utm_id=researchwriter)，与 Towards AI 合作打造。

34 节课。三个端到端作品集项目。一张证书。以及一个可以直接联系行业专家和我们的 Discord 社区。
300+ 学生评分 5/5。前 6 节课免费：
从这里开始 → (https://academy.towardsai.net/courses/agent-engineering?utm_source=github&utm_medium=aieng&utm_campaign=2026_aieng_workshop&utm_id=researchwriter)

如何使用本仓库

三种方式使用本仓库。选择适合你时间的模式，或按顺序完成所有三种，因为每一步都建立在上一步之上：

观看研讨会并端到端理解模式。约 2 小时。
从上面的 2 小时 YouTube 研讨会 (https://www.youtube.com/watch?v=mYSRn6PC1mc) 和幻灯片 (https://drive.google.com/file/d/1RWdS5VQYjz7a9y7NzHhAnyhGtxi6e0vt/view?usp=sharing) 开始。你会对整个多智能体系统有一个心理模型：工具使用智能体、评估器-优化器循环、基于真实搜索、结构化 LLM 输出和 MCP 服务器设计。
运行完成的代码。看到它生成实际产物。约 30 分钟。
观看系统生成研究简报、通过评估器-优化器循环起草 LinkedIn 帖子，并使用 LLM-as-judge 给自己打分。按照入门和运行代码部分安装项目并运行 MCP 服务器、技能和评估管道。
通过智能体编码自己实现。在约 2-4 小时内从头构建 1:1 副本。
打开 implement_yourself/，这是一个精简的框架，包含 25 个预处理的工单和一个自定义的 /implement Claude Code 技能，它能编排 SWE 和 Tester 智能体循环地处理每个工单，直到目录与 src/ 匹配。查看 implement_yourself/README.md 获取启动指南。

没有作弊，这是设计使然。 implement_yourself/ 是一个独立的项目。在你的工具框架（Claude Code、Cursor 等）中直接打开那个文件夹（而不是仓库根目录），这样工作目录就限定在框架内。智能体看不到 ../src/ 中的参考实现，不能 grep 它，也不能读取它的文件。你会得到一个真实的构建，而不是复制粘贴。

你今天将构建什么

深度研究智能体 — 一个 MCP 服务器，使用 Gemini 进行深度研究，结合 Google 搜索真实来源和原生 YouTube 视频分析：

用户主题 → [deep_research] × N → analyze_youtube_video（如果有网址） → [deep_research 填补空白] → compile_research → research.md

LinkedIn 写作工作流 — 一个 MCP 服务器，通过评估器-优化器循环生成 LinkedIn 帖子：

research.md + 指导原则 → 生成帖子 → [审阅 → 编辑] × N → post.md → 生成图片

两个服务器通过模型上下文协议 (https://modelcontextprotocol.io/) 暴露工具、资源和提示，允许任何兼容 MCP 的工具框架编排工作流。

你将学到的模式和概念：

工具使用智能体 — 让 LLM 决定何时调用哪些工具
评估器-优化器循环 — 在循环中生成、审阅、编辑
基于真实搜索 — Gemini 使用 Google 搜索真实来源进行事实性研究
结构化 LLM 输出 — 使用 Pydantic 模式确保类型安全的模型响应
MCP 服务器设计 — 使用 FastMCP 注册工具、资源和提示
LLM-as-judge 评估 — 使用 Opik 自动化质量评分

示例：端到端工作流

这是一个完整管道的实际运行——从一个主题种子到一篇带有 AI 生成图片的、可发布的 LinkedIn 帖子。

最终输出

Phil Tobaloo
AI 工程师 | 我交付 AI 产品并教你这个过程。

我们计划了 12 个 AI 智能体，但只交付了 1 个。结果效果更好。

听起来很疯狂，对吧？但这是一个常见的故事。

一个客户构建了一个 AI 营销聊天机器人。他们最初的设计有几十个智能体：编排器、验证器、垃圾信息预防。它失败了。

一个带工具的单一智能体胜出。任务是紧密耦合的。一个大脑维持上下文。工具仍然是专门的。

这是核心错误。人们过早地跳入复杂的多智能体设置。

把 AI 系统设计看作一个光谱：

工作流：你控制步骤。
单一智能体 + 工具：模型决定流程。
多智能体：多个决策者。

……

单一智能体适用于大多数情况。但它有局限性。工具太多？你会遇到“上下文腐烂”。超过约 10-20 个工具，LLM 在工具选择上会退化。它们会不堪重负。信息在中间丢失。

那么，什么时候才真正需要多智能体？……

能够可靠解决问题的最简单系统总是最好的系统。
不要过度设计你的 AI 智能体。先构建简单的。

你简化过的最复杂的智能体架构是什么？在下面告诉我。

阅读完整帖子

逐步分解（种子 → 研究 → 指导原则 → 草稿）

1. 从一个种子开始

一份简短的研究简报，包含 2-3 个问题和参考链接：

``markdown

研究主题：AI 智能体架构——少即是多

关键问题

为什么带有智能工具的单一智能体架构优于多智能体系统？
采用多智能体架构的唯一合理理由是什么？

参考

停止过度设计：工作流 vs AI 智能体解析（YouTube）
从 12 个智能体到 1 个（DecodingAI 文章） ``

2. 深度研究智能体生成 `research.md`

智能体运行多个 Gemini 基于真实搜索的查询，分析 YouTube 视频，然后将所有内容整合成一份带有来源的结构化研究简报。

此例子的完整 research.md 大约有 2 万个 token，涉及 2 个查询和 1 个视频转录。

3. 编写指导原则

一份简短的简报，描述帖子角度、受众和关键点：

``markdown

LinkedIn 帖子指导原则

主题

为什么大多数 AI 团队应该使用 1 个智能体而不是 12 个。

角度

以反直觉的“12 个智能体 → 1 个”作为开头。引入复杂度光谱。以一个清晰的思维模型结束。

目标受众

构建 LLM 驱动的应用的 AI 工程师和技术负责人。

关键点

一个团队计划了 12 个智能体，但只交付了 1 个——效果更好。
光谱：工作流 → 单一智能体 + 工具 → 多智能体。尽量靠左。
“上下文腐烂”：超过约 10-20 个工具，LLM 在工具选择上退化。
只有 4 个合理的多智能体理由。

语气

直接、有主见、工程师对工程师。不说废话。 ``

4. 写作工作流优化帖子

评估器-优化器循环生成草稿，然后进行 3 轮审阅 + 编辑：

v0 — 初始草稿

我们计划了 12 个 AI 智能体。我们交付了 1 个。

听起来很疯狂，对吧？但这是一个常见的故事。

一个客户想要一个 AI 聊天机器人用于营销内容：邮件、短信、促销。他们最初的设计有几十个专门智能体：编排器、分析器、验证器、垃圾信息预防。

实际上？一个带工具的单一智能体胜出。任务是紧密耦合、顺序执行的。分割任务造成了信息孤岛和交接错误。[…]

能够可靠解决问题的最简单系统总是最好的系统。

v3 — 经过 3 轮审阅/编辑后

我们计划了 12 个 AI 智能体，但只交付了 1 个。效果更好。

一个客户构建了一个 AI 营销聊天机器人。他们最初的设计有几十个智能体：编排器、验证器、垃圾信息预防。它失败了。

一个带工具的单一智能体胜出。任务是紧密耦合的。一个大脑维持上下文。工具仍然是专门的。

尽可能靠左。只有在被迫时才向右移动。[…]

能够可靠解决问题的最简单系统总是最好的系统。

verbose, redundant phrasing, weak hook
Tighter, punchier, stronger structure

示例 2 — 工具框架工程（点击展开）

`` 工具框架工程并不仅仅是提示工程的新名词。它是 AI 的发展方向。

智能体变得足够有用，可以处理代码和工具，但它们不够可靠。它们会重复错误。瓶颈从代码生成转移到了实际系统中一致、可靠的行为。

这样想：提示工程是问什么。上下文工程是给模型发送什么。工具框架工程是整个系统如何运作。它是模型周围的环境，超越了单纯的 token。

汽车类比：模型是引擎。上下文是燃料。工具框架是汽车的其余部分：方向盘、刹车、车道边界。它防止崩溃。

工具框架包括工具、权限、状态、测试、日志、重试、检查点、护栏和评估。

别指望模型会改进。改进它的环境。责任落在我们建设者身上，防止重复错误。

我在我的 Claude Code 设置中使用自我反思。智能体学习我喜欢什么，节省 token 和时间。

真实公司已经在这么做了。Anthropic 的长期运行智能体将记忆外化到工件中。OpenAI 使用结构化文档和智能体对智能体审阅，零手动代码构建了一个 100 万行产品。Stripe 智能体在隔离环境中每周合并 1000+ 个 PR。LangChain 仅通过改变工具框架，就将编码智能体在 Terminal Bench 2.0 上从前 30 名之外提升到前 5 名。同一模型，更好的系统。

这不仅仅是针对编码智能体。这是软件构建的新方式。

程序员的工作正在转变：少写代码，多为智能体设计无故障运行的栖息地。想想机器可读的文档、评估、沙箱、权限边界和结构测试。

可靠性是真正的工作。不仅仅是提示。

LLM 正在进入系统、工作流、工具框架。价值来自编排、约束、反馈循环——而不仅仅是单个提示。

未来不是一个天才模型。而是处于精心设计环境中的模型。

这就是为什么工具框架工程很重要。这是当你停止演示智能并开始交付它时发生的事情。

想了解更多？我在最新视频中解释了所有内容：https://youtu.be/zYerCzIexCg

你现在构建可靠智能体系统最大的挑战是什么？ ``

示例 3 — AI 工程师的 Angine de Poitrine（点击展开）

`` 忘了你最新的 AI 模型。有一个新系统正在席卷互联网：Angine de Poitrine。

这对来自魁北克的面具双人组部署了一个高分辨率音频架构。它让其他一切听起来都像低分辨率。

Khn 的定制双琴颈微分音吉他具有 2 倍分辨率：每八度 24 个音符，而不是 12 个。精细频率调制。Klek 用鼓支持他，驱动着感觉像 O(n^2) 拍子的节奏。纯粹的算法复杂度。

他们的声音：“达达毕达哥拉斯立体主义咒语摇滚。”东方传统遇到 Frank Zappa。

他们在 2026 年 2 月为 KEXP 进行的 27 分钟推理运行获得了 700 万+ 观看，并爆红网络。随后在纽约、伦敦、雷恩的演出全部售罄。

他们的匿名性又增加了一层。波尔卡圆点服装和纸浆面具是匿名推理端点。他们用发明的语言交流。这确保了纯信号：原始输出，没有艺术家偏见。一个解耦的身份艺术实验。

Khn 的循环踏板是递归管道。它们实时叠加复杂的吉他和贝斯，构建密集的音景。

刚刚发布：他们的新专辑 Vol. II，2026 年 4 月 3 日。

AI 音乐很常见。Angine de Poitrine 证明了人类艺术是终极非确定性函数。原始、复杂且深具人性。

你需要听听这个。

你最近遇到的最复杂系统是什么？ ``

浏览更多完整示例（种子、研究、帖子草稿、审阅、最终帖子+图片）请查看 examples/ 目录。

技术栈

组件	工具
LLM API	Google Gemini（通过 `google-genai` SDK）
MCP 框架	FastMCP
数据验证	Pydantic
设置	Pydantic Settings
可观测性	Opik
图片生成	Gemini Flash Image
质量保证	Ruff
包管理器	uv

入门

假设你有 Python 基础知识和对 LLM 的基本了解。

前提条件

要求	检查	安装
Python 3.12+	`python --version`	`uv python install 3.12` 或 python.org (https://www.python.org/downloads/)
uv 0.7+	`uv --version`	`curl -LsSf https://astral.sh/uv/install.sh \| sh`（文档 (https://docs.astral.sh/uv/getting-started/installation/)）
GNU Make	`make --version`	macOS/Linux 预装。Windows：`choco install make`
Google API Key	—	aistudio.google.com/apikey (https://aistudio.google.com/apikey)（必需——所有 LLM 调用使用 Gemini）
Opik 账户	—	comet.com/site/products/opik (https://www.comet.com/site/products/opik/)（可选，用于可观测性和评估）

安装

克隆并配置：

``bash git clone https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop.git cd designing-real-world-ai-agents-workshop cp .env.example .env

添加你的 GOOGLE_API_KEY（以及可选的 OPIK_API_KEY）

``
安装依赖：

bash uv sync

注意： 如果没有 Python 3.12+，uv 可以为你安装：uv python install 3.12，然后重新运行 uv sync。
验证设置：

``bash make test-end-to-end

运行研究 + 写作管道的端到端测试

``

如果完成时没有错误，就可以开始了。

运行代码

有四种方式运行工作流：

模式	适用场景
MCP 服务器（推荐）	与 AI 工具框架交互使用
技能	引导式斜杠命令工作流
Streamlit UI	带有实时进度的可视化端到端演示
脚本	验证设置、冒烟测试

MCP 服务器（推荐）

将服务器连接到兼容 MCP 的工具框架（Claude Code、Cursor）以进行交互使用。这是使用本研讨会的主要方式。

@pauliusztin_: 我们刚刚开源了完整的 @aiDotEngineer 研讨会！你可以克隆它并自行运行所有内容... → https://github…

iusztinpaul/designing-real-world-ai-agents-workshop

构建你自己的深度研究智能体 + 技术写作多智能体系统

当你准备好了，这里是如何深入

如何使用本仓库

你今天将构建什么

示例：端到端工作流

最终输出

1. 从一个种子开始

研究主题：AI 智能体架构——少即是多

关键问题

参考

2. 深度研究智能体生成 `research.md`

3. 编写指导原则

LinkedIn 帖子指导原则

主题

角度

目标受众

关键点

语气

4. 写作工作流优化帖子

技术栈

入门

前提条件

安装

添加你的 GOOGLE_API_KEY（以及可选的 OPIK_API_KEY）

运行研究 + 写作管道的端到端测试

运行代码

MCP 服务器（推荐）

相似文章

@jdnichollsc：@trq212 的《我们如何使用 Claude Code》工作坊：https://github.com/anthropics/cwc-workshops… 祝 Claude 编码愉快！<3 #AI #Clau…

@aiDotEngineer：反响极为热烈，我们提前完成剪辑——由 @Whats_AI @pauliusztin_ @towards_AI 带来的 2 小时全程工作坊

@zodchiii：Anthropic 官方详解如何用 Claude 构建 AI Agent，架构深度超越多数 AI 课程……

@angeldot_: Anthropic 发布了一篇关于如何仅用 AI Agent 构建公司的研讨会。Agent 之间互相协作，分工...

VoltAgent/awesome-agent-skills

提交意见反馈

iusztinpaul/designing-real-world-ai-agents-workshop

构建你自己的深度研究智能体 + 技术写作多智能体系统

当你准备好了，这里是如何深入

如何使用本仓库

你今天将构建什么

示例：端到端工作流

最终输出

1. 从一个种子开始

研究主题：AI 智能体架构——少即是多

关键问题

参考

2. 深度研究智能体生成 research.md

3. 编写指导原则

LinkedIn 帖子指导原则

主题

角度

目标受众

关键点

语气

4. 写作工作流优化帖子

技术栈

入门

前提条件

安装

添加你的 GOOGLE_API_KEY（以及可选的 OPIK_API_KEY）

运行研究 + 写作管道的端到端测试

运行代码

MCP 服务器（推荐）

相似文章

@jdnichollsc：@trq212 的《我们如何使用 Claude Code》工作坊：https://github.com/anthropics/cwc-workshops… 祝 Claude 编码愉快！<3 #AI #Clau…

@aiDotEngineer：反响极为热烈，我们提前完成剪辑——由 @Whats_AI @pauliusztin_ @towards_AI 带来的 2 小时全程工作坊

@zodchiii：Anthropic 官方详解如何用 Claude 构建 AI Agent，架构深度超越多数 AI 课程……

@angeldot_: Anthropic 发布了一篇关于如何仅用 AI Agent 构建公司的研讨会。Agent 之间互相协作，分工...

VoltAgent/awesome-agent-skills

提交意见反馈

2. 深度研究智能体生成 `research.md`