@pauliusztin_: 我们刚刚开源了完整的 @aiDotEngineer 研讨会!你可以克隆它并自行运行所有内容... → https://github…
摘要
一个开源研讨会仓库,用于构建真实世界的多智能体 AI 系统,包括深度研究智能体和 LinkedIn 写作工作流,使用 MCP 服务器、Pydantic 结构化输出以及带有 Claude Code 子智能体的智能体工程。
查看缓存全文
缓存时间: 2026/05/08 11:30
我们刚刚开源了完整的 @aiDotEngineer 研讨会!你可以克隆它并自己运行所有内容…… → https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop… 你将构建:
• 一个深度研究智能体(基于真实搜索 + YouTube 分析)
• 一个 LinkedIn 写作工作流(生成→审阅→编辑循环)
• 一个评估层来量化质量,而不是靠猜测
但这不仅仅是一组脚本。它是一个完整的多智能体系统,围绕以下内容构建:
• MCP 服务器(工具、资源、提示)
• 基于 Pydantic 的结构化输出
• 自主决策流程的工具使用智能体
• 可实际检查的端到端管道
你可以分三步走:
- 观看完整的约 2 小时研讨会
- 在实际输入上运行系统
- 按照 24 个指导工单从头重建一切
但有趣的部分来了……
你不需要手动重建。而是使用智能体工程来重建。
我们设置了:
• 一个软件工程师智能体
• Claude Code 子智能体
• 一个编排技能
这会处理所有 24 个工单并:
• 实现它们
• 测试它们
• 逐步迭代
因此你既能了解智能体如何工作,又能学习如何将智能体作为协作者来构建。
这正是我们在智能体 AI 工程课程中使用的系统……只是压缩到了大约 2 小时。
如果你阅读代码,会比观看 10 场演示理解得更深。
链接:https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop…
iusztinpaul/designing-real-world-ai-agents-workshop
来源:https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop
构建你自己的深度研究智能体 + 技术写作多智能体系统
这是一个实践研讨会,在 AI Engineering Conference Europe (https://www.ai.engineer/europe) 上展示,构建一个包含两个 MCP 服务器的多智能体 AI 系统:深度研究智能体 和 LinkedIn 写作工作流。两者都连接到类似 Claude Code 或 Cursor 的工具框架。
🎬 完整研讨会可在 YouTube (https://www.youtube.com/watch?v=mYSRn6PC1mc) 观看
↓
📑 幻灯片在此 (https://drive.google.com/file/d/1RWdS5VQYjz7a9y7NzHhAnyhGtxi6e0vt/view?usp=sharing)。
当你准备好了,这里是如何深入
这个研讨会是一个 2-4 小时的尝鲜。如果你想从零开始到交付生产级 AI 智能体,请查看我们的 智能体 AI 工程课程 (https://academy.towardsai.net/courses/agent-engineering?utm_source=github&utm_medium=aieng&utm_campaign=2026_aieng_workshop&utm_id=researchwriter),与 Towards AI 合作打造。
34 节课。三个端到端作品集项目。一张证书。以及一个可以直接联系行业专家和我们的 Discord 社区。
300+ 学生评分 5/5。前 6 节课免费:
从这里开始 → (https://academy.towardsai.net/courses/agent-engineering?utm_source=github&utm_medium=aieng&utm_campaign=2026_aieng_workshop&utm_id=researchwriter)
如何使用本仓库
三种方式使用本仓库。选择适合你时间的模式,或按顺序完成所有三种,因为每一步都建立在上一步之上:
-
观看研讨会并端到端理解模式。约 2 小时。
从上面的 2 小时 YouTube 研讨会 (https://www.youtube.com/watch?v=mYSRn6PC1mc) 和幻灯片 (https://drive.google.com/file/d/1RWdS5VQYjz7a9y7NzHhAnyhGtxi6e0vt/view?usp=sharing) 开始。你会对整个多智能体系统有一个心理模型:工具使用智能体、评估器-优化器循环、基于真实搜索、结构化 LLM 输出和 MCP 服务器设计。 -
运行完成的代码。看到它生成实际产物。约 30 分钟。
观看系统生成研究简报、通过评估器-优化器循环起草 LinkedIn 帖子,并使用 LLM-as-judge 给自己打分。按照 入门 和 运行代码 部分安装项目并运行 MCP 服务器、技能和评估管道。 -
通过智能体编码自己实现。在约 2-4 小时内从头构建 1:1 副本。
打开implement_yourself/,这是一个精简的框架,包含 25 个预处理的工单和一个自定义的/implementClaude Code 技能,它能编排 SWE 和 Tester 智能体循环地处理每个工单,直到目录与src/匹配。查看implement_yourself/README.md获取启动指南。
没有作弊,这是设计使然。
implement_yourself/是一个独立的项目。在你的工具框架(Claude Code、Cursor 等)中直接打开那个文件夹(而不是仓库根目录),这样工作目录就限定在框架内。智能体看不到../src/中的参考实现,不能 grep 它,也不能读取它的文件。你会得到一个真实的构建,而不是复制粘贴。
你今天将构建什么
深度研究智能体 — 一个 MCP 服务器,使用 Gemini 进行深度研究,结合 Google 搜索真实来源和原生 YouTube 视频分析:
用户主题 → [deep_research] × N → analyze_youtube_video(如果有网址) → [deep_research 填补空白] → compile_research → research.md
LinkedIn 写作工作流 — 一个 MCP 服务器,通过评估器-优化器循环生成 LinkedIn 帖子:
research.md + 指导原则 → 生成帖子 → [审阅 → 编辑] × N → post.md → 生成图片
两个服务器通过模型上下文协议 (https://modelcontextprotocol.io/) 暴露工具、资源和提示,允许任何兼容 MCP 的工具框架编排工作流。
你将学到的模式和概念:
- 工具使用智能体 — 让 LLM 决定何时调用哪些工具
- 评估器-优化器循环 — 在循环中生成、审阅、编辑
- 基于真实搜索 — Gemini 使用 Google 搜索真实来源进行事实性研究
- 结构化 LLM 输出 — 使用 Pydantic 模式确保类型安全的模型响应
- MCP 服务器设计 — 使用 FastMCP 注册工具、资源和提示
- LLM-as-judge 评估 — 使用 Opik 自动化质量评分
示例:端到端工作流
这是一个完整管道的实际运行——从一个主题种子到一篇带有 AI 生成图片的、可发布的 LinkedIn 帖子。
最终输出
Phil Tobaloo
AI 工程师 | 我交付 AI 产品并教你这个过程。
我们计划了 12 个 AI 智能体,但只交付了 1 个。结果效果更好。
听起来很疯狂,对吧?但这是一个常见的故事。
一个客户构建了一个 AI 营销聊天机器人。他们最初的设计有几十个智能体:编排器、验证器、垃圾信息预防。它失败了。
一个带工具的单一智能体胜出。任务是紧密耦合的。一个大脑维持上下文。工具仍然是专门的。
这是核心错误。人们过早地跳入复杂的多智能体设置。
把 AI 系统设计看作一个光谱:
- 工作流:你控制步骤。
- 单一智能体 + 工具:模型决定流程。
- 多智能体:多个决策者。
……
单一智能体适用于大多数情况。但它有局限性。工具太多?你会遇到“上下文腐烂”。超过约 10-20 个工具,LLM 在工具选择上会退化。它们会不堪重负。信息在中间丢失。
那么,什么时候才真正需要多智能体?……
能够可靠解决问题的最简单系统总是最好的系统。
不要过度设计你的 AI 智能体。先构建简单的。
你简化过的最复杂的智能体架构是什么?在下面告诉我。
阅读完整帖子
逐步分解(种子 → 研究 → 指导原则 → 草稿)
1. 从一个种子开始
一份简短的研究简报,包含 2-3 个问题和参考链接:
``markdown
研究主题:AI 智能体架构——少即是多
关键问题
- 为什么带有智能工具的单一智能体架构优于多智能体系统?
- 采用多智能体架构的唯一合理理由是什么?
参考
- 停止过度设计:工作流 vs AI 智能体解析(YouTube)
- 从 12 个智能体到 1 个(DecodingAI 文章) ``
2. 深度研究智能体生成 research.md
智能体运行多个 Gemini 基于真实搜索的查询,分析 YouTube 视频,然后将所有内容整合成一份带有来源的结构化研究简报。
此例子的完整 research.md 大约有 2 万个 token,涉及 2 个查询和 1 个视频转录。
3. 编写指导原则
一份简短的简报,描述帖子角度、受众和关键点:
``markdown
LinkedIn 帖子指导原则
主题
为什么大多数 AI 团队应该使用 1 个智能体而不是 12 个。
角度
以反直觉的“12 个智能体 → 1 个”作为开头。引入复杂度光谱。以一个清晰的思维模型结束。
目标受众
构建 LLM 驱动的应用的 AI 工程师和技术负责人。
关键点
- 一个团队计划了 12 个智能体,但只交付了 1 个——效果更好。
- 光谱:工作流 → 单一智能体 + 工具 → 多智能体。尽量靠左。
- “上下文腐烂”:超过约 10-20 个工具,LLM 在工具选择上退化。
- 只有 4 个合理的多智能体理由。
语气
直接、有主见、工程师对工程师。不说废话。 ``
4. 写作工作流优化帖子
评估器-优化器循环生成草稿,然后进行 3 轮审阅 + 编辑:
v0 — 初始草稿
我们计划了 12 个 AI 智能体。我们交付了 1 个。
听起来很疯狂,对吧?但这是一个常见的故事。
一个客户想要一个 AI 聊天机器人用于营销内容:邮件、短信、促销。他们最初的设计有几十个专门智能体:编排器、分析器、验证器、垃圾信息预防。
实际上?一个带工具的单一智能体胜出。任务是紧密耦合、顺序执行的。分割任务造成了信息孤岛和交接错误。[…]
能够可靠解决问题的最简单系统总是最好的系统。
v3 — 经过 3 轮审阅/编辑后
我们计划了 12 个 AI 智能体,但只交付了 1 个。效果更好。
一个客户构建了一个 AI 营销聊天机器人。他们最初的设计有几十个智能体:编排器、验证器、垃圾信息预防。它失败了。
一个带工具的单一智能体胜出。任务是紧密耦合的。一个大脑维持上下文。工具仍然是专门的。
尽可能靠左。只有在被迫时才向右移动。[…]
能够可靠解决问题的最简单系统总是最好的系统。
verbose, redundant phrasing, weak hook
Tighter, punchier, stronger structure
示例 2 — 工具框架工程(点击展开)
`` 工具框架工程并不仅仅是提示工程的新名词。它是 AI 的发展方向。
智能体变得足够有用,可以处理代码和工具,但它们不够可靠。它们会重复错误。瓶颈从代码生成转移到了实际系统中一致、可靠的行为。
这样想:提示工程是问什么。上下文工程是给模型发送什么。工具框架工程是整个系统如何运作。它是模型周围的环境,超越了单纯的 token。
汽车类比:模型是引擎。上下文是燃料。工具框架是汽车的其余部分:方向盘、刹车、车道边界。它防止崩溃。
工具框架包括工具、权限、状态、测试、日志、重试、检查点、护栏和评估。
别指望模型会改进。改进它的环境。责任落在我们建设者身上,防止重复错误。
我在我的 Claude Code 设置中使用自我反思。智能体学习我喜欢什么,节省 token 和时间。
真实公司已经在这么做了。Anthropic 的长期运行智能体将记忆外化到工件中。OpenAI 使用结构化文档和智能体对智能体审阅,零手动代码构建了一个 100 万行产品。Stripe 智能体在隔离环境中每周合并 1000+ 个 PR。LangChain 仅通过改变工具框架,就将编码智能体在 Terminal Bench 2.0 上从前 30 名之外提升到前 5 名。同一模型,更好的系统。
这不仅仅是针对编码智能体。这是软件构建的新方式。
程序员的工作正在转变:少写代码,多为智能体设计无故障运行的栖息地。想想机器可读的文档、评估、沙箱、权限边界和结构测试。
可靠性是真正的工作。不仅仅是提示。
LLM 正在进入系统、工作流、工具框架。价值来自编排、约束、反馈循环——而不仅仅是单个提示。
未来不是一个天才模型。而是处于精心设计环境中的模型。
这就是为什么工具框架工程很重要。这是当你停止演示智能并开始交付它时发生的事情。
想了解更多?我在最新视频中解释了所有内容:https://youtu.be/zYerCzIexCg
你现在构建可靠智能体系统最大的挑战是什么? ``
示例 3 — AI 工程师的 Angine de Poitrine(点击展开)
`` 忘了你最新的 AI 模型。有一个新系统正在席卷互联网:Angine de Poitrine。
这对来自魁北克的面具双人组部署了一个高分辨率音频架构。它让其他一切听起来都像低分辨率。
Khn 的定制双琴颈微分音吉他具有 2 倍分辨率:每八度 24 个音符,而不是 12 个。精细频率调制。Klek 用鼓支持他,驱动着感觉像 O(n^2) 拍子的节奏。纯粹的算法复杂度。
他们的声音:“达达毕达哥拉斯立体主义咒语摇滚。”东方传统遇到 Frank Zappa。
他们在 2026 年 2 月为 KEXP 进行的 27 分钟推理运行获得了 700 万+ 观看,并爆红网络。随后在纽约、伦敦、雷恩的演出全部售罄。
他们的匿名性又增加了一层。波尔卡圆点服装和纸浆面具是匿名推理端点。他们用发明的语言交流。这确保了纯信号:原始输出,没有艺术家偏见。一个解耦的身份艺术实验。
Khn 的循环踏板是递归管道。它们实时叠加复杂的吉他和贝斯,构建密集的音景。
刚刚发布:他们的新专辑 Vol. II,2026 年 4 月 3 日。
AI 音乐很常见。Angine de Poitrine 证明了人类艺术是终极非确定性函数。原始、复杂且深具人性。
你需要听听这个。
你最近遇到的最复杂系统是什么? ``
浏览更多完整示例(种子、研究、帖子草稿、审阅、最终帖子+图片)请查看
examples/目录。
技术栈
| 组件 | 工具 |
|---|---|
| LLM API | Google Gemini(通过 google-genai SDK) |
| MCP 框架 | FastMCP |
| 数据验证 | Pydantic |
| 设置 | Pydantic Settings |
| 可观测性 | Opik |
| 图片生成 | Gemini Flash Image |
| 质量保证 | Ruff |
| 包管理器 | uv |
入门
假设 你有 Python 基础知识和对 LLM 的基本了解。
前提条件
| 要求 | 检查 | 安装 |
|---|---|---|
| Python 3.12+ | python --version | uv python install 3.12 或 python.org (https://www.python.org/downloads/) |
| uv 0.7+ | uv --version | curl -LsSf https://astral.sh/uv/install.sh | sh(文档 (https://docs.astral.sh/uv/getting-started/installation/)) |
| GNU Make | make --version | macOS/Linux 预装。Windows:choco install make |
| Google API Key | — | aistudio.google.com/apikey (https://aistudio.google.com/apikey)(必需——所有 LLM 调用使用 Gemini) |
| Opik 账户 | — | comet.com/site/products/opik (https://www.comet.com/site/products/opik/)(可选,用于可观测性和评估) |
安装
-
克隆并配置:
``bash git clone https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop.git cd designing-real-world-ai-agents-workshop cp .env.example .env
添加你的 GOOGLE_API_KEY(以及可选的 OPIK_API_KEY)
``
-
安装依赖:
bash uv sync注意: 如果没有 Python 3.12+,uv 可以为你安装:
uv python install 3.12,然后重新运行uv sync。 -
验证设置:
``bash make test-end-to-end
运行研究 + 写作管道的端到端测试
``
如果完成时没有错误,就可以开始了。
运行代码
有四种方式运行工作流:
| 模式 | 适用场景 |
|---|---|
| MCP 服务器(推荐) | 与 AI 工具框架交互使用 |
| 技能 | 引导式斜杠命令工作流 |
| Streamlit UI | 带有实时进度的可视化端到端演示 |
| 脚本 | 验证设置、冒烟测试 |
MCP 服务器(推荐)
将服务器连接到兼容 MCP 的工具框架(Claude Code、Cursor)以进行交互使用。这是使用本研讨会的主要方式。
相似文章
@jdnichollsc:@trq212 的《我们如何使用 Claude Code》工作坊:https://github.com/anthropics/cwc-workshops… 祝 Claude 编码愉快!<3 #AI #Clau…
Anthropic 发布了“Code with Claude”工作坊材料,涵盖模型选择、多智能体系统、AI辅助产品工作流以及基于评估的智能体开发。
@aiDotEngineer:反响极为热烈,我们提前完成剪辑——由 @Whats_AI @pauliusztin_ @towards_AI 带来的 2 小时全程工作坊
原定稍后发布的 2 小时 AI 工作坊因人气爆棚而提前上线,现可在 AI Engineer YouTube 频道免费观看。
@zodchiii:Anthropic 官方详解如何用 Claude 构建 AI Agent,架构深度超越多数 AI 课程……
Anthropic 联合 AWS 带来现场演示,手把手教你用 Claude 搭建 AI Agent,涵盖架构、工具、记忆、编排与部署全流程。
@angeldot_: Anthropic 发布了一篇关于如何仅用 AI Agent 构建公司的研讨会。Agent 之间互相协作,分工...
Anthropic 发布了一个免费研讨会,内容是如何仅使用 AI Agent 构建一家公司,这些 Agent 互相协作并自动执行流程。
VoltAgent/awesome-agent-skills
精选 GitHub 仓库,收录 1100+ 来自 Anthropic、Google、Stripe、Vercel 等主流开发团队的实战 AI Agent 技能,兼容 Claude Code、Codex、Cursor 及其他 AI 编程助手。