@pauliusztin_: 我们刚刚开源了完整的 @aiDotEngineer 研讨会!你可以克隆它并自行运行所有内容... → https://github…

X AI KOLs Timeline 工具

摘要

一个开源研讨会仓库,用于构建真实世界的多智能体 AI 系统,包括深度研究智能体和 LinkedIn 写作工作流,使用 MCP 服务器、Pydantic 结构化输出以及带有 Claude Code 子智能体的智能体工程。

我们刚刚开源了完整的 @aiDotEngineer 研讨会!你可以克隆它并自行运行所有内容... → https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop… 你将构建: • 一个深度研究智能体(基于搜索 + YouTube 分析) • 一个 LinkedIn 写作工作流(生成 → 审核 → 编辑循环) • 一个评估层,用于衡量质量而非猜测 但这不仅仅是一组脚本。它是一个完整的围绕以下内容构建的多智能体系统: • MCP 服务器(工具、资源、提示) • 使用 Pydantic 的结构化输出 • 自主决定流程的工具使用智能体 • 你可以实际检查的端到端管道 你可以通过 3 个步骤完成: 1. 观看完整的约 2 小时研讨会 2. 在真实输入上运行系统 3. 使用 24 个引导工单自行重建所有内容 但有趣的是...你不需要手动重建。你使用智能体工程来完成。我们设置了: • 一个软件工程师智能体 • Claude Code 子智能体 • 一个编排技能 这处理所有 24 个工单并: • 实现它们 • 测试它们 • 逐步迭代 所以你既学习智能体如何工作,也学习如何将智能体作为协作者进行构建。这就是我们在 Agentic AI Engineering 课程中使用和教授的系统...只是压缩到约 2 小时内。 如果你阅读代码,你会比观看 10 个演示理解得更多。链接:https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop…
查看原文 导出为 Word 导出为 PDF
查看缓存全文

缓存时间: 2026/05/08 11:30

我们刚刚开源了完整的 @aiDotEngineer 研讨会!你可以克隆它并自己运行所有内容…… → https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop… 你将构建:
• 一个深度研究智能体(基于真实搜索 + YouTube 分析)
• 一个 LinkedIn 写作工作流(生成→审阅→编辑循环)
• 一个评估层来量化质量,而不是靠猜测

但这不仅仅是一组脚本。它是一个完整的多智能体系统,围绕以下内容构建:
• MCP 服务器(工具、资源、提示)
• 基于 Pydantic 的结构化输出
• 自主决策流程的工具使用智能体
• 可实际检查的端到端管道

你可以分三步走:

  1. 观看完整的约 2 小时研讨会
  2. 在实际输入上运行系统
  3. 按照 24 个指导工单从头重建一切

但有趣的部分来了……
你不需要手动重建。而是使用智能体工程来重建。
我们设置了:
• 一个软件工程师智能体
• Claude Code 子智能体
• 一个编排技能

这会处理所有 24 个工单并:
• 实现它们
• 测试它们
• 逐步迭代

因此你既能了解智能体如何工作,又能学习如何将智能体作为协作者来构建。
这正是我们在智能体 AI 工程课程中使用的系统……只是压缩到了大约 2 小时。
如果你阅读代码,会比观看 10 场演示理解得更深。

链接:https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop…


iusztinpaul/designing-real-world-ai-agents-workshop

来源:https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop

构建你自己的深度研究智能体 + 技术写作多智能体系统

这是一个实践研讨会,在 AI Engineering Conference Europe (https://www.ai.engineer/europe) 上展示,构建一个包含两个 MCP 服务器的多智能体 AI 系统:深度研究智能体LinkedIn 写作工作流。两者都连接到类似 Claude Code 或 Cursor 的工具框架。

🎬 完整研讨会可在 YouTube (https://www.youtube.com/watch?v=mYSRn6PC1mc) 观看

📑 幻灯片在此 (https://drive.google.com/file/d/1RWdS5VQYjz7a9y7NzHhAnyhGtxi6e0vt/view?usp=sharing)。


当你准备好了,这里是如何深入

这个研讨会是一个 2-4 小时的尝鲜。如果你想从零开始到交付生产级 AI 智能体,请查看我们的 智能体 AI 工程课程 (https://academy.towardsai.net/courses/agent-engineering?utm_source=github&utm_medium=aieng&utm_campaign=2026_aieng_workshop&utm_id=researchwriter),与 Towards AI 合作打造。

34 节课。三个端到端作品集项目。一张证书。以及一个可以直接联系行业专家和我们的 Discord 社区。
300+ 学生评分 5/5。前 6 节课免费:
从这里开始 → (https://academy.towardsai.net/courses/agent-engineering?utm_source=github&utm_medium=aieng&utm_campaign=2026_aieng_workshop&utm_id=researchwriter)


如何使用本仓库

三种方式使用本仓库。选择适合你时间的模式,或按顺序完成所有三种,因为每一步都建立在上一步之上:

  1. 观看研讨会并端到端理解模式。约 2 小时。
    从上面的 2 小时 YouTube 研讨会 (https://www.youtube.com/watch?v=mYSRn6PC1mc) 和幻灯片 (https://drive.google.com/file/d/1RWdS5VQYjz7a9y7NzHhAnyhGtxi6e0vt/view?usp=sharing) 开始。你会对整个多智能体系统有一个心理模型:工具使用智能体、评估器-优化器循环、基于真实搜索、结构化 LLM 输出和 MCP 服务器设计。

  2. 运行完成的代码。看到它生成实际产物。约 30 分钟。
    观看系统生成研究简报、通过评估器-优化器循环起草 LinkedIn 帖子,并使用 LLM-as-judge 给自己打分。按照 入门运行代码 部分安装项目并运行 MCP 服务器、技能和评估管道。

  3. 通过智能体编码自己实现。在约 2-4 小时内从头构建 1:1 副本。
    打开 implement_yourself/,这是一个精简的框架,包含 25 个预处理的工单和一个自定义的 /implement Claude Code 技能,它能编排 SWE 和 Tester 智能体循环地处理每个工单,直到目录与 src/ 匹配。查看 implement_yourself/README.md 获取启动指南。

没有作弊,这是设计使然。 implement_yourself/ 是一个独立的项目。在你的工具框架(Claude Code、Cursor 等)中直接打开那个文件夹(而不是仓库根目录),这样工作目录就限定在框架内。智能体看不到 ../src/ 中的参考实现,不能 grep 它,也不能读取它的文件。你会得到一个真实的构建,而不是复制粘贴。

你今天将构建什么

深度研究智能体 — 一个 MCP 服务器,使用 Gemini 进行深度研究,结合 Google 搜索真实来源和原生 YouTube 视频分析:

用户主题 → [deep_research] × N → analyze_youtube_video(如果有网址) → [deep_research 填补空白] → compile_research → research.md

LinkedIn 写作工作流 — 一个 MCP 服务器,通过评估器-优化器循环生成 LinkedIn 帖子:

research.md + 指导原则 → 生成帖子 → [审阅 → 编辑] × N → post.md → 生成图片

两个服务器通过模型上下文协议 (https://modelcontextprotocol.io/) 暴露工具、资源和提示,允许任何兼容 MCP 的工具框架编排工作流。

你将学到的模式和概念:

  • 工具使用智能体 — 让 LLM 决定何时调用哪些工具
  • 评估器-优化器循环 — 在循环中生成、审阅、编辑
  • 基于真实搜索 — Gemini 使用 Google 搜索真实来源进行事实性研究
  • 结构化 LLM 输出 — 使用 Pydantic 模式确保类型安全的模型响应
  • MCP 服务器设计 — 使用 FastMCP 注册工具、资源和提示
  • LLM-as-judge 评估 — 使用 Opik 自动化质量评分

示例:端到端工作流

这是一个完整管道的实际运行——从一个主题种子到一篇带有 AI 生成图片的、可发布的 LinkedIn 帖子。

最终输出

Phil Tobaloo
AI 工程师 | 我交付 AI 产品并教你这个过程。


我们计划了 12 个 AI 智能体,但只交付了 1 个。结果效果更好。

听起来很疯狂,对吧?但这是一个常见的故事。

一个客户构建了一个 AI 营销聊天机器人。他们最初的设计有几十个智能体:编排器、验证器、垃圾信息预防。它失败了。

一个带工具的单一智能体胜出。任务是紧密耦合的。一个大脑维持上下文。工具仍然是专门的。

这是核心错误。人们过早地跳入复杂的多智能体设置。

把 AI 系统设计看作一个光谱:

  • 工作流:你控制步骤。
  • 单一智能体 + 工具:模型决定流程。
  • 多智能体:多个决策者。

……

单一智能体适用于大多数情况。但它有局限性。工具太多?你会遇到“上下文腐烂”。超过约 10-20 个工具,LLM 在工具选择上会退化。它们会不堪重负。信息在中间丢失。

那么,什么时候才真正需要多智能体?……

能够可靠解决问题的最简单系统总是最好的系统。
不要过度设计你的 AI 智能体。先构建简单的。

你简化过的最复杂的智能体架构是什么?在下面告诉我。

阅读完整帖子

逐步分解(种子 → 研究 → 指导原则 → 草稿)

1. 从一个种子开始

一份简短的研究简报,包含 2-3 个问题和参考链接:

``markdown

研究主题:AI 智能体架构——少即是多

关键问题

  1. 为什么带有智能工具的单一智能体架构优于多智能体系统?
  2. 采用多智能体架构的唯一合理理由是什么?

参考

  • 停止过度设计:工作流 vs AI 智能体解析(YouTube)
  • 从 12 个智能体到 1 个(DecodingAI 文章) ``

2. 深度研究智能体生成 research.md

智能体运行多个 Gemini 基于真实搜索的查询,分析 YouTube 视频,然后将所有内容整合成一份带有来源的结构化研究简报。

此例子的完整 research.md 大约有 2 万个 token,涉及 2 个查询和 1 个视频转录。

3. 编写指导原则

一份简短的简报,描述帖子角度、受众和关键点:

``markdown

LinkedIn 帖子指导原则

主题

为什么大多数 AI 团队应该使用 1 个智能体而不是 12 个。

角度

以反直觉的“12 个智能体 → 1 个”作为开头。引入复杂度光谱。以一个清晰的思维模型结束。

目标受众

构建 LLM 驱动的应用的 AI 工程师和技术负责人。

关键点

  • 一个团队计划了 12 个智能体,但只交付了 1 个——效果更好。
  • 光谱:工作流 → 单一智能体 + 工具 → 多智能体。尽量靠左。
  • “上下文腐烂”:超过约 10-20 个工具,LLM 在工具选择上退化。
  • 只有 4 个合理的多智能体理由。

语气

直接、有主见、工程师对工程师。不说废话。 ``

4. 写作工作流优化帖子

评估器-优化器循环生成草稿,然后进行 3 轮审阅 + 编辑:

v0 — 初始草稿

我们计划了 12 个 AI 智能体。我们交付了 1 个。

听起来很疯狂,对吧?但这是一个常见的故事。

一个客户想要一个 AI 聊天机器人用于营销内容:邮件、短信、促销。他们最初的设计有几十个专门智能体:编排器、分析器、验证器、垃圾信息预防。

实际上?一个带工具的单一智能体胜出。任务是紧密耦合、顺序执行的。分割任务造成了信息孤岛和交接错误。[…]

能够可靠解决问题的最简单系统总是最好的系统。

v3 — 经过 3 轮审阅/编辑后

我们计划了 12 个 AI 智能体,但只交付了 1 个。效果更好。

一个客户构建了一个 AI 营销聊天机器人。他们最初的设计有几十个智能体:编排器、验证器、垃圾信息预防。它失败了。

一个带工具的单一智能体胜出。任务是紧密耦合的。一个大脑维持上下文。工具仍然是专门的。

尽可能靠左。只有在被迫时才向右移动。[…]

能够可靠解决问题的最简单系统总是最好的系统。

verbose, redundant phrasing, weak hook
Tighter, punchier, stronger structure

示例 2 — 工具框架工程(点击展开)

`` 工具框架工程并不仅仅是提示工程的新名词。它是 AI 的发展方向。

智能体变得足够有用,可以处理代码和工具,但它们不够可靠。它们会重复错误。瓶颈从代码生成转移到了实际系统中一致、可靠的行为。

这样想:提示工程是问什么。上下文工程是给模型发送什么。工具框架工程是整个系统如何运作。它是模型周围的环境,超越了单纯的 token。

汽车类比:模型是引擎。上下文是燃料。工具框架是汽车的其余部分:方向盘、刹车、车道边界。它防止崩溃。

工具框架包括工具、权限、状态、测试、日志、重试、检查点、护栏和评估。

别指望模型会改进。改进它的环境。责任落在我们建设者身上,防止重复错误。

我在我的 Claude Code 设置中使用自我反思。智能体学习我喜欢什么,节省 token 和时间。

真实公司已经在这么做了。Anthropic 的长期运行智能体将记忆外化到工件中。OpenAI 使用结构化文档和智能体对智能体审阅,零手动代码构建了一个 100 万行产品。Stripe 智能体在隔离环境中每周合并 1000+ 个 PR。LangChain 仅通过改变工具框架,就将编码智能体在 Terminal Bench 2.0 上从前 30 名之外提升到前 5 名。同一模型,更好的系统。

这不仅仅是针对编码智能体。这是软件构建的新方式。

程序员的工作正在转变:少写代码,多为智能体设计无故障运行的栖息地。想想机器可读的文档、评估、沙箱、权限边界和结构测试。

可靠性是真正的工作。不仅仅是提示。

LLM 正在进入系统、工作流、工具框架。价值来自编排、约束、反馈循环——而不仅仅是单个提示。

未来不是一个天才模型。而是处于精心设计环境中的模型。

这就是为什么工具框架工程很重要。这是当你停止演示智能并开始交付它时发生的事情。

想了解更多?我在最新视频中解释了所有内容:https://youtu.be/zYerCzIexCg

你现在构建可靠智能体系统最大的挑战是什么? ``

示例 3 — AI 工程师的 Angine de Poitrine(点击展开)

`` 忘了你最新的 AI 模型。有一个新系统正在席卷互联网:Angine de Poitrine。

这对来自魁北克的面具双人组部署了一个高分辨率音频架构。它让其他一切听起来都像低分辨率。

Khn 的定制双琴颈微分音吉他具有 2 倍分辨率:每八度 24 个音符,而不是 12 个。精细频率调制。Klek 用鼓支持他,驱动着感觉像 O(n^2) 拍子的节奏。纯粹的算法复杂度。

他们的声音:“达达毕达哥拉斯立体主义咒语摇滚。”东方传统遇到 Frank Zappa。

他们在 2026 年 2 月为 KEXP 进行的 27 分钟推理运行获得了 700 万+ 观看,并爆红网络。随后在纽约、伦敦、雷恩的演出全部售罄。

他们的匿名性又增加了一层。波尔卡圆点服装和纸浆面具是匿名推理端点。他们用发明的语言交流。这确保了纯信号:原始输出,没有艺术家偏见。一个解耦的身份艺术实验。

Khn 的循环踏板是递归管道。它们实时叠加复杂的吉他和贝斯,构建密集的音景。

刚刚发布:他们的新专辑 Vol. II,2026 年 4 月 3 日。

AI 音乐很常见。Angine de Poitrine 证明了人类艺术是终极非确定性函数。原始、复杂且深具人性。

你需要听听这个。

你最近遇到的最复杂系统是什么? ``

浏览更多完整示例(种子、研究、帖子草稿、审阅、最终帖子+图片)请查看 examples/ 目录。

技术栈

组件工具
LLM APIGoogle Gemini(通过 google-genai SDK)
MCP 框架FastMCP
数据验证Pydantic
设置Pydantic Settings
可观测性Opik
图片生成Gemini Flash Image
质量保证Ruff
包管理器uv

入门

假设 你有 Python 基础知识和对 LLM 的基本了解。

前提条件

要求检查安装
Python 3.12+python --versionuv python install 3.12 或 python.org (https://www.python.org/downloads/)
uv 0.7+uv --versioncurl -LsSf https://astral.sh/uv/install.sh | sh(文档 (https://docs.astral.sh/uv/getting-started/installation/))
GNU Makemake --versionmacOS/Linux 预装。Windows:choco install make
Google API Keyaistudio.google.com/apikey (https://aistudio.google.com/apikey)(必需——所有 LLM 调用使用 Gemini)
Opik 账户comet.com/site/products/opik (https://www.comet.com/site/products/opik/)(可选,用于可观测性和评估)

安装

  1. 克隆并配置:

    ``bash git clone https://github.com/iusztinpaul/designing-real-world-ai-agents-workshop.git cd designing-real-world-ai-agents-workshop cp .env.example .env

    添加你的 GOOGLE_API_KEY(以及可选的 OPIK_API_KEY)

    ``

  2. 安装依赖:

    bash uv sync

    注意: 如果没有 Python 3.12+,uv 可以为你安装:uv python install 3.12,然后重新运行 uv sync

  3. 验证设置:

    ``bash make test-end-to-end

    运行研究 + 写作管道的端到端测试

    ``

    如果完成时没有错误,就可以开始了。

运行代码

有四种方式运行工作流:

模式适用场景
MCP 服务器(推荐)与 AI 工具框架交互使用
技能引导式斜杠命令工作流
Streamlit UI带有实时进度的可视化端到端演示
脚本验证设置、冒烟测试

MCP 服务器(推荐)

将服务器连接到兼容 MCP 的工具框架(Claude Code、Cursor)以进行交互使用。这是使用本研讨会的主要方式。

相似文章

VoltAgent/awesome-agent-skills

GitHub Trending (daily)

精选 GitHub 仓库,收录 1100+ 来自 Anthropic、Google、Stripe、Vercel 等主流开发团队的实战 AI Agent 技能,兼容 Claude Code、Codex、Cursor 及其他 AI 编程助手。