@Voxyz_ai: https://x.com/Voxyz_ai/status/2062246736257556654

X AI KOLs Timeline 工具

摘要

本文详细介绍了如何构建用于投资研究的多智能体AI团队,使用了像TradingAgents和Bloome平台这样的开源项目。它强调,有效智能体协作的关键在于组织架构,而非模型智能。

https://t.co/PPK20LwoMC
查看原文
查看缓存全文

缓存时间: 2026/06/04 03:59

我用 AI 克隆了巴菲特和格雷厄姆,让他们组队帮我自动做投资研究

从二月份开始,我一直在运行多智能体团队。写内容、发代码、做研究。我收到最多的问题是:你怎么让它们真的一起工作?

答案和模型本身没半毛钱关系。过去几个月我犯的最大错误就是以为更聪明的模型会带来更好的结果。真正起决定作用的是你怎么安排它们的位置、怎么拆分工作、怎么设置对立面。升级的是组织架构,不是模型。

最近我遇到两个开源项目:TradingAgents(8.1 万颗星)和 AI Hedge Fund(5.9 万颗星)。表面上看,它们都是投资研究框架,但我越看越觉得有意思:它们把我自己摸索出来的那套团队协作结构清晰地摆了出来——分析师并行收集信息,多头/空头研究员辩论,交易员综合,风控团队挑刺,投资组合经理做最终批准。两个项目都明确说了:这是用于研究目的的工程模式,不是投资建议。

投资研究只是壳。真正值得研究的是底层的智能体团队架构。

这篇文章会拆解这套结构,附带一个你可以直接拿来用的团队搭建模板。我关心的是智能体团队如何分工、如何互相检查、如何留下可追溯的记录。投资研究恰好是噪音最大、风险最高、协作质量体现得最快的一个场景。

整个项目我都在 Bloome 上搭建。最简单的理解方式:一个群聊,里面有些成员是 AI 智能体而不是真人。你像添加联系人一样把它们加进来,给每个角色设定职责,它们在同一个线程里互相交流,也和你交流。

一个可用的智能体团队必须通过五道关卡

经过几个月在不同领域搭建智能体团队,我把它归结为五件事:

智能体团队:五道关卡清单

1. 入口:先澄清坏问题。不清楚就不干活。
2. 专家:每个角色只保留一个判断角度。
3. 对手:强制反方论点。别让团队变成回音室。
4. 主导:只分配工作、综合信息、做记录。不发表意见。
5. 备忘录:输出可追溯的记录,不是一句神谕。

没有入口,团队会认真地回答错误的问题。 没有专家,各种视角混成一团浆糊。 没有对手,大家互相吹捧到翻车。 没有主导,你得到的是一堆零散的碎片。 没有备忘录,下次还会犯同样的错误。

TradingAgents 之所以火起来,就是因为它把一个高风险的判断问题拆解成了这样一个组织流程。每一步都有文档记录,每一步都可追溯。这和“AI 炒股”毫无关系。

这五道关卡需要一个房间

在单个聊天窗口里很难运行这五道关卡。

当然,你可以写一个提示词:“请扮演巴菲特、格雷厄姆、多头、空头和主导者。”但这样还是一个模型在同一口气里扮演五个角色。它们没有真正的座位。它们也无法真正互相看见。最常见的结果:声音听起来不同,但最终判断还是一锅粥。

我需要一个地方,让多个智能体能真正互相看见。这正是 Bloome 给你的:人类和智能体在同一个群聊里,每个智能体有自己的角色卡和边界。主导者是群里的一个真实成员,有自己的上下文,而不是藏在提示词里的一段指令。多头和空头是两个独立的智能体,可以面对面地反驳,而不是同一段回复里的两段话。

你 @everyone 丢一个问题,它们分解问题、互相反驳、在同一个线程里辩论。然后主导者把结果汇总成备忘录。这就像把几个同事拉进群聊开会,只不过这些同事不会因为礼貌而妥协,但如果你没有写清楚角色边界,它们会互相踩脚。

Bloome 在这篇文章里是个配角。它的作用很简单:把那五道关卡变成一个可见的过程。

这些关卡如何映射到群聊上

Bloome 群聊        = 会议室
智能体成员         = 判断席位
角色卡             = 每个人的职位描述
@everyone 问题    = 入口点
多头/空头对话     = 反确认偏误机制
主导者最终总结    = 决策备忘录

搭建团队本身不难。难的是为每个智能体写清楚边界:它负责什么、它不能碰什么、什么时候必须交给主导者。

下面,我会用投资研究这个场景来详细跑一遍所有五道关卡。

关卡 1:主导者先拒绝坏问题

我在 Bloome 上建立了投资研究团队,第一件事就是 @everyone:把一千万投到电动汽车上,会怎么样?

我等着有人扔给我一只股票。没人扔。

主导者扣住了问题,然后反推回来:

主导入口关卡

对于任何研究问题,主导者先问五件事:

1. 时间跨度:你看多长?
2. 风险:你能承受的最大回撤是多少?
3. 范围:哪个市场?A股、港股、美股?
4. 目标:学习、研究、模拟、还是准备实际决策?
5. 约束:有什么不能碰的?杠杆、期权、单只股票?

如果这五件事不清楚,分析就不开始。

我丢了一个坏问题。主导者没有急于回答,这是这个系统有效运转的第一个信号。一个好的主导者在展示自己之前,先把问题塑造成可回答的形态。

我回复:美元,三到五年。这时它才开绿灯,开始分配工作。

关卡 2:角色不是人设。它们是过滤器。

我为团队配备了 AI 巴菲特和 AI 格雷厄姆。但克隆投资传奇正是大多数人会犯错的地方。

错误做法:“你是巴菲特。请用巴菲特的口吻分析这只股票。”

那只会给你一个角色扮演机器人。正确的做法是把大师翻译成一组判断过滤器:

AI 巴菲特角色卡

工作:仅关注长期质量和业务持久性。不涉及短期价格目标。
输入:护城河、现金流质量、管理层、资本配置、长期行业结构。
输出:
- 这家公司10年后还会存在吗?
- 护城河来自哪里?
- 现金流能否扛过周期?
- 哪个假设如果错了会摧毁长期逻辑?
禁止:不能因为短期价格变动而改变长期判断。
停止:如果业务本身无法理解,必须说“超出能力圈”。

AI 格雷厄姆角色卡

工作:仅关注安全边际和下行保护。不涉及长期故事。
输入:估值、资产负债表、现金流、历史估值区间、最坏情况。
输出:
- 当前价格是否有安全边际?
- 最坏情况下可能亏多少?
- 什么价格开始变得有吸引力?
- 还需要什么数据?
禁止:不能用“这是家好公司”代替估值。
停止:如果数据不足以计算安全边际,必须说“不足以计算”。

让一个大师级智能体有价值的是它背后稳定的过滤器。它听起来像不像真人几乎不重要。AI Hedge Fund 项目也是同样的做法:格雷厄姆被定义为“只买有安全边际的隐藏宝石”,巴菲特是“寻找价格合理的优秀公司”。大师人设被翻译成可执行的过滤器。

为什么偏偏是这两个?因为巴菲特和格雷厄姆天然就是意见对立的。一个总是看十年后的世界。另一个只关心今天的安全垫。你不需要人为制造冲突。他们的投资哲学本身就是对立的。选角的关键:角色之间的张力应该是内置的,而不是强加的。

在 Bloome 上克隆一个角色只需要几秒钟。整个团队几分钟就能建好。

我建立的团队:财务主导者、巴菲特、格雷厄姆、多头、空头。

关卡 3:对立双方不是演戏。它们是反确认偏误。

单个 AI 最大的缺陷是它太想讨好你了。你说什么它都同意。换模型解决不了这个问题。你得从架构上修复它。

除了巴菲特和格雷厄姆,我还在团队里加了一个死硬多头和一个死硬空头。它们的工作不是发表意见。而是把两边都推向极端:

多头/空头辩论协议

第一轮:
多头只写最强看多理由。不提风险。
空头只写最强看空理由。不留余地。

第二轮:
多头必须回应空头最强的三个攻击点。
空头必须找出多头三个关键假设。

第三轮:
双方都写:
- 如果我错了,最可能的原因是什么?
- 什么证据会让我改变观点?
- 哪些数据最值得进一步调查?

主导者只收集三样东西:
1. 双方都认可的事实。
2. 双方真正有分歧的假设。
3. 需要验证的下一步。

实践中,巴菲特智能体不断把话题拉回到一个点上:这家公司十年后还会在吗?格雷厄姆智能体不接这个茬。它只关心一件事:当前价格是否留有足够的安全垫,以及它能跌到什么程度。一个看十年,一个看下行空间。它们在同一只股票上来回交锋,谁也说服不了谁。

到最后,分歧从情绪层面转移到了可验证的假设上。这比选出一个赢家有用得多。

主导者把双方的观点综合成一个我能真正理解的结论。

巴菲特判断长期质量,格雷厄姆判断安全边际,主导者在中间综合。

关卡 4:为什么单助手模式在这里碰壁

我向一个默认的单个助手问了一个类似的问题。它迅速进入了合规模式:我不能提供投资建议。

这不算坏事。金融问题确实不应该由一个单助手给出草率的答案。

问题在于:单助手模式只有一个出口。它要么直接回答,要么拒绝。智能体团队增加了一个中间层:它把“给我推荐一只股票”变成了“组织一个研究流程”。

于是主导者问约束条件,专家们分解视角,多头/空头摆出分歧,最终备忘录只给出下一步研究步骤,从不给买入/卖出指令。

底层的模型没有变。变化的是问题被放置到了一个组织流程中。

关卡 5:输出不是一个答案。它是一份决策备忘录。

一个好的智能体团队应该输出一份可追溯的决策记录:

决策备忘录模板

问题:原始问题

范围:时间跨度 / 市场 / 风险承受度 / 数据范围

基准情形:最可能的情景
看多情形:最强看多论点
看空情形:最强看空论点

关键假设:
1. ...
2. ...
3. ...

失效条件:必须发生什么事才能使这个结论作废

风险:
- 市场风险
- 数据风险
- 模型幻觉风险

下一步行动:下一步研究(不是买入/卖出建议)
置信度:低 / 中 / 高,附推理过程

当我问到把一千万投到电动汽车上时,我得到的不是“买”或“不买”。而是一份文档,列出了双方论点、关键假设、以及结论失效的条件。

最新版本的 TradingAgents 加入了一个持久化的决策日志。AI Hedge Fund 也强调智能体的推理必须可调试。它们独立得出了同样的结论:无论智能体团队输出什么,你必须能在事后追溯审查。

这套方法不限于投资研究

这次 Bloome 只是房间,不是方法的边界。

我用投资研究作为压力测试,因为它噪音大、风险高,而且最快能看出团队是否在互相校验。换成内容、代码、产品、销售,仍然是同样的五道关卡:

  • 投资。 收集者:新闻、文件、技术指标。专家:巴菲特、格雷厄姆。对手:多头、空头、风控。主导者:投资经理。

  • 内容。 收集者:素材收集。专家:写手。对手:事实核查、质疑。主导者:编辑。

  • 代码。 收集者:代码库阅读者。专家:实施者。对手:审查者、安全。主导者:技术负责人。

  • 产品。 收集者:用户反馈。专家:产品经理智能体。对手:怀疑用户。主导者:创始人。

  • 销售。 收集者:线索研究。专家:客户策略师。对手:异议处理者。主导者:销售负责人。

多智能体的价值不在于有更多智能体。而在于让一个问题通过多个判断席位。

亲自来 @ 这个团队

我没有把这个团队藏在一张截图后面。这就是我实际构建的那个群组。同样的主导者、同样的 AI 巴菲特和格雷厄姆、同样的死硬多头和空头,全挤在一个聊天室里。走进去,@ 整个团队,丢一个你自己的问题。

我还没有把它放进竞技场。这篇文章是一本团队搭建笔记,不是一场比赛回放。但如果你想看完全自动化的团队在同样的任务、同样的数据、同样的模拟约束下正面交锋,去看看 Bloome Arena。重点不是谁在一轮里赚得最多。而是看不同团队如何分工、如何犯错、如何综合。

Bloome 实时交易竞技场:智能体团队在同样的资金下公开竞争。

投资研究只是压力测试。真正值得关注的是一个智能体团队在公开环境中展现出的组织能力。

声明一下

这是一个在模拟交易平台上运行的实验。我不懂投资,这篇文章也不是股票建议。我克隆的是基于公开投资理念构建的 AI 角色。它们和真实人物没有任何关系。从头到尾,我好奇的只是团队如何协作。它最后选了哪只股票?我老实讲没有太在意。

单个 AI 就像一个能说会道的实习生。一个好的智能体团队更像一个小会议室。你的工作不是让它们都变得更聪明。而是安排谁来收集信息、谁来唱反调、谁来标记风险、最后谁来收拾桌面。

参考资料

  • TradingAgents:开源多智能体投资研究框架,8.1 万颗星。将高风险判断拆解为可编排、可追溯的协作流程(研究目的)。

  • AI Hedge Fund:开源投资传奇智能体系统,5.9 万颗星。证明大师人设可以翻译成可执行的过滤器(教育目的)。

  • Bloome(bloome.im):多智能体消息平台,智能体以队友身份加入你的群聊。

  • Alpaca Paper Trading:模拟交易平台,无需真实资金测试策略。

相似文章

如何组建一支 AI 团队?

Reddit r/AI_Agents

本文概述了部署和监控 AI Agent 团队的关键最佳实践,强调精确的岗位定义、持续监督以及稳定的云基础设施。文章评估了多种 Agent 运行时(runtime)和托管平台,并将其运营成本与传统人类角色进行了对比。

我们如何构建多智能体研究系统

Anthropic Engineering

Anthropic 详细介绍了其全新多智能体研究系统背后的架构与工程原则,重点阐述了采用 Claude Opus 4 和 Sonnet 4 的并行子智能体如何在复杂研究任务中显著优于单智能体方案。