@RohOnChain: https://x.com/RohOnChain/status/2069056530960490835

X AI KOLs Timeline 新闻

摘要

作者解释了如何使用AI循环工程构建一个自我改进的量化交易系统,其中AI运行循环以自主提示、验证和行动,与手动提示形成对比。

https://t.co/JRsWSeUfrN
查看原文
查看缓存全文

缓存时间: 2026/06/23 06:01

如何用循环工程构建自优化的量化交易系统

我将精确拆解如何构建能独立运行整个量化交易系统的循环。

直接进入正题。

收藏本文 - 我是Roan,一名后端开发者,专注于系统设计、高频交易风格执行和量化交易系统。我的工作聚焦于预测市场在真实负载下的行为。如有任何建议、深思熟虑的合作或合作意向,私信开放。

从今天开始我要做一件事。

如果你正在构建量化系统,即将开始甚至只是考虑这件事,私信告诉我你在做什么,或者直接在这篇文章下回复,我会联系你(哪怕你只是给我看当前架构的截图)。我将亲自走完前20个配置,向你展示你现有的东西与一个真正产生Alpha的系统之间的差距。

大多数量化交易者仍然在给Claude输入提示词。他们打字。他们等待。他们阅读输出。他们再次打字。

这个星球上最聪明的构建者已经不再这样做了。

他们编写循环。循环让Claude生成提示。循环验证输出。循环决定下一步做什么。循环在合上笔记本后继续运行。

Anthropic的Claude Code负责人Boris Cherny两周前说得直白:“我不再手动提示Claude了。我有循环在运行,它们提示Claude并决定该做什么。我的工作就是写循环。”这一句话重新定义了地球上每一个严肃AI工程师对构建的看法。而且它与量化交易完美契合。

大多数零售量化交易者读到这会说这不适用于他们,因为他们规模太小。他们错了。资金越少,这就越重要。一个自动运行的循环是独立构建者唯一能缩小与拥有100位博士的基金差距的方式。

因为量化交易本身就是一个循环。获取数据。产生信号。回测。执行。监控风险。重复。

华尔街的每个基金都在运行这个精确循环。文艺复兴自1988年就一直这样做。Citadel用工程师团队监控每个阶段。Two Sigma、Jane Street,全都一样。

唯一的区别是他们需要数百个人类坐在循环内部。你不需要。

我已经为自己构建了这个循环。它按计划拉取市场数据。它进行Alpha研究。它通过一个独立的智能体验证每个信号。它只执行通过验证的信号。它把每个教训写回记忆。

这篇文章是我学到的关于循环工程的一切,以及如何将其连接成一个完整的自主交易系统。

读完本文你将知道:

提示智能体与工程化循环的确切区别。

在生产中运行的每一个有效循环的六个组成部分。

如何将这六个部分从零开始连接成一个自优化的量化交易系统。

让我们开始吧。

第一部分:提示与循环工程的区别

在过去两年里,使用AI看起来是这样的:

你输入一个提示。你阅读返回的内容。你根据看到的内容输入下一个提示。

你就是那个循环。

智能体是一个工具。你需要一直握着它。每一步都是你坐在键盘前决定下一步做什么。

循环工程终结了这一点。

你不再是循环内部的东西。你变成设计它的架构师。

循环是一个递归目标。你定义一个目标。智能体针对它迭代。循环持续运行直到满足一个真实的停止条件。

智能体在运行之间会遗忘。循环不会。

这单一事实就是整个架构。

这就是Boris说的“我的工作是写循环”的含义。他不再一次一个地输入指令。他构建了系统,系统替他发送指令、读取结果、决定下一步做什么。

对于编码,这改变了软件交付的方式。

对于交易,这改变了一切。

因为没有哪个量化交易者是通过输入一次提示然后走开就赚钱的。优势来自于把同一个循环运行数千次,每次迭代进步百分之一,并且从不睡觉。

这正是循环所做的。

如果你仍然在每次交易时手动向Claude输入提示,那你做的正是Boris两年前就不再做的方式。杠杆点已经向上移动了一层。你不再是编写更好的提示,而是编写生成提示的系统。

提示与循环工程的对比

提示与循环工程的对比

第二部分:运行每个有效循环的六个组成部分

一个有效的循环由六个部分组成。缺少一个,循环就会悄无声息地崩溃。

1. 自动化。

这是心跳。一个cron计划、一个webhook、一个/loop命令,或者Claude Code内部一个无需你输入就能触发的钩子。

有两种值得了解的变体。/loop按照固定节奏重新运行,无论状态如何。/goal持续运行直到你编写的可验证条件为真,由另一个独立的小模型对工作是否完成进行评分。

在交易中,/loop是你的每分钟数据拉取。/goal 是“持续迭代这个信号,直到回测夏普比率高于1.5。”

2. 技能。

技能是一本程序手册,智能体读取它而不是每次会话从头被告知。

它存在于SKILL.md文件中。它包含你的惯例、规则以及“由于某次事故我们不这样做”的内容。

没有技能,每次循环运行都从零开始。有了技能,意图会累积。

3. 状态文件。

一个markdown文件。通常叫做STATE.md或PROGRESS.md。

它在运行之间持久保存。智能体会遗忘。文件不会。

智能体在每次运行开始时读取它。运行结束时写回发生了什么。

这听起来太简单以至于不重要。但它实际上是每个有效循环的主干。

4. 验证者。

编写代码的智能体是最不适合判断代码是否正确的人。

将其应用于交易:产生信号的智能体是最不适合判断信号是真正的Alpha还是噪声的人。

你需要一个独立的智能体,带有不同的指令,理想情况下是不同的模型,其唯一工作是验证成果。

这是制造者-检查者模式。华尔街的每一家自营交易公司内部都是这样组织的。在Jane Street,提议交易的交易员不能批准交易。在Citadel,构建模型的研究员不能验证模型。

5. 工作树。

当你对同一文件运行多个智能体时,它们会开始冲突。

Git工作树为每个智能体提供独立的、指向自己分支的工作目录。

在交易中,这让你能够并行运行信号研究、回测和风险监控,而互不干扰。

6. 连接器。

一个只能读取文件的循环是一个微小的循环。

基于模型上下文协议(MCP)构建的连接器让循环能够访问券商API、查询数据库、向Slack发送消息、向交易所发送订单。

这就是一个建议交易的循环与一个实际下单的循环之间的区别。

这六个部分是通用的。它们出现在Claude Code中。出现在Codex中。出现在地球上每一个有效的智能体系统中。

现在我来展示如何将它们连接成一个完整的交易系统。

第三部分:如何构建一个自优化的量化交易循环

量化交易循环有五个阶段。每个阶段都是一个子循环,有自己的技能、自己的状态文件、自己的验证者。

阶段一:数据摄入。

自动化每小时、每分钟或每天触发,取决于资产类别。

@loop(interval="1h")
def ingest_data():
    data = fetch_market_data(symbols=universe, lookback="30d")
    state.write("latest_data.parquet", data)

数据进入一个共享的状态文件,供下一阶段读取。

阶段二:信号生成。

这是Alpha研究发生的地方。

@loop(trigger="data_updated")
def generate_signal():
    data = state.read("latest_data.parquet")
    signal = claude.run_skill("alpha_research", data)
    state.write("pending_signal.json", signal)

信号生成智能体从包含Alpha研究规则的SKILL.md文件中读取。

# alpha_research_skill.md

## 目标
使用过去30天的价格和成交量数据进行线性回归生成信号。

## 规则
- 最近5次回测中,至少3次的夏普比率必须高于1.5
- 每个信号的仓位规模限制在资本的2%
- 跳过FOMC公告日
- 跳过财报发布前48小时

## 经验教训
- 2026-02-14: 在财报周损失4.2%。新规则:跳过财报前48小时的任何信号。
- 2026-03-08: 行业暴露违规导致6%回撤。新规则:将行业暴露上限设为30%。
- 2026-04-22: 动量信号在FOMC日爆炸。新规则:在FOMC日取消所有动量信号。

技能会随时间增长。每次损失都会写入新的教训。每个教训都会成为下一次运行的新规则。

这就是系统自我优化的方式。

阶段三:验证。

信号被送到一个完全独立的智能体。不同的模型。不同的指令。对原信号推理过程一无所知。

@checker
def verify_signal(signal):
    result = claude.invoke(
        skill="backtest_verification_skill.md",
        signal=signal,
        rules=[
            "Sharpe ratio above 1.5",
            "Max drawdown below 10 percent",
            "Newey-West t-stat above 2.0",
            "Out of sample period at least 2 years"
        ]
    )
    return result.verdict

如果验证失败,信号被杀死。如果通过,则进入执行。

验证者永远看不到制造者的推理过程。这个分离就是全部优势。

你还可以为检查者使用比制造者更强的模型。Claude Opus用于验证,Claude Sonnet用于生成。不同的模型架构能捕捉不同类型的错误。这与集成学习方法在机器学习中的逻辑相同。

制造者-检查者分离

制造者-检查者分离

阶段四:执行。

只有经过验证的信号才能到达这个阶段。

@auto_mode
def execute(signal):
    if verify_signal(signal):
        broker.send_orders(signal, max_position=0.02)
        state.write("active_trades", signal)

MCP连接器处理券商API。循环从不请求许可。自动模式让它无需干预即可运行。

阶段五:风险监控。

在并行工作树中持续运行。

@loop(interval="1m")
def monitor_risk():
    positions = broker.get_positions()
    if drawdown(positions) > 0.05:
        broker.close_all()
        state.append("STATE.md", "Drawdown trigger hit. All positions closed.")

这是紧急停止开关。它无需协商就执行规则。

这五个子循环共同构成一个自动运行的系统。

数据流入。信号生成。信号验证。已验证信号执行。风险监控。教训写回记忆。

然后重新开始。

循环如何累积

循环如何累积

我设计了一次这个系统。从那以后我再也没有手动提示过任何这些步骤。

这就是循环工程。这就是Boris说的“我的工作是写循环”的含义。

一个警告。没有真正停止条件的循环会悄无声息地失败。智能体发出一完成信号,认为半完成的工作已经完成。循环退出。坏交易仍然开着。

你的停止条件需要能够由智能体自身的声明之外的东西来检查。“过去30笔交易中夏普比率高于1.5”。 “回撤低于5%”。“测试套件通过”。永远不要“智能体说它完成了”。

在我的博弈论文章中,我解释了为什么每笔交易都是一个不完全信息多方博弈中的战略行动。如果你错过了,你会想在这之后立即阅读:

Roan@RohOnChain·6月14日 文章
如何掌握统治量化交易的一个概念
理解博弈论的人与世界上其他人处于完全不同的现实。

直接进入正题。 收藏本文 - 我是Roan,一名后端开发者,专注于系统…1986557664K

循环是让你能够永远坐在那张牌桌上而不筋疲力尽的方式。

总结

量化交易本身就是一个循环。华尔街的每个基金都在运行它。他们只是需要数百个人类坐在内部。

循环工程去掉了人类。

六个部分构成每个有效的循环。自动化提供心跳。技能保存项目知识。状态文件保存记忆。验证者评估输出。工作树隔离并行工作。连接器给循环在现实世界中的“手”。

将它们围绕五阶段交易周期连接起来,你就拥有了一个自我优化的系统,可以自主运行Alpha研究、验证信号、执行交易和监控风险。

每个循环系统都会变得更聪明。每次损失都写入新教训。每个教训都成为新规则。经过一百次交易,技能文件变成一份活文件。经过一千次,它比任何一个人类能记住的东西都更接近机构知识。

最先构建这个的基金将在未来十年持续增长。仍然在手动提示的那些将被抛在后面。

所以,需要思考的问题是:

如果循环工程是提示之上的下一个抽象层,而量化交易是世界上最高风险的循环,那么你是一个仍然每笔交易手动输入提示的人,还是一个设计出在你睡觉时为你交易的循环架构师?

没有错误的答案,但答案非常具有启发性。

相似文章

@RitOnchain: https://x.com/RitOnchain/status/2067562267936534965

X AI KOLs Timeline

关于将循环工程应用于量化研究的全面指南,提出了一个框架,其中LLM代理迭代地感知、推理、行动和观察,以生成和测试alpha因子,并附有完整的代码实现以及与单次提示的比较。

@shmidtqq: https://x.com/shmidtqq/status/2068704187492221405

X AI KOLs Timeline

一份关于AI编程代理循环工程的深入指南,解释了如何构建自动循环来重复提示代理、验证结果并避免失控成本,并通过一位工程师一个月内提交259个拉取请求的案例研究加以说明。

@dunik_7: https://x.com/dunik_7/status/2069079047510864322

X AI KOLs Timeline

LangChain的循环工程手册通过四个嵌套循环(代理循环、验证循环、事件驱动循环和爬山循环)替代了提示工程,使AI代理能够随着时间的推移自动自我改进。该文章认为,构建自我优化循环如今已成为关键的竞争优势,而非使用更先进的模型。