@Rossst_03: https://x.com/Rossst_03/status/2071171182548636067

X AI KOLs Timeline 新闻

摘要

一条教育性长帖,解释量化交易公司(如Renaissance Technologies)所用的数学基础,涵盖从伯努利到布朗运动的概念。

https://t.co/FgJC5WmYvy
查看原文
查看缓存全文

缓存时间: 2026/06/29 04:22

量化基金为何总能赢:完整数学栈

每一家数十亿美元基金赖以运行的公式。没有一个是秘密。坦白说,大部分都比看起来简单。

人们喜欢给自己讲一个关于量化基金的故事:说文艺复兴或城堡基金的操盘手只是比我们更聪明、更快,或者掌握着别人看不到的信息。这样输了也不至于太伤自尊。

但这个故事基本是错的,而真实故事对你而言有用得多。

量化基金之所以赢,是因为他们共享同一个工具箱。一个由方程堆叠而成的栈,能将可怕的东西——不确定的未来——转化为一个你可以据此行动的数字。而我希望你能好好体会这一点:这些方程几乎没有一个秘密。它们都写在教科书里。大多数在几十年前就发表了,有些甚至在一个多世纪以前。其中不少现在、今晚,就可以免费在网上找到给你。

所以,护城河从来不是数学。护城河在于知道哪些部分重要、它们如何组合在一起,以及有耐心去相信它们。最后这一点比你想象的要稀有得多,我们后面会谈到。

用数字说明:文艺复兴科技公司的Medallion基金在1988年至2018年间,扣除费用前平均年化收益约66%。三十年,没有一年亏损。这是市场有史以来最好的业绩记录,而它并非建立在秘密之上。它建立在你即将读到的这个栈之上。

让我带你温和地走一遍整个过程,从1900年被遗忘的法国人到今天的神经网络。对于每个想法,我会告诉你谁写的、它实际上做什么、以及基金如何使用它。你不需要博士学位就能跟上。你只需要一层一层地来。

第一层——基础:将随机转化为数字

在你能给任何东西定价之前,你需要一种描述不确定性的语言。以下四个想法就是那种语言,而且你已经在直觉层面掌握了它们的大部分。

大数定律——雅各布·伯努利,1713年发表。 伯努利证明了你已经半懂的事情:重复足够的押注,结果就不再显得随机,而开始表露出其下的真相。51%的优势在十笔交易中毫无意义——你根本无法区分技能和运气。但在上万笔交易中,那微小的优势几乎变成了确定性。这一个想法就是基金为何做数百万个小额押注而不是几个大额押注的全部原因。这也是大多数人过早放弃一个本来不错的策略的原因:他们在数学还没开始起效之前就停止了。

贝叶斯定理——托马斯·贝叶斯,1763年在他去世后发表。 这只是一个谨慎的规则,用于在新证据出现时改变你的想法。你从一个信念出发,看到新数据,然后更新到一个更精确的信念。就这么简单。一个量化模型从不声称“知道“未来——它持有一个概率,并随着每个新价格的出现悄无声息地修正它,恰恰如同两个半世纪前贝叶斯描述的那样。如果你曾根据新信息更新过一个猜测,那你已经亲手做过贝叶斯推理了。

马尔可夫链——安德雷·马尔可夫,1906年。 马尔可夫注意到,在很多系统中,下一步走向主要取决于你现在的位置,而不是你的整个历史。市场被描述为不同的状态——平静、趋势、恐慌——并且状态之间转换的概率是可建模的。顶级基金的那些大型状态转换模型都源自这位俄罗斯数学家的这个简单而谦逊的观察。

布朗运动——路易·巴舍利耶,1900年。 这是我最喜欢的,因为几乎没有人在学校学过。1900年,一位名叫路易·巴舍利耶的法国研究生在索邦大学站在亨利·庞加莱面前,将股票价格描述为随机游走——以精确的数学形态上下波动。他在爱因斯坦将布朗运动用于物理学之前五年,就推导出了布朗运动的数学;在布莱克-斯科尔斯之前七十三年,就推导出了期权定价的数学。世界忽略了他五十年。然后现代金融悄然地在他那个想法之上重建了整个体系。记住他——一个被遗忘的学生最终证明是正确的,这里面有些令人鼓舞的东西。

第二层——引擎:给不可定价之物定价

一旦你接受价格是随机游走的,你就需要一种能在随机性上工作的微积分。从这里开始,事情变得严肃且有利可图。

伊藤引理——伊藤清,1940-50年代。 普通微积分,学校里学的那种,在一条锯齿状的随机路径上会失效。一位名叫伊藤清的日本数学家构建了一个不会失效的版本——随机微积分。把伊藤引理看作随机性的链式法则。它是那个安静的引擎,让你能拿巴舍利耶的随机游走价格实际进行计算。地球上每个衍生品交易台都依赖它,不管那里的交易员能不能凭记忆重新推导出来。

布莱克-斯科尔斯-默顿——1973年。 费希尔·布莱克、迈伦·斯科尔斯和罗伯特·默顿将巴舍利耶的随机性和伊藤的微积分结合在一起,形成了一个简洁的期权定价公式。它在1997年获得了诺贝尔奖。但更大的故事是它对世界的影响:在这个公式之前,期权是一种小众的好奇之物。之后,它们变成了一个价值数万亿美元的市场,仅仅是因为大家终于一致同意期权值多少钱。一个方程,一个行业。

第三层——优势:该押多少

找到优势只是工作的一半。另一半会悄无声息地毁掉有才华的人——那就是仓位管理,决定押多少。

凯利准则——约翰·凯利,贝尔实验室,1956年。 凯利找到了你该押上资金的精确比例,以使你的资本在长期内以最快速度增长。押得太少,你的优势复利爬行缓慢。押得太多,一次普通的亏损序列就能把你清出局,即使你的优势是真实的。爱德华·索普拿着这一个公式,先在拉斯维加斯赢了二十一点,然后运营了一个基金十九年,没有一年亏损。当人们问索普最重要的工具是什么时,他说的不是一个信号。他说的是凯利。有太多交易员拥有真实的优势却仍然破产,纯粹因为他们从未学会该押多少。

现代投资组合理论——哈里·马科维茨,1952年。 马科维茨把“不要把所有鸡蛋放在一个篮子里“变成了实际的数学。他证明了一个投资组合的风险不仅仅是个别部分的平均值——各部分如何一起运动才是关键,而聪明的分散化几乎就是一份你可以计算的免费午餐。1990年诺贝尔奖。每当一个交易台同时管理许多相关联的仓位时,它就是在解决马科维茨的问题。

资本资产定价模型——威廉·夏普,1964年。 夏普问了一个简单而深刻的问题:对于一个资产,你持有它承担的风险应该得到多少回报?他的答案给市场带来了“贝塔“这个词和“夏普比率“——每单位风险赚取的回报。1990年诺贝尔奖。当一个量化分析师耸肩说一个策略“夏普比率低于1就是垃圾“时,他说的就是六十年前夏普的语言。

第四层——信号:在噪声中找到真相

市场所做的绝大部分事情是噪声。这些工具就是你如何从噪声中拉出安静信号的方法。

信息论——克劳德·香农,1948年。 香农在贝尔实验室工作,发明了测量信息的整个概念——什么是“比特“,一个信道能承载多少,如何区分信号与静态噪声。整个数字世界都建立在它之上。还有一个可爱的联系:凯利的押注公式直接来源于香农的信息论。一个交易信号,严格来说,就是一个信息信道——而香农为信道编写了规则手册。

卡尔曼滤波——鲁道夫·卡尔曼,1960年。 卡尔曼解决了一个困难而优美的问题:实时找出一个系统的真实状态,而你所得到的每一个测量值都是带噪声的。NASA用它来引导阿波罗登月,将不可靠的传感器融合成一个关于飞船真实位置的可信估计。量化交易台使用完全相同的机制来估计两个资产之间的隐藏关系,或者在噪声价格下的真实趋势。同样的方程——只是把“飞船在哪“换成“这两个价格之间真正的联系是什么“。

波动率与协整——罗伯特·恩格尔,1982年和1987年。 恩格尔证明波动率不是一个固定的数字——它像波浪一样来来去去,你可以对这些波浪建模(ARCH和GARCH模型)。与克莱夫·格兰杰一起,他还给了我们协整:一个谨慎的检验,判断两个价格是否真正绑定在一起并注定会反弹,还是仅仅是偶然一起漂移。这是配对交易的核心。2003年诺贝尔奖。

第五层——策略:与其他人对弈

市场不是一台你独自解决的机器。它是一个挤满了其他人的房间,所有人都在针对你进行优化。博弈论就是你在那个房间里清晰思考的方法。

博弈论与纳什均衡——约翰·纳什,1950年。 纳什证明在任何策略博弈中,至少存在一个平衡点,在这个点上没有哪个参与者可以单方面改变自己的行动而做得更好。你看到的每一个价格恰好就是那样——买卖双方之间的临时休战。每一个拥挤的交易都是一个等待破裂的囚徒困境,因为聪明的做法是第一个离开。每一个做市商价差都处在无人敢先动的刀刃上。纳什写这个时二十一岁;诺贝尔奖在四十四年后到来。

凸优化——现代;斯蒂芬·博伊德等人。 一旦你能描述你的风险、回报和限制条件,自然而然的问题就是:什么是那个唯一最优的投资组合,可证明的,而不是靠试错?凸优化是数学的一个分支,它能保证找到那个答案。这就是基金如何把一堆杂乱的信号和风险规则转化为一个干净的资金分配的方式。标准教科书可以免费在线获取——又是一个安静提醒,数学并不是对你保密的东西。

第六层——现代栈:模拟与机器学习

这最后一层是今天每个人都大声谈论的。它也是最新的,而且一旦你看到它从哪里来,远没有那么神秘。

蒙特卡洛模拟——斯坦尼斯瓦夫·乌拉姆和约翰·冯·诺依曼,1940年代。 诞生于洛斯阿拉莫斯为原子弹建模,蒙特卡洛是一个非常诚实的想法:如果一个概率太难直接计算,那就模拟它几千次,然后数数发生了什么。基金用它来为奇异的衍生品定价,以及用尚未发生的未来情景对投资组合进行压力测试。为模拟炸弹而构建的数学,如今安静地为你的投资组合中的产品定价。

神经网络——杰弗里·辛顿等人。 神经网络并不预测未来,最好尽早放弃这个幻想。它实际做的是,根据你的输入,跨越数千个变量同时学习预期结果——没有任何单个指标能够容纳的模式。杰弗里·辛顿花了数十年让这东西工作,并在2024年为此获得诺贝尔奖。强化学习(一个每轮循环都会变好一点点的智能体)和随机森林(一群投票的小决策树)是同样的精神:许多弱猜测者,组合成一个强答案。

没人卖课给你时愿意承认的部分

现在和我一起回头看看这些日期。

伯努利,1713年。巴舍利耶,1900年。马尔可夫,1906年。凯利和香农在1950年代。卡尔曼,1960年。布莱克-斯科尔斯,1973年。运行着百亿美元基金的几乎每一个方程,公开已有五十年或更久了。你和城堡基金的量化研究员正在触及完全相同的数学。

那么,既然数学是共享的,为什么量化基金总能赢?三个原因,没有一个是公式。

数据与速度。 方程是免费的。干净的数据、微秒级的执行、以及紧邻交易所的服务器,这些不是免费的。很多优势存在于知道公式和足够快速行动以赶在其他人之前之间的差距。

组合。 没有哪个单独的方程是护城河。没有真实优势的凯利只是更快地走向毁灭。没有凯利的信号是一个爆仓的账户。持续数十年的基金把整个栈连接在一起,使得每个部分安静地弥补下一个部分的弱点。

纪律。 这是几乎没有人拥有的东西,而好消息是,这是你实际上可以建立的东西。一个51%的优势需要数千笔交易才能与运气分离。大多数人在第三周就放弃了,在数学还没机会获胜之前,或者他们凭感觉覆盖了模型,一个下午就交出了一年的进展。方程已有一个世纪之久。真正信任它们的耐心,是华尔街最稀有、也最能传授的优势。

市场不是一张图表。它是数学,而那个数学一直躺在教科书里,等待一个足够冷静的人去使用它。

量化基金赢,不是因为他们知道一个秘密。

他们赢是因为读了教科书——然后他们有了遵守它的纪律。

这里有一个我想请你好好思考的问题。这里的每个方程都是免费、古老且公开的。如果数学从来不是护城河,那么你和这个栈之间唯一的障碍是,你选择先学哪个想法,以及你是否会信任它足够长时间让它发挥作用。那么——你会从哪一个开始,为什么?

相似文章