Balyasny Asset Management 如何构建AI研究引擎

OpenAI Blog 新闻

摘要

Balyasny Asset Management 使用GPT-5.4构建了一个复杂的AI研究引擎,已在投资团队中实现95%的采用率,将复杂研究任务从几天缩短到几小时,同时保持机构合规标准。该系统通过专门代理如Central Bank Speech Analyst和Merger Arbitrage Superforecaster展示了在金融领域的显著实际影响。

通过结合严格的模型评估、OpenAI的全平台使用以及代理工作流,Balyasny正在重新定义投资研究。
查看原文
查看缓存全文

缓存时间: 2026/04/20 14:51

# Balyasny资产管理公司如何构建AI研究引擎 来源:https://openai.com/index/balyasny-asset-management/ Balyasny资产管理公司\(在新窗口中打开\) (https://www.bamfunds.com/)(以下简称“Balyasny”)是一家全球性多策略投资公司,旗下约180个投资团队覆盖多元资产类别和地区。在竞争激烈且动态变化的行业中,信念、精准和速度是成功的关键。面对日益复杂的市场环境与激增的金融数据量,Balyasny看到了利用AI重塑投资研究流程的机遇。 2022年底,Balyasny成立了应用AI团队:一支由20名研究员、工程师和领域专家组成的中央化团队,负责构建直接嵌入团队级工作流的AI原生工具。其旗舰产品是一个AI投资研究系统,旨在像资深分析师一样进行推理、检索和执行。 > “AI使我们的团队能够更快地运用第一性原理,覆盖更多数据,并以更结构化的方式进行分析。” > > — Charlie Flanagan,首席AI官 投资研究具有复杂性、高风险性和时效性。分析师必须解析数千份文档,涵盖市场数据、研究报告以及监管文件。人类专业知识依然不可或缺,但传统方法耗时长且难以规模化。 现成的AI工具往往无法同时处理结构化和非结构化数据,缺乏工作流编排能力,并且未按机构合规标准构建。Balyasny需要量身定制的方案:一个能像分析师一样思考、以机器速度运行、并严格遵循合规边界的AI系统。 > “我们评估模型的方式如同评估投资:基于基本面。GPT-5.4证明了它能够以真正的严谨性进行规划、推理和执行。” > > — Su Wang,高级研究科学家 如今,Balyasny约**95%的投资团队都在积极使用其AI平台**,在速度、产出质量和分析师体验方面均产生了可衡量的影响: - **深度研究任务**原本需要数天完成的任务如今可在数小时内完成,代理程序能综合处理数万份文档,包括申报文件、研究报告和财报。 - **央行讲话分析代理**将宏观经济情景分析时间从2天缩短至约30分钟。 - **并购套利超级预测代理**持续监控和更新交易概率,取代了定制电子表格和手动提醒。 同样重要的是,Balyasny的分析师报告称,对产出的信心有所提升。凭借范围明确的工具、可追溯的推理路径和可测试的代理,他们利用AI提供结构化、可解释的洞察,从而增强信念并为人类决策提供依据。 在模型投入生产之前,Balyasny就构建了金融领域最复杂的评估管线之一,从**12个以上的维度**衡量模型,包括预测准确性、数值推理、情景分析以及对噪声输入的鲁棒性。这些评估基于Balyasny的内部基准、工具和专有金融数据。 这一严谨流程凸显了GPT-5.4模型系列的优势,尤其在**多步骤规划、工具执行和幻觉减少**方面。如今,Balyasny在其AI系统中将GPT-5.4作为推理引擎,同时配合内部模型使用,这些模型根据实证表现按任务逐一选择。 Balyasny做出了一项战略决策,让OpenAI直接参与面向用户的工作流。OpenAI团队直接观察投资团队如何使用其AI系统:哪些地方表现良好、哪些地方存在困难,以及在商业情境下高性能的实际样貌。 这种可见性带来了更快的迭代、更紧密的产品反馈循环,以及在金融特定任务中更好的模型行为。作为前沿模型版本的设计合作伙伴,Balyasny通过提供来自真实分析师(而非测试案例)的洞察,影响了OpenAI的路线图。 由于AI已深度嵌入投资团队的日常工作流,他们能够实时收集结构化反馈,涵盖用户评估、成果审计以及工具执行质量等多个方面。这一反馈循环推动模型和编排层的快速改进。 例如,并购套利团队的早期反馈显示,代理需要在新申报文件或新闻稿发布时持续重新评估交易概率。Balyasny团队迅速扩展了代理的规划能力和工具访问权限,将缓慢的手动工作流替换为实时概率监控。 尽管每个投资团队都有独特的投资策略,但Balyasny在AI部署上采取了中央化的方法。其应用AI团队开发核心组件,包括代理框架、工具链和合规护栏,然后部署到各团队,并根据范围限制数据和工具访问权限。 这种“联邦式部署”模型意味着每个投资团队可以开发和使用针对其资产类别(例如宏观、大宗商品和股票)的AI代理,而应用AI团队则专注于架构扩展、研究和模型评估。同时,这也确保了合规与监管标准得到普遍遵循——在一个风险管理和数据安全不容妥协的行业中,这一点至关重要。 > “我们在AI上的早期投入获得了回报。如今,我们的每个投资团队都能在安全环境中,借助实时专家指导,决定如何将最新AI应用到自身流程中。” > > — Kevin Byrne,首席运营官 Balyasny继续拓展其AI路线图,重点关注以下方面: - **强化微调(RFT)**,以提升模型在复杂、高价值任务上的表现 - **跨金融领域更深度的代理编排** - **多模态输入**,包括金融图表、报表和申报文件 并对**未来前沿模型**进行领域适配评估

相似文章

@RitOnchain: https://x.com/RitOnchain/status/2069693848478269730

X AI KOLs Timeline

本文详细介绍了一家系统性基金如何用基于RAG的LLM代理架构取代其传统NLP流水线,从非结构化数据中实现了alpha生成能力提升340%。文中引用了近期研究(Alpha-GPT 2.0、FinCon、FinAgent),表明在自动化因子发现和交易性能方面取得了显著进步。

塑造金融服务的未来

OpenAI Blog

摩根士丹利已在其财富管理部门成功部署了由 GPT-4 提供支持的 AI 解决方案,超过 98% 的顾问团队使用内部 AI 助手聊天机器人。该部署由一个强大的评估框架支持,该框架在生产环境推出前测试 AI 在文档摘要和多语言翻译等真实用例上的性能。

利用深度研究功能理解复杂趋势

OpenAI Blog

OpenAI 为 ChatGPT 推出深度研究功能,使 Bain & Company 等研究人员能够更高效地分析复杂的行业趋势。该工具通过自动化分析任务来增强研究能力。

使用 OpenAI o1 进行财务分析

OpenAI Blog

Rogo 是一个企业 AI 财务平台,利用 OpenAI 的模型(GPT-4o、o1、o1-mini)扩展其 AI 驱动的财务研究,为 5,000 多位投资银行和私募股权公司的银行家提供服务。该平台通过自动化财务分析任务实现了 27 倍的 ARR 增长,为分析师在会议准备、公司分析和市场研究上节省了每周 10 小时以上的时间。