标签
本文系统评估了信用评分中的拒绝推断方法,并发现了一种结构性失效模式:在自然的再训练周期中,模型的准确率提升但召回率骤降,造成了改进的幻象,而实际拒绝质量却在恶化。本文提出了一种受控探索策略,无需统计假设即可打破反馈循环,并证明即使最低的探索率也足以诊断该问题。
本文提出了一种统一的多模态框架,融合强化学习、高频交易、博弈论方法及跨模态情感分析,用于构建智能金融系统,并声称相比单领域系统有显著提升。
本文研究了LLM代理在金融交易中的行为对齐与表示动态,介绍了TradeArena测试平台,并发现规划嵌入中存在可测量的故障前特征,这些特征能在多种前沿模型与压力条件下高精度预测回撤。
本综述研究了金融AI系统中的计算非确定性,涵盖表格模型、图网络和基于LLM的工作流,并提出了一个用于可审计性的分层评估框架。
Y Combinator 将于周四在纽约市举办金融科技欢乐时光,邀请专注于稳定币、代币化、金融人工智能、代理商务和预测市场的初创公司。
Kronos是全球首个专为金融市场打造的开源基础大模型,从零训练于120亿条真实K线数据,支持价格预测与波动率预判,性能远超通用模型,完全免费开源。
Google 正在将其新版 AI 驱动的 Google Finance 服务扩展至欧洲,该服务具备增强的 AI 研究功能、高级图表可视化、实时财报见解以及本地语言支持。
本周增长最快的 GitHub 仓库汇总,榜单由自主金融与编码智能体框架主导,亮点包括 TradingAgents、一个 Claude 编排平台,以及 OpenAI 的 Symphony。整体主题聚焦于多智能体编排与自主 AI 工作流。
AlphaCrafter 是一个用于截面量化交易的全栈多智能体框架,它利用专门的智能体进行因子挖掘、筛选和交易,以适应不断变化的市场状况。
FinRAG-12B 是一款针对银行业检索增强生成(RAG)优化的 120 亿参数大语言模型,具备统一训练框架,可提升回答质量、引用依据的可靠性以及校准后的拒绝回答能力。该模型在引用依据方面优于 GPT-4.1,并已部署于 40 多家金融机构,在成本和延迟方面具有显著优势。
研究人员发布 SAHM,首个包含 14,380 条专家验证样本的阿拉伯语金融基准,涵盖符合伊斯兰教法的推理,20 个受评 LLM 表现差距显著。
Kronos 是一种针对金融 K 线数据的新基座模型,它采用专用分词器和自回归预训练,在预测和合成数据生成方面优于现有模型。
Rogo 是一个企业 AI 财务平台,利用 OpenAI 的模型(GPT-4o、o1、o1-mini)扩展其 AI 驱动的财务研究,为 5,000 多位投资银行和私募股权公司的银行家提供服务。该平台通过自动化财务分析任务实现了 27 倍的 ARR 增长,为分析师在会议准备、公司分析和市场研究上节省了每周 10 小时以上的时间。