模型现在能预测未来事件并在Polymarket上赚钱吗?

Reddit r/singularity 论文

摘要

马克斯·普朗克研究所的研究人员推出了FutureSim,这是一个通过回放历史网络数据让AI代理预测真实世界未来事件的环境。在Codex上运行的GPT 5.5在部分Polymarket市场(如超级碗LX)上取得了近乎完美的Brier技能分数,超越了人类聚合市场,但在英国大选和格莱美奖等其他市场上表现不佳。

马克斯·普朗克研究所的研究人员最近发布了FutureSim,这是一个环境,其中代理被回放一个时间切片网络数据,并被任务预测真实世界的未来事件。在他们环境中与Polymarket重叠的一些问题上,比如超级碗LX市场(交易量7.04亿美元),在Codex上运行的GPT 5.5实际上超越了人类聚合市场,并以近乎完美的0.90 Brier技能分数结束。葡萄牙总统决选也是如此。一个没有实时网络访问、只是回放旧新闻的代理,竟然引领着一个涉及数亿真实资金的市场。但并非所有情况都完美,同一模型在英国大选和格莱美奖市场上表现不佳。AI预测领域的进展似乎很快,到2027年我们会有可靠的前景预测器吗?
查看原文

相似文章

AI如何拯救预测市场(10分钟阅读)

TLDR AI

本文探讨了预测市场未能实现其乌托邦愿景的失败,并认为AI可以通过增强市场创建、分析和准确性来改变预测市场,将焦点从体育和加密货币转向高影响力问题。

剖析预测市场背后的数据

Hacker News Top

对Polymarket和Kalshi等预测市场的分析,探讨其庞大的交易量是否真正产生了有价值的预测信息,还是仅仅沦为赌博,并参考了历史上的学术支持和当前数据。