标签
马克斯·普朗克研究所的研究人员推出了FutureSim,这是一个通过回放历史网络数据让AI代理预测真实世界未来事件的环境。在Codex上运行的GPT 5.5在部分Polymarket市场(如超级碗LX)上取得了近乎完美的Brier技能分数,超越了人类聚合市场,但在英国大选和格莱美奖等其他市场上表现不佳。