剖析预测市场背后的数据
摘要
对Polymarket和Kalshi等预测市场的分析,探讨其庞大的交易量是否真正产生了有价值的预测信息,还是仅仅沦为赌博,并参考了历史上的学术支持和当前数据。
暂无内容
查看缓存全文
缓存时间: 2026/05/08 21:30
# 预测市场究竟有没有用?
来源:https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything
## 丹·施瓦茨
我们都知道它们就是赌场。是时候看看泡沫背后的数据了。
2007年,诺贝尔奖得主肯尼斯·阿罗、丹尼尔·卡尼曼以及其他著名学者联合发表了一篇声明 (https://scispace.com/pdf/statement-on-prediction-markets-3rukybiwkq.pdf),主张预测市场能够“大幅改善公共和私人决策”。其理论基础颇为深厚。
弗里德里希·哈耶克早在1945年就论证过 (https://fee.org/articles/the-use-of-knowledge-in-society/),市场通过价格体系汇集分散、本地和隐含知识的能力,远胜于任何中央计划者。2000年,乔治梅森大学经济学家罗宾·汉森提出 (https://mason.gmu.edu/~rhanson/futarchy2000.pdf) 一个他称为“期货民主”(futarchy)的系统,其中市场将被用于评估政策是否兑现了承诺。十七年后,菲利普·泰特洛克、芭芭拉·梅勒斯和彼得·斯科布里克 (https://www.science.org/doi/10.1126/science.aal3147) 则倡导将预测锦标赛作为为情报界生成有用政策知识以及消除政治争议两极化的方法。
包括Google (https://googleblog.blogspot.com/2005/09/putting-crowd-wisdom-to-work.html)、Microsoft (https://users.wfu.edu/strumpks/PMConf_2007/HenryBerg%28PredictionPoint%20KC%20071101%29.pdf)、CIA (https://www.cia.gov/resources/csi/static/Prediction-Markets-Enhance-Intel.pdf)、更广泛的美国情报界 (https://www.cultivatelabs.com/posts/how-the-u-s-intelligence-community-s-prediction-market-made-analysis-better) 以及英国政府情报分析人员 (https://www.randforecastinginitiative.org/rfi-blog/uk-collaboration) 在内的机构,都曾试验过内部预测市场。其中一些试验比其他更成功,但规模都很小。而且我们从理论和实践中都知道,更多的投注者能让市场更准确。谷歌首席经济学家哈尔·瓦里安喜欢将预测市场称为“信息市场”,并将投注者称为信息的“供应商”。
几十年来,预测市场的乐观派——我也曾自认为是其中一员——一直认为,一旦我们建立更好的市场并增加投注者的供给,准确性就会提高,我们都能从一种全新水平的社会预见能力中受益。
而现在,到2026年,像Polymarket和Kalshi这样的公开预测市场每月交易额高达数十亿美元 (https://defirate.com/news/kalshi-polymarket-combine-for-17-9b-february-volume-as-polymarket-closes-gap/)。这些投注的绝大多数并非针对可能产生有用信息的问题。大约90% (https://closingline.substack.com/p/the-takeaway-kalshi-non-sports-volume) 的Kalshi交易量(投注者之间易手的资金)来自体育博彩,这使得Kalshi本质上成了一个附带小型预测市场的体育赌博网站。我发现Polymarket上超过80%的交易量集中在体育、加密货币价格或选举投注上。¹ (https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything#fn-1)
关于这些市场日益流行所带来的负面问题——比如赌博成瘾和内幕交易——已经有很多笔墨了。但它们的承诺呢?它们是否正在产生有价值的信息,并让人类变得更聪明?
卡拉瓦乔,《打牌作弊者》,1594年。
## **需求,需求,需求**
要理解这些预测供给有多大用处,以及这些预测是否真的实现了预测市场先驱者的愿景,我们需要考虑另一个因素:需求。
完全可以想象,预测市场仅仅被投注者自己使用。但如果个人、企业、媒体和政策制定者想要(或需要)我们在这些市场上看到的预测,这种需求的证据就可以作为其有用性的代理指标。以太坊加密货币的创造者维塔利克·布特林在《信息金融》(https://vitalik.eth.limo/general/2024/11/09/infofinance.html) 中总结了预测市场的这种双重性:“如果你是个投注者,你可以存入Polymarket,对你来说它就是个投注网站。如果你不是投注者,你可以阅读图表,对你来说它就是个新闻网站。”
我一直在绞尽脑汁思考如何向消费者推销预测市场。2020年,我创建了谷歌目前的内部预测市场。此后,我担任过Metaculus(一个基于非市场的群体预测网站)的首席技术官,现在则经营着FutureSearch,一家提供AI预测者和研究员的初创公司。在我的工作中,我发现预测市场的好处可以分为五类。
第一,市场可以提供**风险监控**。2020年2月,我是从Metaculus了解到COVID-19信息的,这让我取消了一次原本会让我滞留的旅行计划。
第二,它们可以帮助**解读新闻**,显示当前事件是否会影响更大的结果,以及影响程度。例如,2026年伊朗战争期间霍尔木兹海峡的关闭,由于油价飙升,导致2026年美国经济衰退的预测概率从约25%上升到约35% (https://www.cnbc.com/2026/03/09/recession-odds-kalshi-oil.html)。
第三,它们可以为**政策结果**的规划提供信息,例如TikTok是否会在美国被禁。² (https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything#fn-2)
第四,它们可以为政治或商业领袖所提出的主张建立**问责制**。例如,2025年6月,当特朗普总统表示他正在考虑对伊朗核计划进行打击时,许多中东问题专家对此不以为然 (https://www.cfr.org/articles/rise-geopolitical-prediction-markets),根据外交关系委员会的一篇文章所述。然而,据CFR称,预测市场显示那一周发生打击的概率为58%,我们后来得知当时七架B-2隐形轰炸机正在途中。
第五,它们可以产生**新颖信息**,使交易者能够发现或追踪其他人无法发现的事物,例如主要AI里程碑何时会实现。³ (https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything#fn-3)
现在让我们看看每月在市场上投注的数十亿美元是否提供了这五种形式的有用信息。
Kalshi和Polymarket:按类别划分的有用交易量
Kalshi和Polymarket:总交易量与有用交易量 2024年11月的大幅飙升是由于4亿美元押注特朗普就职,以及3.27亿美元押注罗马尼亚选举丑闻(这是欧盟/北约成员国首次取消总统选举结果)。
## 风险监控作为健康的信息市场
我先从供给(投注者的押注)和需求(读者的阅读)似乎达到平衡的一个领域开始:风险监控。
预测市场带来的最直接好处,来自于诸如“巴基斯坦周五前对印度发动军事打击?”或“2026年美国至少出现10,000例麻疹病例?”或“1月31日前美国银行倒闭?”之类的问题。追踪此类风险曾是美国情报界早期群体预测试验(如IARPA锦标赛)以及菲利普·泰特洛克后来许多超级预测研究的领域。
Kalshi和Polymarket拥有相当数量的此类风险监控市场。我统计总共有2,821个,交易量为38亿美元,其中地缘政治风险是最大的类别。风险监控市场的中位交易量为82,000美元。其中,199个是冲突市场,按日和周结算,创建了一个近乎实时的冲突升级追踪器。
在这里,需求是明确的。⁴ (https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything#fn-4) 例如,对于2026年的伊朗战争,能源交易商和航运公司是这些关于结果和时间线的预测最具体的受益者。重要的是,需求也来自主流媒体,它们越来越多地⁵ (https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything#fn-5) 引用Polymarket,将这些预测直接带给专业人士在他们已经关注的场所。
尽管这些市场很有用,但它们仍然存在重要的盲点。虽然记者可能会引用预测市场来追踪正在发生的冲突的进展,但我还没有看到媒体报道将预测市场作为信息来源的故事。这是公开零售预测市场运作方式的一个功能:一个故事必须已经相当大,才能吸引足够多的交易者来产生有用的概率信息。因此,我看到了有用的风险监控证据,但并未看到风险发现的证据。
那些与轰动新闻故事无关的市场,在供给和需求两方面都表现不佳。健康与气候问题,这些可以说与冲突监控同样重要的问题,在预测市场中表现并不好。
当Kalshi于2021年7月(COVID-19大流行开始一年后)推出时,它构建了专家所倡导的那种市场:关于特定疫苗采纳人数和COVID-19病例数的一致、每周问题。它们的平均交易量为8,000美元,太低以至于不可信,并且有几个重大失误。例如,“德国COVID-19病例在截至2021年12月28日的一周内超过35,000例?”在奥密克戎变种出现前一周的交易价格为3%,而最终结果是“是”。似乎没有任何机构消费者——比如医院系统或政府疾病追踪机构——真的采纳了这个信号。气候和自然灾害市场,理论上支持很强,⁶ (https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything#fn-6) 情况也是如此。这些市场既未能吸引交易者的供给,也未能吸引响应机构或公众的需求。
第二个我看到初步迹象表明良好的预测供给可能满足强大的机构与公共需求的领域,是我列出的五个类别中的最后一个:产生新颖信息。有几十个市场追踪AI,交易量达2500万美元,涉及哪些实验室将在特定日期拥有顶级模型的问题。不难想象那些需要关于新兴技术更佳信息的人或组织。
然而,如果审视这些AI市场,似乎它们质量太低,对任何做决策的人来说都没什么用。我无法想象一个选择模型供应商的个人、一个选择合作伙伴或供应商的公司、或者一个选择AI监管政策的政策制定者,能从这些市场学到很多东西。
很明显,Polymarket和Kalshi开设这些市场是为了服务投注者,而不是为了生产有用信息。以Kalshi的“本周最佳AI?”市场为例,它们不仅覆盖的时间跨度太短,对任何决策都没有用处,而且使用Arena来评判最佳AI。Arena基于投票,而非客观任务分数,根据AI专家的说法,这不是一个可信的衡量标准。尽管如此,对这些市场的需求确实存在,并且未来有可能出现更高质量的市场来满足这种需求。
## 预测市场准确但被忽视的地方
在我划分的五类预测市场好处中的三类——解读新闻、政策结果和问责制——我发现有证据表明高交易量市场正在产生准确的预测,但没有证据显示有人正在或者应该关注它们。
首先,市场对于解读新闻有多大用处?这些是追踪如衰退或通胀等更大结果的市场,它们会随着新闻而变化,帮助读者理解特定事件的影响。
交易量看似可观,有1,647个市场,总交易额12.5亿美元。然而,其中85%的交易量集中在美国联邦利率市场。解读新闻类市场的中位交易量实际上大幅下降了,从2025年初的高点49,000美元降至年底的仅13,000美元,远低于我归类为有用的其他市场的中位交易量。
虽然预测利率很有价值,但CME期货、彭博社共识和专业经济学家已经在这方面做了。这对于Polymarket和Kalshi上其他交易量高的指标也是如此:通胀、失业率、大宗商品价格、抵押贷款利率。Aaron Brown称 (https://www.bloomberg.com/opinion/articles/2026-02-27/kalshi-and-polymarket-are-economic-oracles) 预测市场为“经济预言机”,但这个预言机很大程度上只是在重复其他预言机已经说过的话,只是更新速度更快。
尽管如此,速度仍然是一个优势。2026年3月11日,《金融时报》报道 (https://professional-monetary-policy-radar.ft.com/access-error/ceaf06b6-fdb9-4707-8f5b-80b163b0af91),在伊朗战争升级的消息传出后,Polymarket上通胀达到或超过2.8%的概率升至90%以上。这说明了美国外交政策对国内产生的即时影响,这种影响方式可能比几个月后专业经济学家发布的更新更能影响公众。
接下来,市场对于判断政府和CEO的主张是否可信有多大用处?我找到了184个问责制市场,总交易额为1.73亿美元。这类市场的数量在增长,中位交易量也在增长,中位投注额为44,200美元。
但总交易量的三分之二是关于爱泼斯坦文件的投机,这种活动被Rohanifar等人 (2026) (https://arxiv.org/abs/2602.05181) 诊断为“预测洗白”。很难看到有任何决策会因为这些市场而改变。其余的大部分是关于另一个人——美国总统唐纳德·特朗普⁷ (https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything#fn-7) ——这感觉像是特定时代产物,是对一个特别有娱乐性且在公众意识中存在信誉问题的领导人的反映。
最后,追踪政策结果的市场有多大用处?我找到了1,710个市场,总交易额为14.2亿美元。但绝大部分交易量集中在极少数备受关注的市场:2.88亿美元押注美国政府可能停摆,2.38亿美元押注朱迪·谢尔顿能否被提名为美联储主席,1.45亿美元押注TikTok是否会在美国被禁。
市场中位交易量正在增长,从2025年的24,000美元增加到30,000美元。我认为最有价值的部分是196个关于关税政策的市场,交易量为1.44亿美元。⁸ (https://asteriskmag.com/issues/14/are-prediction-markets-good-for-anything#fn-8) 这些在经济中的许多领域都具有可操作性,我认为群体的智慧正在产生关于哪些关税将在什么水平生效的新颖、有用、准确的信息。
总体而言,所有这三类市场都主要被押注特朗普政府多变政策的赌注所主导。正如罗宾·汉森曾评论 (https://x.com/robinhanson/status/2037523476383154274) 的那样,“一个随机的、不可预测的美国总统对预测市场行业非常有利。” 在我看来,这似乎并非学者们所希望看到的愿景:专家们对当前事件下注,从而导致严肃政治家的承诺或影响世界各国立法机构面临的最重要法案。
由娱乐价值和投注者的兴趣驱动的市场,有可能实现这一点,但我在Kalshi和Polymarket上没有看到太多。最善意的看法是,这些都是成长的烦恼:一个健康信息市场的创建是通过押注特朗普来引导启动,并逐渐演变成更成熟金融证券上的专业投注环境。但在此之前,我不期望受政策影响的人们会给予太多关注。
我们有另一个原因
相似文章
预测市场中谁赢谁输?来自Polymarket的证据
本文分析Polymarket的预测市场数据,以确定哪些交易者盈利或亏损,为市场效率和参与者行为提供证据。
预测市场正在引领新闻走向,并成为独立的报道领域
随着 Polymarket 等平台因预测现实事件而获得主流关注,预测市场对新闻报道的影响日益深远,并逐渐成为新闻业独立报道的对象。
西班牙因缺乏赌博牌照封锁预测市场Polymarket和Kalshi
西班牙因Polymarket和Kalshi未持有赌博牌照而封锁了这两家预测市场,凸显了对加密预测平台的持续监管审查。
模型现在能预测未来事件并在Polymarket上赚钱吗?
马克斯·普朗克研究所的研究人员推出了FutureSim,这是一个通过回放历史网络数据让AI代理预测真实世界未来事件的环境。在Codex上运行的GPT 5.5在部分Polymarket市场(如超级碗LX)上取得了近乎完美的Brier技能分数,超越了人类聚合市场,但在英国大选和格莱美奖等其他市场上表现不佳。
AI如何拯救预测市场(10分钟阅读)
本文探讨了预测市场未能实现其乌托邦愿景的失败,并认为AI可以通过增强市场创建、分析和准确性来改变预测市场,将焦点从体育和加密货币转向高影响力问题。