预测市场中财富转移的微观结构
本文信息来源:jbecker

拉斯维加斯大道上的老虎机每投入一美元大约返还 93 美分。这被广泛认为是赌博中赔率最差的之一。然而在受 CFTC 监管的预测市场 Kalshi 上,交易者却在赔率极低的长线合约上投注了巨额资金,这些合约的历史回报率低至每投入一美元只返还 43 美分。成千上万的参与者自愿接受远低于赌场老虎机的期望值,以押注他们的信念。
有效市场假说认为资产价格应当完美聚合所有可用信息。理论上,预测市场为检验这一理论提供了最纯粹的场景。与股票不同,内在价值没有歧义。一个合约要么支付 1 美元,要么不支付。5 美分的价格应当恰好意味着 5%的概率。
我们分析了覆盖 182.6 亿美元成交量的 7210 万笔交易以检验这种效率。我们的发现表明,集体准确性依赖的不是理性参与者,而是一种“收割错误”的机制。我们记录到一种系统性的财富转移:冲动的 Taker 为肯定的“YES”结果支付结构性溢价,而 Maker 则通过向这种有偏流动出售合约来捕获“乐观税”。该效应在体育和娱乐等高参与度类别中最为强烈,而金融等低参与度类别则趋近于完美效率。
本文有三方面贡献。首先,它确认了 Kalshi 上存在长尾偏差(longshot bias),并量化了其在不同价格水平上的幅度。其次,它按市场角色分解了回报,揭示出由于订单流不对称而导致的从 taker 到 maker 的持续性财富转移。第三,它识别出 YES/NO 不对称,即 taker 在长尾价格上不成比例地偏好肯定注码,从而加剧了他们的损失。
预测市场与 Kalshi
预测市场是参与者在其中交易关于现实世界结果的二元合约的交易所。这些合约在结算时要么为 1 美元要么为 0 美元,价格在 1 到 99 美分之间,被用作概率的替代指标。与股票市场不同,预测市场严格为零和:每一美元的利润都恰好对应着一美元的损失。
Kalshi 于 2021 年推出,是首个由 CFTC 监管的美国预测市场。最初专注于经济和天气数据,该平台一直保持小众地位,直到 2024 年。对 CFTC 的一场法律胜利确保了其列出政治合约的权利,而 2024 年选举周期则引发了爆炸性增长。2025 年引入的体育市场现在主导了交易活动。
Kalshi 季度成交量
Q4 '21Q2 '22Q4 '22Q2 '23Q4 '23Q2 '24Q4 '24Q2 '25Q4 '25$5M$10M$20M$50M$100M$200M$500M$1B$3B$8BVolume (USD)
季度
各类别的成交量分布极不均衡。体育占名义成交量的 72%,其次是政治占 13%,加密货币占 5%。
按市场类别和子类别划分的 Kalshi 名义总成交量。点击放大。
注:数据收集截至 2025-11-25 美东时间 17:00;2025 年第四季度数据尚不完整。
数据与方法
该数据集可在 GitHub 上获得,包含 768 万个市场和 7210 万笔交易。每笔交易记录执行价格(1–99 美分)、接受方立场(是/否)、合约数量和时间戳。市场还包括决议结果和类别分类。
- 角色分配:每笔交易都识别出流动性接受者。造市者采取相反立场。如果
taker_side = yes以 10 美分成交,接受者以 10 美分买入 YES;造市者以 90 美分买入 NO。 - 成本基准( Cb ):为比较 YES 与 NO 合约之间的不对称性,我们按投入风险资本对所有交易进行归一化。对于在 5 美分买入的标准 YES 交易, Cb=5 。对于在 5 美分买入的 NO 交易, Cb=5 。本文中除非另有说明,所有对“价格”的引用均指该成本基准。
- 错定价( δS )衡量实际胜率与一组交易 S 的隐含概率之间的偏差:
δS=1∣S∣∑i∈Soi−1∣S∣∑i∈Spi100
- 毛超额收益( ri )是相对于成本的收益,未扣除平台费用,其中 pi 为以美分计的价格, oi∈{0,1} 为结果:
ri=(100⋅oi−pi)pi
样本
计算仅基于已结算的市场。被作废、退市或仍然开放的市场被排除。此外,名义交易量低于 100 美元的市场中的交易也被排除。该数据集在所有价格区间中均保持稳健;最稀疏的区间(81–90¢)包含 580 万笔交易。
按价格分组的交易
1-10¢11-20¢21-30¢31-40¢41-50¢51-60¢61-70¢71-80¢81-90¢91-99¢02.5M5M7.5M10MNumber of Trades
合约价格(美分)
Kalshi 上的远射偏差
远射偏差最早由 Griffith(1949 年)在赛马中记录,后由 Thaler 与 Ziemba(1988 年)在对 pari-mutuel 投注市场的分析中形式化。该偏差描述了下注者倾向于为低概率结果支付过高价格的现象。在有效市场中,标价为 p 美分的合约应当大约有 p % 的胜率。而在表现出远射偏差的市场中,低价合约的胜率低于其隐含概率,高价合约的胜率则高于其隐含概率。
数据证实了 Kalshi 上的这一模式。价格为 5 美分的合约只有 4.18% 的胜率,意味着定价偏差为 -16.36%。相反,价格为 95 美分的合约胜率为 95.83%。这种模式具有一致性;所有定价低于 20 美分的合约其表现低于其概率预期,而定价高于 80 美分的合约则表现优于预期。
实际胜率与合约价格
135791114172023262932353841444750535659626568717477808386899295990%25%50%75%100%Actual Win Rate (%)
合约价格(美分)
- 实际
- 隐含
长尾偏差的存在提出了一个零和市场特有的问题:如果一些交易者系统性地多付了价钱,谁在获取这部分剩余?
造市者-吃单者财富转移
按角色分解回报
市场微观结构根据与订单簿的交互将参与者分为两类。做市者通过下达限价委托并将其挂在簿上来提供流动性。吃单者通过与挂单成交来消耗这种流动性。
按角色分解的总体回报揭示出明显的不对称性:
| 角色 | 平均超额回报 | 95% 置信区间 |
|---|---|---|
| 接受方 | -1.12% | [-1.13%, -1.11%] |
| 做市方 | +1.12% | [+1.11%,+1.13%] |
按合约价格的错误定价
13579111417202326293235384144475053565962656871747780838689929599-60%-30%0%30%60%Mispricing (pp)
合约价格(美分)
- 接单方
- Maker
- 合并
分歧在尾部最为显著。在 1 美分的合约上,吃单方的胜率仅为 0.43%,而隐含概率为 1%,相当于-57%的错误定价。同一合约的挂单方胜率为 1.57%,导致+57%的错误定价。在 50 美分时,错误定价趋于收窄;吃单方为-2.65%,挂单方为+2.66%。
在 99 个价格级别中,吃盘者在 80 个级别上出现负的超额收益。同一 80 个级别上,挂单者则表现为正的超额收益。市场的总体误校准集中在特定群体;吃盘者承受损失,而挂单者获取收益。
这只是价差补偿吗?
一个明显的反对意见是:挂单者通过提供流动性获得买卖差价作为补偿。他们的正收益可能仅仅反映了捕获差价,而不是利用有偏流动。然而,有两点观察结果表明并非如此。
第一个观察表明,这一效应超出了纯粹赚取价差的范畴;做市者的回报取决于他们持在哪一方。如果利润纯粹来自价差,那么做市者买入 YES 还是 NO 本不应有差别。我们通过按头寸方向分解做市者表现来检验这一点:
按做市方头寸方向划分的超额收益
13579111417202326293235384144475053565962656871747780838689929599-3%0%3%6%9%Excess Return (%)
合约价格(美分)
- Maker 买入 YES
- Maker 买入 NO
买入 NO 的 Maker 在 59% 的情况下表现优于买入 YES 的 Maker。按成交量加权的超额回报为:买入 YES 的 Maker 为 +0.77 个百分点,而买入 NO 的 Maker 为 +1.25 个百分点,差距为 0.47 个百分点。该效应极其微小(Cohen's d = 0.02–0.03),但具有一致性。至少,这表明仅靠赚取价差并不能解释全部现象。
第二点观察进一步强化了这一论断:制造者与接受者之间的差价在不同市场类别间存在显著差异。
各类别间的差异
我们检验 maker-taker 差距是否因市场类别而异。如果这种偏差反映的是无信息需求,那么吸引较少成熟参与者的类别应显示出更大的差距。
| 类别 | 吃单方回报 | 挂单方回报 | 差距 | N 笔交易 |
|---|---|---|---|---|
| 体育 | -1.11% | +1.12% | 2.23 个百分点 | 43.6M |
| 政治 | -0.51% | +0.51% | 1.02 个百分点 | 4.9M |
| 加密货币 | -1.34% | +1.34% | 2.69 个百分点 | 6.7M |
| 财经 | -0.08% | +0.08% | 0.17 个百分点 | 4.4M |
| 天气 | -1.29% | +1.29% | 2.57 个百分点 | 4.4M |
| 娱乐 | -2.40% | +2.40% | 4.79 个百分点 | 1.5M |
| 媒体 | -3.64% | +3.64% | 7.28 个百分点 | 0.6M |
| 世界大事 | -3.66% | +3.66% | 7.32 个百分点 | 0.2M |
按类别划分的做市者与吃单者收益
SportsPoliticsCryptoFinanceWeatherEntertainmentOtherMedia-4%-2%0%2%4%Excess Return (%)
类别
- 接单方回报
- 挂单方回报
差异惊人。金融类别的差距仅为 0.17 个百分点;市场极其高效,接单方每笔交易仅损失 0.08%。在另一极端,世界事件和媒体的差距超过 7 个百分点。按交易量计最大的类别体育显示中等差距为 2.23 个百分点。鉴于 61 亿美元的接单量,即便是这一温和的差距也会带来可观的财富转移。
为什么金融效率高?更可能的解释是参与者的选择;金融问题吸引的是以概率和期望值思考的交易者,而不是为所爱球队下注的粉丝或为心仪候选人押注的党羽。问题本身也很枯燥(“标普会在 6000 点以上收盘吗?”),这会筛掉情绪化的赌徒。
随时间演变
制造者-接受者差距并非市场的固定特征;相反,它是随着平台增长而出现的。在 Kalshi 的早期,情况恰恰相反;接受者获得了正的超额回报,而制造者则亏损。
随时间变化的制造者-接受者回报
2021 Q42022 Q22022 Q42023 Q22023 Q42024 Q22024 Q42025 Q22025 Q4-6%-3%0%3%6%Excess Return (%)
季度
- 吃单者回报
- 挂单者回报
自平台推出至 2023 年,吃单者平均回报为+2.0%,而挂单者平均回报为-2.0%。在没有复杂对手方的情况下,吃单者占优;业余挂单者定义了早期阶段并成为亏损人群。该格局在 2024 年第二季度开始逆转,差距跨越零点,随后在 2024 年选举后急剧扩大。
这个拐点与两件事同时发生:Kalshi 在 2024 年 10 月对 CFTC 的法律胜诉,允许了政治合约的存在;以及随之而来的 2024 年选举周期。交易量从 2024 年第三季度的 3000 万美元暴增至 2024 年第四季度的 8.2 亿美元。新增的成交量吸引了成熟的做市商,并随之从吃单流中提取价值。
选举前,平均差为 -2.9 个百分点(接手者获胜);选举后转为 +2.5 个百分点(做市者获胜),变化幅度为 5.3 个百分点。
接手成交构成提供了进一步证据。如果财富转移是因为新参与者带着更强的长赔率偏好进入市场,我们应当看到分布向低概率合约偏移。但事实并非如此:
按价格划分的吃单量分布
2021 Q42022 Q22022 Q42023 Q22023 Q42024 Q22024 Q42025 Q22025 Q40%30%60%100%Share of Taker Volume (%)
季度
- 1 10
- 11 20
- 21 30
- 31 40
- 41 50
- 51 60
- 61 70
- 71 80
- 81 90
- 91 99
长尾合同(1–20 美分)中主动成交量的占比基本保持不变;选举前为 4.8%,选举后为 4.6%。总体分布实际上向中间价格段移动;91–99 美分区间从 2021–2023 年的 40–50%下降到 2025 年不足 20%,而中间价格(31–70 美分)显著增长。主动方行为并未变得更有偏见;如果有变化,反而是变得不那么极端。然而主动方的亏损增加了;新的做市商在所有价格水平上更高效地抽取价值。
这一演变重新界定了整体结果。从主动方到做市商的财富转移并非预测市场微观结构的必然属性;它需要成熟的做市商,而成熟的做市商需要足够的交易量以证明参与的价值。在低量的早期阶段,做市商很可能是不成熟的个人,他们输给了相对更有信息的主动方。随后交易量激增,吸引了能够从所有价格点的主动方流量中抽取价值的职业流动性提供者。
YES/NO 不对称性
制造者-接受者分解能识别出谁承担损失,但仍未解释他们的选择偏差如何运作。为什么接受者的成交流量总是被系统性地错误定价?原因并非制造者具备更高的远见,而是接受者对肯定性结果存在一种带来成本的偏好。
等价价格下的非对称性
标准效率模型暗示,在等价价格下,不同合约类型的错误定价应当是对称的;理论上,一份 1 美分的 YES 合约和一份 1 美分的 NO 合约应当反映相似的预期价值。但数据与这一假设相悖。在 1 美分的价格下,YES 合约的历史预期价值为-41%;买家在预期上损失近一半资本。相反,同价位的 NO 合约的历史预期价值为+23%。这两个看似相同的概率估计之间的差距达到 64 个百分点。
按合约价格划分的历史回报:是 与 否
13579111417202326293235384144475053565962656871747780838689929599-50%-25%0%25%50%Historical Return (%)
成本基数(分)
- “是”回报
- “否”回报
NO 合约的优势持续存在。在 99 个价格水平中,NO 在 69 个价位上表现优于 YES,且优势集中在市场极端。NO 合约在每一个从 1 到 10 美分以及再次从 91 到 99 美分的价位增量上都产生了更高的回报。
尽管市场是零和的,但按美元加权的回报对于 YES 买家为 -1.02%,而对 NO 买家为 +0.83%,二者相差 1.85 个百分点,这一差距源于 YES 合约的被高估。
交易者偏好肯定性押注
对“是”合约的表现欠佳可能与吃单者行为有关。对交易数据的细分揭示了订单流组成上的结构性失衡。
按价格划分的“是”与“否”成交量
1357911141720232629333639424548515458616467707376798386899295990%30%60%100%Share of Volume (%)
YES 合约 价格
- 接受方 是
- 发起方 是
- 接受方 否
- 发起方 否
在 1 到 10 美分区间,YES 代表冷门结果时,吃单者占 YES 成交量的 41%–47%;挂单者仅占 20%–24%。在概率曲线的另一端,这种不平衡被颠倒。当合约以 99 美分成交,意味着 NO 是 1 美分的冷门时,挂单者会积极购买 NO 合约,占成交量的 43%。吃单者的参与率仅为 23%。
有人可能会假设挂单者通过更优秀的方向性预测来利用这种不对称——他们只是知道何时买入 NO。但证据并不支持这一点。将挂单者的表现按仓位方向分解后,回报几乎相同。只有在极端尾部(1–10¢和 91–99¢)才出现统计学上显著的差异,即便如此,效应量也微乎其微(Cohen's d = 0.02–0.03)。这种对称性意味深长:挂单者并非通过知道押注方向获利,而是通过一种对两种方向都适用的机制获利。
讨论
对 Kalshi 上 7210 万笔交易的分析揭示了一种独特的市场微结构:财富系统性地从流动性接受者转移到流动性提供者。该现象由特定行为偏差驱动,受市场成熟度调节,并集中在引发高度情绪参与的类别中。
撤离机制
零和市场分析中的一个核心问题是:盈利参与者是通过更优的信息(预测)获胜,还是通过更优的结构(做市)获胜。我们的数据有力地支持后者。在按仓位方向分解做市者的回报时,表现差距微乎其微:做市者买入“YES”获得的超额回报为+0.77%,而买入“NO”者为+1.25%(Cohen’s d ≈ 0.02)。这种统计上的对称性表明,做市者并不具备显著的择优能力。相反,他们通过一种结构性套利获利:向偏好代价高昂的肯定性、长赔率结果的接受者群体提供流动性。

这种提取机制依赖于“乐观税”。在长赔率区间内,买入方以较高比例购买“是”合约——占该区间几乎一半的成交量,尽管“是”方向的长赔率合约表现比“否”方向的长赔率合约低多达 64 个百分点。因此,做市方并不需要预测未来;他们只需成为乐观情绪的对手方即可。这与 Reichenbach 和 Walther(2025)对 Polymarket 以及 Whelan(2025)对 Betfair 的研究结果一致,表明在预测市场中,做市方是顺应有偏的资金流,而不是在预测上胜过它。
流动性的职业化
做市-吃单收益随时间演变,挑战了“长投偏差必然导致财富转移”的假设。2021 年至 2023 年间,这种偏差确实存在,但吃单者仍保持正的超额收益。该趋势的逆转恰好与 Kalshi 在 2024 年 10 月赢得诉讼后出现的交易量爆发性增长同时发生。
2024 年末观察到的财富转移是市场深度的函数。在该平台早期,低流动性很可能阻止了复杂的算法做市商进入,使得订单簿主要由与吃单者在统计上无法区分的业余者填充。2024 年大选后的交易量激增,激励了能够系统性地捕捉价差并利用偏向性成交流的专业流动性提供者入场。长期赔率偏差本身可能已持续多年,但只有在市场深度增长到足以吸引这些复杂做市商之后,该偏差才成为可靠的利润提取来源。
类别差异与参与者选择
各类别间造市者-接单者差距的差异揭示了参与者选择如何影响市场效率。在极端一端,金融类的差距仅为 0.17 个百分点;几乎达到了完美效率。另一端,世界时事与媒体类超过 7 个百分点。此差异不能仅以长射手偏差(longshot bias)来解释;它反映了每个类别中选择交易者的不同。
- 金融(0.17 个百分点)作为对照组,表明预测市场可以接近效率。像“标普收盘是否会高于 6000?”这样的问题吸引那些以概率和期望值思考的参与者,很可能与交易期权或关注宏观经济数据的人群相同。获取有信息的参与的门槛很高,休闲赌徒没有优势并可能意识到这一点,从而自我筛选退出。
- 政治(1.02 个百分点)尽管情绪赌注高,但显示出中等程度的低效率。政治下注者密切跟踪民调,并通过选举周期练就了校准信念的能力。该差距大于金融类但远小于娱乐类,表明政治参与虽然情绪化,但并未完全侵蚀概率性推理。
- 运动(2.23 个百分点)代表了典型的预测市场参与者。鉴于该类占比 72%的交易量,差距虽为中等但影响重大。体育下注者表现出已被充分记录的偏差,包括主队偏好、近期效应以及对明星球员的叙事依恋。粉丝押注自家球队赢得冠军不是在计算期望值;他们是在购买希望。
- 加密货币(2.69 个百分点)吸引了受“数字要涨”心态驱动的参与者,这类人群与迷因股票交易者和非同质化代币投机者有重叠。像“Bitcoin 会涨到 10 万美元吗?”这样的问题更容易引发叙事性押注,而非对概率的估计。
- 娱乐、媒体与世界事件(4.79–7.32 个百分点)表现出最大的差距,并具有一个共同特征:被感知为有专业知识的门槛极低。凡是关注名人八卦的人都觉得有资格押注颁奖典礼结果;凡是看过头条的人都自认为了解地缘政治。这就形成了一个把熟悉感与校准能力混淆的参与者群体。
这一模式表明,效率取决于两个因素:有信息参与的技术门槛和问题在多大程度上引发情绪化推理。当门槛高且表述保持临床化时,市场趋近于效率;当门槛低且表述鼓励讲故事式的叙述时,乐观税达到最大值。
局限性
尽管数据可靠,但仍存在若干局限。首先,缺乏唯一交易者 ID 迫使我们将“做市/吃单”(Maker/Taker)分类作为“成熟/不成熟”交易者的替代指标。尽管这在微观结构文献中很常见,但它无法完美捕捉那些为争夺时效性信息而越过价差进行交易的成熟交易者。其次,我们无法在历史交易数据中直接观察买卖差价,这使得严格区分通过捕捉价差与利用有偏成交流获利变得困难。最后,这些结果特定于美国监管环境;在杠杆上限和费用结构不同的离岸交易场所可能会呈现不同的动态。
结论
预测市场的前景在于将多样化信息汇总为单一准确概率的能力。然而,我们对 Kalshi 的分析表明,这一信号常被由人类心理与市场微观结构驱动的系统性财富转移所扭曲。
市场分为两个截然不同的人群:一个是吃单者阶层,他们系统性地为低概率、肯定性结果支付过高价格;另一个是挂单者阶层,通过被动提供流动性来攫取这部分溢价。这一动态并非“群体智慧”的固有缺陷,而是人类心理与市场微观结构相互作用的表现。当话题枯燥且量化(金融)时,市场是有效的;当话题允许部落主义与希望(体育、娱乐)时,市场则变成了将财富从乐观者转移到精算者的机制。
参考文献
- Fama, E.F.,《有效资本市场:理论与实证工作的回顾》,Journal of Finance,1970。可获取: https://www.jstor.org/stable/2325486
- Griffith, R.M.,《美国赛马投注者的赔率调整》,American Journal of Psychology,1949。可获取: https://www.jstor.org/stable/1418469
- Reichenbach, F. & Walther, M.,《探索去中心化预测市场:Polymarket 的准确性、技能与偏差》,SSRN,2025。可获取: https://ssrn.com/abstract=5910522
- Thaler, R.H. & Ziemba, W.T.,《异常现象: pari-mutuel 赌注市场:赛马场与彩票》,Journal of Economic Perspectives,1988。可获取: https://www.aeaweb.org/articles?id=10.1257/jep.2.2.161
- Whelan, K.,《同意保留分歧:赌注交易所的经济学》,MPRA,2025 年。可用:https://mpra.ub.uni-muenchen.de/126351/1/MPRA_paper_126351.pdf
- 美国哥伦比亚特区联邦上诉法院,《Kalshi, Inc. 诉 CFTC》,2024 年 10 月。可获地址:https://media.cadc.uscourts.gov/opinions/docs/2024/10/24-5205-2077790.pdf