TabPFN-3：技术报告

arXiv cs.LG 2026/05/15 04:00 论文

tabular-data foundation-model synthetic-data time-series scaling pretraining machine-learning

摘要

TabPFN-3 是一个新的表格数据基础模型，在合成数据上预训练，可扩展到 100 万训练行，同时减少训练和推理时间，在表格预测、时间序列和关系数据上实现了最先进的性能。

arXiv:2605.13986v1 公告类型: 新 \n 摘要：表格数据支撑了科学和工业中大多数高价值预测问题，而 TabPFN 推动了该模态的基础模型革命。根据用户反馈设计，TabPFN-3 在此基础之上将最先进的性能扩展到包含 100 万训练行的数据集，并大幅减少训练和推理时间。TabPFN-3 完全基于我们之前的工作在合成数据上进行预训练，显著推动了表格预测的前沿，并在时间序列、关系和表格文本数据上带来显著提升。在标准表格基准 TabArena 上，TabPFN-3 的前向传播以显著优势优于所有其他模型（包括调优和集成基线），并在速度/性能帕累托前沿上占优。在更多样化的数据集上，TabPFN-3 在具有许多类别的数据集上排名第一，并在多达 100 万训练行和 200 个特征的数据集上击败了经过 8 小时调优的梯度提升树基线。TabPFN-3 将测试时计算扩展引入表格基础模型。我们的 API 产品 TabPFN-3-Plus (Thinking) 利用此功能在 TabArena 上以超过 200 Elo 的优势击败所有非 TabPFN 模型，在最大数据子集上 Elo 提升至 420，并且在不使用 LLM、真实数据、互联网搜索或除 TabPFN 之外的任何其他模型的情况下，比 AutoGluon 1.5 extreme 表现更好且速度快 10 倍。TabPFN-3 扩展了模型的能力，实现了对关系数据（RelBenchV1 上新的 SOTA 基础模型）和表格文本数据（通过 TabPFN-3-Plus 在 TabSTAR 上达到 SOTA）的 SOTA 预测；并改进了现有集成：专用检查点 TabPFN-TS-3 在时间序列基准 fev-bench 上排名第二，SHAP 值计算速度提升高达 120 倍。TabPFN-3 在实现这一性能的同时，速度比 TabPFN-2.5 快达 20 倍。此外，缩减的 KV 缓存和行分块技术使其可在单张 H100 上扩展到 100 万行，且推理速度极快。

查看原文

查看缓存全文

缓存时间: 2026/05/15 06:26

# TabPFN-3: 技术报告
来源：https://arxiv.org/abs/2605.13986
作者：Léo Grinsztajn (https://arxiv.org/search/cs?searchtype=author&query=Grinsztajn,+L), Klemens Flöge (https://arxiv.org/search/cs?searchtype=author&query=Fl%C3%B6ge,+K), Oscar Key (https://arxiv.org/search/cs?searchtype=author&query=Key,+O), Felix Birkel (https://arxiv.org/search/cs?searchtype=author&query=Birkel,+F), Philipp Jund (https://arxiv.org/search/cs?searchtype=author&query=Jund,+P), Brendan Roof (https://arxiv.org/search/cs?searchtype=author&query=Roof,+B), Mihir Manium (https://arxiv.org/search/cs?searchtype=author&query=Manium,+M), Shi Bin (https://arxiv.org/search/cs?searchtype=author&query=Bin,+S)（Liam）Hoo, Magnus Bühler (https://arxiv.org/search/cs?searchtype=author&query=B%C3%BChler,+M), Anurag Garg (https://arxiv.org/search/cs?searchtype=author&query=Garg,+A), Dominik Safaric (https://arxiv.org/search/cs?searchtype=author&query=Safaric,+D), Jake Robertson (https://arxiv.org/search/cs?searchtype=author&query=Robertson,+J), Benjamin Jäger (https://arxiv.org/search/cs?searchtype=author&query=J%C3%A4ger,+B), Simone Alessi (https://arxiv.org/search/cs?searchtype=author&query=Alessi,+S), Adrian Hayler (https://arxiv.org/search/cs?searchtype=author&query=Hayler,+A), Vladyslav Moroshan (https://arxiv.org/search/cs?searchtype=author&query=Moroshan,+V), Lennart Purucker (https://arxiv.org/search/cs?searchtype=author&query=Purucker,+L), Philipp Singer (https://arxiv.org/search/cs?searchtype=author&query=Singer,+P), Alan Arazi (https://arxiv.org/search/cs?searchtype=author&query=Arazi,+A), Julien Siems (https://arxiv.org/search/cs?searchtype=author&query=Siems,+J), Jan Hendrik Metzen (https://arxiv.org/search/cs?searchtype=author&query=Metzen,+J+H), Georg Grab (https://arxiv.org/search/cs?searchtype=author&query=Grab,+G), Nick Erickson (https://arxiv.org/search/cs?searchtype=author&query=Erickson,+N), Siyuan Guo (https://arxiv.org/search/cs?searchtype=author&query=Guo,+S), Eliott Kalfon (https://arxiv.org/search/cs?searchtype=author&query=Kalfon,+E), Simon Bing (https://arxiv.org/search/cs?searchtype=author&query=Bing,+S), David Salinas (https://arxiv.org/search/cs?searchtype=author&query=Salinas,+D), Clara Cornu (https://arxiv.org/search/cs?searchtype=author&query=Cornu,+C), Lilly Charlotte Wehrhahn (https://arxiv.org/search/cs?searchtype=author&query=Wehrhahn,+L+C), Diana Kriuchkova (https://arxiv.org/search/cs?searchtype=author&query=Kriuchkova,+D), Kursat Kaya (https://arxiv.org/search/cs?searchtype=author&query=Kaya,+K), Lydia Sidhoum (https://arxiv.org/search/cs?searchtype=author&query=Sidhoum,+L), Marie Salmon (https://arxiv.org/search/cs?searchtype=author&query=Salmon,+M), Jerry Chen (https://arxiv.org/search/cs?searchtype=author&query=Chen,+J), Madelon Hulsebos (https://arxiv.org/search/cs?searchtype=author&query=Hulsebos,+M), Yann LeCun (https://arxiv.org/search/cs?searchtype=author&query=LeCun,+Y), Samuel Müller (https://arxiv.org/search/cs?searchtype=author&query=M%C3%BCller,+S), Bernhard Schölkopf (https://arxiv.org/search/cs?searchtype=author&query=Sch%C3%B6lkopf,+B), Sauraj Gambhir (https://arxiv.org/search/cs?searchtype=author&query=Gambhir,+S), Noah Hollmann (https://arxiv.org/search/cs?searchtype=author&query=Hollmann,+N), Frank Hutter (https://arxiv.org/search/cs?searchtype=author&query=Hutter,+F)

查看 PDF (https://arxiv.org/pdf/2605.13986)

> **摘要：**表格数据支撑着科学和工业领域中大多数高价值的预测问题，而 TabPFN 推动了这类模态的基础模型革命。根据用户的反馈，TabPFN-3 在此基础之上进行构建，将最先进的性能扩展到包含 100 万训练行的数据集，并大幅减少了训练和推理时间。TabPFN-3 仅在我们先验分布的合成数据上进行预训练，极大地推进了表格预测的前沿，并在时间序列、关系型和表格-文本数据上带来了显著的收益。在标准的表格基准 TabArena 上，TabPFN-3 的一次前向传播显著优于所有其他模型（包括经过调优和集成的基线），并在速度/性能前沿上实现了帕累托最优。在更多样化的数据集上，TabPFN-3 在多类数据集上排名第一，并在拥有最多 100 万训练行和 200 个特征的数据集上超越了经过 8 小时调优的梯度提升树基线。TabPFN-3 将测试时计算扩展引入了表格基础模型。我们的 API 产品 TabPFN-3-Plus (思考版) 利用这一点，在 TabArena 上以超过 200 Elo 的优势击败所有非 TabPFN 模型，在最大的数据子集上 Elo 差距升至 420，并且性能优于 AutoGluon 1.5 extreme，同时速度快 10 倍，且无需使用 LLM、真实数据、互联网搜索或除 TabPFN 之外的任何其他模型。TabPFN-3 扩展了我们模型的能力，在关系型数据上实现 SOTA 预测（RelBenchV1 上的新 SOTA 基础模型），在表格-文本数据上实现 SOTA（TabPFN-3-Plus 在 TabSTAR 上达到 SOTA）；并改进了现有集成：一个专门的检查点 TabPFN-TS-3 在时间序列基准 fev-bench 上排名第二，SHAP 值的计算速度提升高达 120 倍。TabPFN-3 在实现这一性能的同时，速度比 TabPFN-2.5 快达 20 倍。此外，缩减的 KV 缓存和行分块技术可在单个 H100 上扩展到 100 万行，且推理速度很快。

## 提交历史

来自：Léo Grinsztajn [查看电子邮件 (https://arxiv.org/show-email/a28b4712/2605.13986)] **[v1]** 星期三, 2026年5月13日 18:01:43 UTC (4,428 KB)

TabPFN-3：技术报告

相似文章

TabPFN-3刚刚发布：一款支持高达100万行的预训练表格基础模型 [R][N]

PriorLabs/TabPFN

TabPFN-MT: 一种面向表格数据的原生多任务上下文学习器

GOTabPFN：从特征排序到紧凑标记化——面向高维数据的表格基础模型

当表格基础模型遇到策略性表格数据：一种先验对齐方法

提交意见反馈