和积问题、单位距离问题与数域

Hacker News Top 2026/06/01 05:54 论文

摘要

Thomas Bloom 撰写了一篇综述博文，介绍了近期关于 Erdős 单位距离猜想和实数域上和积猜想的反例，包括借助 OpenAI 辅助推翻单位距离猜想的工作，以及通过合作推翻和积猜想的工作，并概述了相关构造方法及其背后的直觉。

暂无内容

查看原文

查看缓存全文

缓存时间: 2026/06/05 02:12

# 博客 - 和积问题、单位距离问题与数域 | Erdős 问题来源：https://www.erdosproblems.com/forum/thread/blog:6 作者：Thomas Bloom (https://www.erdosproblems.com/forum/user/TFBloom)，2026年5月31日在这篇博文中，我将分享我对近期实数上单位距离猜想与和积猜想反例的个人看法（分别见 [\[90\]](https://www.erdosproblems.com/90) 和 [\[52\]](https://www.erdosproblems.com/52)）。我的目标是勾勒出这些构造的轮廓，并尝试解释它们的来源及其有效性的直觉。我主要面向的读者是"一个月前的我"——那时我对代数数论知之甚少，需要有人解释该领域的基础知识，但又想了解定量改进究竟从何而来。（我现在懂了一些代数数论，但仍远不及我希望的程度！）我的关注点在组合数学一侧，一旦需要进行实质性的数论推导，我便会直接引用相关文献。（尤其是，我不打算讨论 [Golod-Shafarevich 定理](https://en.wikipedia.org/wiki/Golod%E2%80%93Shafarevich_theorem) 的陈述，更不用说其证明了。）本文中的任何错误完全由我本人负责。如果您对以下草述的证明有任何疑惑，建议您查阅原始文献。欢迎在评论区留言和指正。 OpenAI 对单位距离猜想的最初证伪可在[此处](https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf)阅读，配套的人工撰写论文在[此处](https://arxiv.org/abs/2605.20695)，Sawin 给出的显式（且改进的）版本在[此处](https://arxiv.org/abs/2605.20579)。由我、Sawin、Schildkraut 和 Zhelezov 合作的和积猜想证伪论文在[此处](https://arxiv.org/html/2605.28781v1)。 ### 热身练习考虑加法组合学中如下一个自然命题：若 $A+A=\{ a+b : a,b\in A\}$，$A-A=\{a-b : a,b\in A\}$，那么我们能如何用 $|A-A|$ 来上界 $|A+A|$？换言之，存在什么常数 $c$ 使得 $|A+A| \leq |A-A|^c$？取 $c=2$ 时这是平凡成立的，因为 $|A-A|\geq |A|$ 而 $|A+A|\leq |A|^2$。显然，对某些小集合可能会有奇怪的现象。但 $c$ 是否可以任意接近 $1$——即，只要 $|A|$ 关于 $\epsilon$ 足够大，便有 $c=1+\epsilon$？初步实验表明这或许可行——和集往往比差集小，在所有自然的例子中，凡是迫使 $A+A$ 变大的条件也同样迫使 $A-A$ 变大。因此，也许可以猜想 $|A+A| \leq |A-A|^{1+o(1)}$。然而，这是错的，原因在于"张量幂技巧"。首先注意到我从未说 $A$ 在哪里——或许你以为是整数集，但在加法组合学中，所有这些概念在任意阿贝尔群中都有意义，因此我们也可以考虑任意大维度 $d$ 中的有限集 $A\subset \mathbb{Z}^d$。这有什么帮助呢？首先，纯粹出于巧合／小数定律，找到一个 $A+A$ 相对于 $A-A$ 较大的例子。比如，若 $A=\{0, 2, 3, 4, 7, 11, 12, 14\}$，则 $A+A$ 有 $26$ 个元素，而 $A-A$ 有 $25$ 个元素。于是 $|A+A| \geq |A-A|^c$，其中 $c=\log_{25}(26)\approx 1.012$。你可能会说——这不过是一个特殊的有限集 $A$，我知道小集合可能很奇怪，所以我已经通过"指数仅对*足够大*的集合 $A$ 才是 $1+\epsilon$"来覆盖这种情况了。关键在于，我们可以将任何这样的固定例子放大为任意大的例子，且*行为保持不变*：若令 $B=A^d\subset \mathbb{Z}^d$，则和集与差集也都是笛卡尔积，故 $|B+B|=26^d$，$|B-B|=25^d$。这意味着存在任意大的集合 $B$（在某个阿贝尔群中），使得 $$|B+B| \geq |B-B|^{1.012\cdots}.$$ 因此最初的朴素猜想是错误的；最佳指数至少比 $1$ 大 $0.012$，而限制为"足够大的集合"也无法挽救它。（如果你对这类问题感兴趣，以及加法组合学中早期使用这类张量幂构造的例子，可参见[此页面](https://teorth.github.io/optimizationproblems/constants/3a.html)或 [\[GRH07\]](https://www.erdosproblems.com/forum/thread/blog:6#bib-container0)，作者为 Gyarmati、Ruzsa 和 Hennecart。）和积与单位距离反例中的构造具有类似的风格：先找到一个"平凡"的构造，仅赢得某个常数因子，然后通过取 $d$ 维版本（$d\to\infty$）来"放大"这个常数倍的优势。在上面的例子中，这很容易实现，因为对任意阿贝尔群 $G$，我们只需构造直积 $G^d$，一切均按预期缩放。然而，在和积与单位距离问题中，我们需要（a）分别在 $\mathbb{R}$ 和 $\mathbb{R}^2$ 中构造集合，而非在某个 $\mathbb{R}^d$ 中；（b）确保不仅加法，还有某个附加运算（分别为乘法和距离）也以某种可预测的方式缩放。前者其实问题不大，但后者需要一些实质性的工作。幸运的是，所有这些工作早已由代数数论完成了。 ### 代数数论速览我先对代数数论做一个非正式的速览，至少涵盖与我们相关的那一小部分。以下内容均可在任何研究生代数数论课程中找到。你可能希望先跳到本节末尾的总结，仅在内容陌生时再回头阅读。一个引人注目的地方在于，尽管素数、理想、类群等在代数数论中扮演核心角色，但为了解释这些构造，我们完全无需讨论甚至定义它们。 **数域** $K$ 是特征为 $0$ 的域，因此包含 $\mathbb{Q}$，且作为 $\mathbb{Q}$ 上的向量空间是有限维的。这个维数称为 $K$ 的**次数**。有限维意味着每个 $x\in K$ 在 $\mathbb{Q}$ 上都是代数的——即它是某个系数在 $\mathbb{Z}$ 中的多项式的根。如果存在这样一个首一多项式，则称 $x$ 为**代数整数**。$K$ 中的代数整数构成一个环，记为 $\mathcal{O}_K$。（注意这包含通常的整数，因为 $\mathbb{Z}\subset \mathbb{Q}\subset K$，而每个 $n\in\mathbb{Z}$ 都是 $x-n$ 的根。）这并非显然（例如，在我们的定义下，两个代数整数之和仍是代数整数并不显然），但这是任何代数数论课程中最先证明的结论之一。由于 $\mathbb{C}$ 包含 $\mathbb{Q}$ 的代数闭包，我们可以将 $K$ 视为 $\mathbb{C}$ 的子集——但重要的是，这种方式并不唯一。例如，令 $K=\mathbb{Q}(\sqrt{2})$，则 $\{1,\sqrt{2}\}$ 构成 $\mathbb{Q}$ 上的一组基，所以 $K$ 中每个 $x$ 都可以写成 $a+b\sqrt{2}$（$a,b\in\mathbb{Q}$）。这看起来是 $\mathbb{C}$（实际上是 $\mathbb{R}$）中的一个确定元素，直到我们想起 $\sqrt{2}$ 并不是唯一定义的——$x^2-2$ 在 $\mathbb{R}$ 中有两个不同的根：$1.41\cdots$ 和 $-1.41\cdots$。一旦我们确定指的是哪一个，就确定了 $K$ 嵌入 $\mathbb{R}$ 的方式，但这里存在选择。一般地，若 $K$ 的次数为 $d$，则恰好有 $d$ 个 $K$ 到 $\mathbb{C}$ 的嵌入（域同态）。如果所有这些嵌入实际上都是到 $\mathbb{R}$ 的映射（如 $\mathbb{Q}(\sqrt{2})$ 的情形），则称 $K$ 为**全实域**。任何不映入 $\mathbb{R}$ 的嵌入称为**复嵌入**——这些自然地通过共轭映射成对出现，因为若 $x\mapsto \sigma(x)$ 是一个嵌入，则 $x\mapsto \overline{\sigma(x)}$ 也是一个嵌入（若 $\sigma(x)\not\in \mathbb{R}$，则二者不同）。因此我们通常用 $r_1$ 表示实嵌入的个数，$r_2$ 表示不计共轭的复嵌入个数，从而 $d=r_1+2r_2$。这些嵌入给了我们一种将 $K$ 几何地视为高维空间的自然方式。为方便起见，假设 $K$ 是全实域，这样我们只需考虑 $\mathbb{R}$（下面的内容对任意数域均成立，只是需要注意共轭嵌入，某些 $\mathbb{R}$ 变成 $\mathbb{C}$）。我们有自然的映射（有时称为 Minkowski 映射） $$x\mapsto (\sigma_1(x),\ldots,\sigma_d(x)),$$ 其中 $\sigma_1,\ldots,\sigma_d$ 是 $K$ 到 $\mathbb{R}$ 的 $d$ 个嵌入。重要的是，正如 $\mathbb{Z}$ 在 $\mathbb{R}$ 中构成一个一维格，整数环 $\mathcal{O}_K$ 在此映射下在 $\mathbb{R}^d$ 中构成一个 $d$ 维格。格 $L$ 的**余体积**是其基向量所构成的平行体的体积，它基本上衡量格 $L$ 的紧密程度——例如 $\mathbb{Z}^d$ 的余体积为 $1$。由于 $\mathcal{O}_K$ 是 $\mathbb{R}^d$ 中的格，这是与 $K$ 自然相关的一个参数，我们称之为 $K$ 的**判别式** $\Delta_K$（这是一个简化说法——出于良好的代数原因，它实际上被定义为此余体积的平方，也许还乘以因子 $2^{r_2}$，但这对我们的目的无关紧要，所以将 $\Delta_K$ 理解为"$\mathcal{O}_K$ 格的余体积"即可）。我们以范数 $\|x\|=\|x\|_\infty$ 来赋予 $\mathbb{R}^d$ 度量，并称之为"大小"，从而 $x\in K$ 的"大小"为 $\max_{1\leq i\leq d}|\sigma_i(x)|$。重要的是，$\mathcal{O}_K$ 中的点在此范数下是 $1$-分离的；这最好通过范数映射 $N(x)=\prod \sigma_i(x)$ 来证明，它将代数整数映到整数。若 $x\neq y$ 是两个代数整数，则 $x-y$ 是非零代数整数，从而 $$1\leq |N(x-y)| = \prod_i |\sigma_i(x)-\sigma_i(y)|,$$ 故至少有一个坐标上 $x$ 与 $y$ 相差至少 $1$。这种分离性意味着，通过标准的数的几何理论，我们可以理解 $\mathcal{O}_K$ 的格与用该范数定义的各种凸集之交的大小——特别地，若 $$B^+(X)= \{ x\in \mathcal{O}_K : \| x\| \leq X\},$$ 则 $|B^+(X)|\approx X^d$，其中 $\approx$ 隐藏了 $O(1)^d$ 以及格余体积 $\Delta_K^{O(1)}$ 的损失。对于我们的应用，还需要另一个格。整数环 $\mathcal{O}_K$ 在乘法下一般不是群，因为它不包含乘法逆元。**单位群** $\mathcal{O}_K^\times$ 是满足以下条件的代数整数 $x$ 的集合：其乘法逆元 $x^{-1}$（显然在 $K$ 的某处存在）也是代数整数。人们最初可能认为这里没什么好说的——例如在 $\mathbb{Z}$ 中，只有两个单位：$1$ 和 $-1$。一般来说，任何单位根都是单位——它是代数整数（作为 $x^n-1$ 的根），而其乘法逆元是另一个单位根。但任何数域中单位根只有有限个，所以仅此而已吗？不！在我看来，数域的能量与丰富性的主要来源之一，恰恰是存在许多非平凡的单位；例如在 $\mathbb{Q}(\sqrt{3})$ 中，$2+\sqrt{3}$ 是一个单位，因为它与 $2-\sqrt{3}$ 都是 $x^2-4x+1$ 的根，且 $(2+\sqrt{3})(2-\sqrt{3})=4-3=1$。而所有幂次 $(2+\sqrt{3})^k$（$k\geq 1$）也都是不同的单位，所以有无穷多个。确实，[Dirichlet 单位定理](https://en.wikipedia.org/wiki/Dirichlet%27s_unit_theorem)指出，（去掉单位根之后）单位群同构于 $\mathbb{Z}^{r_1+r_2-1}$。我们仍假设 $K$ 是全实域，故 $r_2=0$，单位群的秩为 $d-1$。单位群也可视为 $\mathbb{R}^d$ 的子集，此时通过嵌入 $$u\mapsto (\log |\sigma_1(u)|,\ldots,\log|\sigma_d(u)|).$$ （我们取对数映射，是为了将单位上的自然运算——乘法——转化为 $\mathbb{R}^d$ 上的自然运算——加法。）这意味着我们可以将 $\mathcal{O}_K^\times$ 视为 $\mathbb{R}^d$ 的子集。人们可能首先预期它在 $\mathbb{R}^d$ 中构成一个格，这是对的，但不是满秩的——它的秩为 $d-1$，实际上包含在超平面 $x_1+\cdots+x_d=0$ 中，因为任何单位的范数为 $\pm 1$，故 $$1=|N(u)|=\prod_{i} |\sigma_i(u)|,$$ 从而 $\sum \log |\sigma_i(u)|=0$。然而事实证明这是唯一的约束，$\mathcal{O}_K^\times$ 在这个超平面内构成满秩格。$\mathcal{O}_K^\times$ 中的点在 $L^\infty$ 范数下仍有某个绝对常数的分离性，因此集合 $$B^\times(Y) = \{ u\in \mathcal{O}_K^\times : \| u\| \leq Y\}$$ 如上所述有 $\approx Y^{d-1}$ 个元素，其中 $\approx$ 隐藏了 $O(1)^{d-1}$ 以及单位格余体积的损失。（但注意，写 $\|u\|$ 时，我们是将 $u$ 视为对数嵌入下 $\mathbb{R}^d$ 中的元素，而非 Minkowski 嵌入下的元素。）那么单位格的余体积是多少？肯定不再是 $\Delta_K$——这是一个新参数，称为 $K$ 的**调节子** $R_K$。幸运的是，事实证明二者密切相关：$R_K\leq \Delta_K^{O(1)}$。我不知道这有没有初等的"简单"证明，但这是一个非常经典的结论，例如由[类数公式](https://en.wikipedia.org/wiki/Class_number_formula)可以推出（已有许多论文精确刻画了 $\Delta_K$、$R_K$ 以及类数等参数之间的定量关系，但对我们来说粗略界 $R_K\leq \Delta_K^{O(1)}$ 已经足够）。总结如下： - 在次数为 $d$ 的数域 $K$ 中，整数环 $\mathcal{O}_K$ 是 $\mathbb{R}^d$ 中的秩为 $d$ 的格，而 $B^+(X)$（即 $\mathcal{O}_K$ 中满足 $\|x\|_\infty\leq X$ 的元素的集合）的大小增长如 $\approx X^d$。 - 单位群 $\mathcal{O}_K^\times$ 是 $\mathbb{R}^d$ 中的秩为 $d-1$ 的格，而 $B^\times(Y)$（即 $\mathcal{O}_K^\times$ 中满足 $\|u\|_\infty \leq Y$ 的元素的集合）的大小增长如 $\approx Y^{d-1}$。 - $\mathcal{O}_K^\times$ 的嵌入是 $\mathcal{O}_K$ 嵌入的对数版本，故特别有 $B^\times(Y)\subseteq B^+(e^Y)$。 - 上述所有 $\approx$ 均隐藏了 $O(1)^d\Delta_K^{O(1)}$ 的损失。 - 以上假设 $K$ 是全实域（无复嵌入），但对任意数域均有类似的陈述，只需额外注意共轭嵌入的处理。

和积问题、单位距离问题与数域

相似文章

人类数学家正在被反例超越

OpenAI声称其通用推理模型找到了Erdos单位距离猜想的一个反例 [D]

@wjmzbmr1: 1/ 今天，@OpenAI 的一个内部模型反驳了 Erdős 的单位距离猜想——一个可以毫不犹豫推荐给《数学年鉴》的研究成果……

埃尔德什的突破

@logic_int: 新消息：Aleph Prover 已形式化 OpenAI 对保罗·埃尔德什平面单位问题的反证。我们正在发布形式化…

提交意见反馈