和积问题、单位距离问题与数域
摘要
Thomas Bloom 撰写了一篇综述博文,介绍了近期关于 Erdős 单位距离猜想和实数域上和积猜想的反例,包括借助 OpenAI 辅助推翻单位距离猜想的工作,以及通过合作推翻和积猜想的工作,并概述了相关构造方法及其背后的直觉。
暂无内容
查看缓存全文
缓存时间: 2026/06/05 02:12
# 博客 - 和积问题、单位距离问题与数域 | Erdős 问题
来源:https://www.erdosproblems.com/forum/thread/blog:6
作者:Thomas Bloom (https://www.erdosproblems.com/forum/user/TFBloom),2026年5月31日
在这篇博文中,我将分享我对近期实数上单位距离猜想与和积猜想反例的个人看法(分别见 [\[90\]](https://www.erdosproblems.com/90) 和 [\[52\]](https://www.erdosproblems.com/52))。我的目标是勾勒出这些构造的轮廓,并尝试解释它们的来源及其有效性的直觉。我主要面向的读者是"一个月前的我"——那时我对代数数论知之甚少,需要有人解释该领域的基础知识,但又想了解定量改进究竟从何而来。(我现在懂了一些代数数论,但仍远不及我希望的程度!)我的关注点在组合数学一侧,一旦需要进行实质性的数论推导,我便会直接引用相关文献。(尤其是,我不打算讨论 [Golod-Shafarevich 定理](https://en.wikipedia.org/wiki/Golod%E2%80%93Shafarevich_theorem) 的陈述,更不用说其证明了。)
本文中的任何错误完全由我本人负责。如果您对以下草述的证明有任何疑惑,建议您查阅原始文献。欢迎在评论区留言和指正。
OpenAI 对单位距离猜想的最初证伪可在[此处](https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf)阅读,配套的人工撰写论文在[此处](https://arxiv.org/abs/2605.20695),Sawin 给出的显式(且改进的)版本在[此处](https://arxiv.org/abs/2605.20579)。由我、Sawin、Schildkraut 和 Zhelezov 合作的和积猜想证伪论文在[此处](https://arxiv.org/html/2605.28781v1)。
### 热身练习
考虑加法组合学中如下一个自然命题:若 $A+A=\{ a+b : a,b\in A\}$,$A-A=\{a-b : a,b\in A\}$,那么我们能如何用 $|A-A|$ 来上界 $|A+A|$?换言之,存在什么常数 $c$ 使得 $|A+A| \leq |A-A|^c$?取 $c=2$ 时这是平凡成立的,因为 $|A-A|\geq |A|$ 而 $|A+A|\leq |A|^2$。显然,对某些小集合可能会有奇怪的现象。但 $c$ 是否可以任意接近 $1$——即,只要 $|A|$ 关于 $\epsilon$ 足够大,便有 $c=1+\epsilon$?初步实验表明这或许可行——和集往往比差集小,在所有自然的例子中,凡是迫使 $A+A$ 变大的条件也同样迫使 $A-A$ 变大。
因此,也许可以猜想 $|A+A| \leq |A-A|^{1+o(1)}$。然而,这是错的,原因在于"张量幂技巧"。首先注意到我从未说 $A$ 在哪里——或许你以为是整数集,但在加法组合学中,所有这些概念在任意阿贝尔群中都有意义,因此我们也可以考虑任意大维度 $d$ 中的有限集 $A\subset \mathbb{Z}^d$。
这有什么帮助呢?首先,纯粹出于巧合/小数定律,找到一个 $A+A$ 相对于 $A-A$ 较大的例子。比如,若 $A=\{0, 2, 3, 4, 7, 11, 12, 14\}$,则 $A+A$ 有 $26$ 个元素,而 $A-A$ 有 $25$ 个元素。于是 $|A+A| \geq |A-A|^c$,其中 $c=\log_{25}(26)\approx 1.012$。你可能会说——这不过是一个特殊的有限集 $A$,我知道小集合可能很奇怪,所以我已经通过"指数仅对*足够大*的集合 $A$ 才是 $1+\epsilon$"来覆盖这种情况了。关键在于,我们可以将任何这样的固定例子放大为任意大的例子,且*行为保持不变*:若令 $B=A^d\subset \mathbb{Z}^d$,则和集与差集也都是笛卡尔积,故 $|B+B|=26^d$,$|B-B|=25^d$。这意味着存在任意大的集合 $B$(在某个阿贝尔群中),使得
$$|B+B| \geq |B-B|^{1.012\cdots}.$$
因此最初的朴素猜想是错误的;最佳指数至少比 $1$ 大 $0.012$,而限制为"足够大的集合"也无法挽救它。
(如果你对这类问题感兴趣,以及加法组合学中早期使用这类张量幂构造的例子,可参见[此页面](https://teorth.github.io/optimizationproblems/constants/3a.html)或 [\[GRH07\]](https://www.erdosproblems.com/forum/thread/blog:6#bib-container0),作者为 Gyarmati、Ruzsa 和 Hennecart。)
和积与单位距离反例中的构造具有类似的风格:先找到一个"平凡"的构造,仅赢得某个常数因子,然后通过取 $d$ 维版本($d\to\infty$)来"放大"这个常数倍的优势。在上面的例子中,这很容易实现,因为对任意阿贝尔群 $G$,我们只需构造直积 $G^d$,一切均按预期缩放。然而,在和积与单位距离问题中,我们需要(a)分别在 $\mathbb{R}$ 和 $\mathbb{R}^2$ 中构造集合,而非在某个 $\mathbb{R}^d$ 中;(b)确保不仅加法,还有某个附加运算(分别为乘法和距离)也以某种可预测的方式缩放。
前者其实问题不大,但后者需要一些实质性的工作。幸运的是,所有这些工作早已由代数数论完成了。
### 代数数论速览
我先对代数数论做一个非正式的速览,至少涵盖与我们相关的那一小部分。以下内容均可在任何研究生代数数论课程中找到。你可能希望先跳到本节末尾的总结,仅在内容陌生时再回头阅读。一个引人注目的地方在于,尽管素数、理想、类群等在代数数论中扮演核心角色,但为了解释这些构造,我们完全无需讨论甚至定义它们。
**数域** $K$ 是特征为 $0$ 的域,因此包含 $\mathbb{Q}$,且作为 $\mathbb{Q}$ 上的向量空间是有限维的。这个维数称为 $K$ 的**次数**。有限维意味着每个 $x\in K$ 在 $\mathbb{Q}$ 上都是代数的——即它是某个系数在 $\mathbb{Z}$ 中的多项式的根。如果存在这样一个首一多项式,则称 $x$ 为**代数整数**。$K$ 中的代数整数构成一个环,记为 $\mathcal{O}_K$。(注意这包含通常的整数,因为 $\mathbb{Z}\subset \mathbb{Q}\subset K$,而每个 $n\in\mathbb{Z}$ 都是 $x-n$ 的根。)这并非显然(例如,在我们的定义下,两个代数整数之和仍是代数整数并不显然),但这是任何代数数论课程中最先证明的结论之一。
由于 $\mathbb{C}$ 包含 $\mathbb{Q}$ 的代数闭包,我们可以将 $K$ 视为 $\mathbb{C}$ 的子集——但重要的是,这种方式并不唯一。例如,令 $K=\mathbb{Q}(\sqrt{2})$,则 $\{1,\sqrt{2}\}$ 构成 $\mathbb{Q}$ 上的一组基,所以 $K$ 中每个 $x$ 都可以写成 $a+b\sqrt{2}$($a,b\in\mathbb{Q}$)。这看起来是 $\mathbb{C}$(实际上是 $\mathbb{R}$)中的一个确定元素,直到我们想起 $\sqrt{2}$ 并不是唯一定义的——$x^2-2$ 在 $\mathbb{R}$ 中有两个不同的根:$1.41\cdots$ 和 $-1.41\cdots$。一旦我们确定指的是哪一个,就确定了 $K$ 嵌入 $\mathbb{R}$ 的方式,但这里存在选择。
一般地,若 $K$ 的次数为 $d$,则恰好有 $d$ 个 $K$ 到 $\mathbb{C}$ 的嵌入(域同态)。如果所有这些嵌入实际上都是到 $\mathbb{R}$ 的映射(如 $\mathbb{Q}(\sqrt{2})$ 的情形),则称 $K$ 为**全实域**。任何不映入 $\mathbb{R}$ 的嵌入称为**复嵌入**——这些自然地通过共轭映射成对出现,因为若 $x\mapsto \sigma(x)$ 是一个嵌入,则 $x\mapsto \overline{\sigma(x)}$ 也是一个嵌入(若 $\sigma(x)\not\in \mathbb{R}$,则二者不同)。因此我们通常用 $r_1$ 表示实嵌入的个数,$r_2$ 表示不计共轭的复嵌入个数,从而 $d=r_1+2r_2$。
这些嵌入给了我们一种将 $K$ 几何地视为高维空间的自然方式。为方便起见,假设 $K$ 是全实域,这样我们只需考虑 $\mathbb{R}$(下面的内容对任意数域均成立,只是需要注意共轭嵌入,某些 $\mathbb{R}$ 变成 $\mathbb{C}$)。我们有自然的映射(有时称为 Minkowski 映射)
$$x\mapsto (\sigma_1(x),\ldots,\sigma_d(x)),$$
其中 $\sigma_1,\ldots,\sigma_d$ 是 $K$ 到 $\mathbb{R}$ 的 $d$ 个嵌入。重要的是,正如 $\mathbb{Z}$ 在 $\mathbb{R}$ 中构成一个一维格,整数环 $\mathcal{O}_K$ 在此映射下在 $\mathbb{R}^d$ 中构成一个 $d$ 维格。
格 $L$ 的**余体积**是其基向量所构成的平行体的体积,它基本上衡量格 $L$ 的紧密程度——例如 $\mathbb{Z}^d$ 的余体积为 $1$。由于 $\mathcal{O}_K$ 是 $\mathbb{R}^d$ 中的格,这是与 $K$ 自然相关的一个参数,我们称之为 $K$ 的**判别式** $\Delta_K$(这是一个简化说法——出于良好的代数原因,它实际上被定义为此余体积的平方,也许还乘以因子 $2^{r_2}$,但这对我们的目的无关紧要,所以将 $\Delta_K$ 理解为"$\mathcal{O}_K$ 格的余体积"即可)。
我们以范数 $\|x\|=\|x\|_\infty$ 来赋予 $\mathbb{R}^d$ 度量,并称之为"大小",从而 $x\in K$ 的"大小"为 $\max_{1\leq i\leq d}|\sigma_i(x)|$。重要的是,$\mathcal{O}_K$ 中的点在此范数下是 $1$-分离的;这最好通过范数映射 $N(x)=\prod \sigma_i(x)$ 来证明,它将代数整数映到整数。若 $x\neq y$ 是两个代数整数,则 $x-y$ 是非零代数整数,从而
$$1\leq |N(x-y)| = \prod_i |\sigma_i(x)-\sigma_i(y)|,$$
故至少有一个坐标上 $x$ 与 $y$ 相差至少 $1$。
这种分离性意味着,通过标准的数的几何理论,我们可以理解 $\mathcal{O}_K$ 的格与用该范数定义的各种凸集之交的大小——特别地,若
$$B^+(X)= \{ x\in \mathcal{O}_K : \| x\| \leq X\},$$
则 $|B^+(X)|\approx X^d$,其中 $\approx$ 隐藏了 $O(1)^d$ 以及格余体积 $\Delta_K^{O(1)}$ 的损失。
对于我们的应用,还需要另一个格。整数环 $\mathcal{O}_K$ 在乘法下一般不是群,因为它不包含乘法逆元。**单位群** $\mathcal{O}_K^\times$ 是满足以下条件的代数整数 $x$ 的集合:其乘法逆元 $x^{-1}$(显然在 $K$ 的某处存在)也是代数整数。
人们最初可能认为这里没什么好说的——例如在 $\mathbb{Z}$ 中,只有两个单位:$1$ 和 $-1$。一般来说,任何单位根都是单位——它是代数整数(作为 $x^n-1$ 的根),而其乘法逆元是另一个单位根。但任何数域中单位根只有有限个,所以仅此而已吗?不!在我看来,数域的能量与丰富性的主要来源之一,恰恰是存在许多非平凡的单位;例如在 $\mathbb{Q}(\sqrt{3})$ 中,$2+\sqrt{3}$ 是一个单位,因为它与 $2-\sqrt{3}$ 都是 $x^2-4x+1$ 的根,且 $(2+\sqrt{3})(2-\sqrt{3})=4-3=1$。而所有幂次 $(2+\sqrt{3})^k$($k\geq 1$)也都是不同的单位,所以有无穷多个。
确实,[Dirichlet 单位定理](https://en.wikipedia.org/wiki/Dirichlet%27s_unit_theorem)指出,(去掉单位根之后)单位群同构于 $\mathbb{Z}^{r_1+r_2-1}$。我们仍假设 $K$ 是全实域,故 $r_2=0$,单位群的秩为 $d-1$。
单位群也可视为 $\mathbb{R}^d$ 的子集,此时通过嵌入
$$u\mapsto (\log |\sigma_1(u)|,\ldots,\log|\sigma_d(u)|).$$
(我们取对数映射,是为了将单位上的自然运算——乘法——转化为 $\mathbb{R}^d$ 上的自然运算——加法。)这意味着我们可以将 $\mathcal{O}_K^\times$ 视为 $\mathbb{R}^d$ 的子集。人们可能首先预期它在 $\mathbb{R}^d$ 中构成一个格,这是对的,但不是满秩的——它的秩为 $d-1$,实际上包含在超平面 $x_1+\cdots+x_d=0$ 中,因为任何单位的范数为 $\pm 1$,故
$$1=|N(u)|=\prod_{i} |\sigma_i(u)|,$$
从而 $\sum \log |\sigma_i(u)|=0$。然而事实证明这是唯一的约束,$\mathcal{O}_K^\times$ 在这个超平面内构成满秩格。$\mathcal{O}_K^\times$ 中的点在 $L^\infty$ 范数下仍有某个绝对常数的分离性,因此集合
$$B^\times(Y) = \{ u\in \mathcal{O}_K^\times : \| u\| \leq Y\}$$
如上所述有 $\approx Y^{d-1}$ 个元素,其中 $\approx$ 隐藏了 $O(1)^{d-1}$ 以及单位格余体积的损失。(但注意,写 $\|u\|$ 时,我们是将 $u$ 视为对数嵌入下 $\mathbb{R}^d$ 中的元素,而非 Minkowski 嵌入下的元素。)
那么单位格的余体积是多少?肯定不再是 $\Delta_K$——这是一个新参数,称为 $K$ 的**调节子** $R_K$。幸运的是,事实证明二者密切相关:$R_K\leq \Delta_K^{O(1)}$。我不知道这有没有初等的"简单"证明,但这是一个非常经典的结论,例如由[类数公式](https://en.wikipedia.org/wiki/Class_number_formula)可以推出(已有许多论文精确刻画了 $\Delta_K$、$R_K$ 以及类数等参数之间的定量关系,但对我们来说粗略界 $R_K\leq \Delta_K^{O(1)}$ 已经足够)。
总结如下:
- 在次数为 $d$ 的数域 $K$ 中,整数环 $\mathcal{O}_K$ 是 $\mathbb{R}^d$ 中的秩为 $d$ 的格,而 $B^+(X)$(即 $\mathcal{O}_K$ 中满足 $\|x\|_\infty\leq X$ 的元素的集合)的大小增长如 $\approx X^d$。
- 单位群 $\mathcal{O}_K^\times$ 是 $\mathbb{R}^d$ 中的秩为 $d-1$ 的格,而 $B^\times(Y)$(即 $\mathcal{O}_K^\times$ 中满足 $\|u\|_\infty \leq Y$ 的元素的集合)的大小增长如 $\approx Y^{d-1}$。
- $\mathcal{O}_K^\times$ 的嵌入是 $\mathcal{O}_K$ 嵌入的对数版本,故特别有 $B^\times(Y)\subseteq B^+(e^Y)$。
- 上述所有 $\approx$ 均隐藏了 $O(1)^d\Delta_K^{O(1)}$ 的损失。
- 以上假设 $K$ 是全实域(无复嵌入),但对任意数域均有类似的陈述,只需额外注意共轭嵌入的处理。
相似文章
OpenAI声称其通用推理模型找到了Erdos单位距离猜想的一个反例 [D]
OpenAI声称其通用推理模型发现了Erdős平面单位距离问题中一个猜想上界的反例,并生成了一个经数学家审阅的证明。
@wjmzbmr1: 1/ 今天,@OpenAI 的一个内部模型反驳了 Erdős 的单位距离猜想——一个可以毫不犹豫推荐给《数学年鉴》的研究成果……
OpenAI 的一个内部模型推翻了 Erdős 的单位距离猜想,解决了一个著名的数学难题,展示了 AI 在高水平研究中做出贡献的潜力。
埃尔德什的突破
OpenAI 模型自主解决了平面单位距离问题,这是由保罗·埃尔德什于1946年提出的著名数学开放问题。该模型发现了一组超越方格的新构造。这标志着人工智能首次自主证明了一个重要的数学开放问题。
@logic_int: 新消息:Aleph Prover 已形式化 OpenAI 对保罗·埃尔德什平面单位问题的反证。我们正在发布形式化…
Aleph Prover 已在 Lean 4 中形式化了 OpenAI 对保罗·埃尔德什平面单位问题的反证,并将其作为开源发布以供独立验证,展示了人工智能在加速数学研究中的作用,同时提供了可验证的证明数据。
OpenAI模型解决困扰人类80年的著名数学难题
OpenAI的AI模型推翻了埃尔德什单位距离猜想(Erdős unit distance conjecture),这是一个困扰数学家80年的离散几何著名难题,标志着AI数学领域的里程碑。