AI 最有希望攻克的 10 个 Erdős 开放问题

筛选标准 — 为什么是这 10 个？

可计算攻击 — 问题状态为 falsifiable/verifiable，或含显式可计算函数 $f(n)$
数据丰富 — 已关联 OEIS 整数序列，有已知小值可供外推
接近突破 — 当前最佳界与猜想之间差距小
组合结构 — 涉及有限对象，可枚举、可搜索
形式化 — 已有精确的 Lean 形式化陈述，可机器验证证明

排名	问题	AI 攻击方式	信心
1	问题 36 — 最小重叠常数	LLM/进化搜索（AI 已有贡献！）	极高
2	问题 242 — Erdős-Straus 猜想	参数族搜索 + 覆盖系统	高
3	问题 23 — 无三角图的二部化	Flag algebra SDP 优化	高
4	问题 82 — 最大正则导出子图	精确计算 + 模式发现	高
5	问题 168 — 避免 {n,2n,3n} 的密度	高精度计算 + PSLQ 算法	中高
6	问题 647 — 除数函数间隙	GPU 加速筛法搜索	中高
7	问题 340 — 贪心 Sidon 序列增长率	大规模计算 + 增长分析	中
8	问题 128 — 稠密子图蕴含三角形	Flag algebra SDP	中
9	问题 470 — 奇怪异数	约束智能搜索	中
10	问题 699 — 二项式系数 GCD 中的素数	穷举枚举 + 模式识别	中

问题 36 — 最小重叠问题

加法组合状态：开放 → 原始问题描述

求最优常数 $c > 0$，使得对所有充分大的 $N$，若 $A \sqcup B = \{1,\ldots,2N\}$ 且 $|A|=|B|=N$，则存在某个 $x$ 使得 $a - b = x$（$a \in A$，$b \in B$）的表示数至少为 $cN$。

为什么 AI 能攻克

AI 已经在此问题取得突破。TTT-Discover LLM 将上界改进至 $c < 0.380876$，Google 的 AlphaEvolve 也做出了贡献。
当前上下界：$0.379005 < c < 0.380876$ — 差距仅 ~0.002
本质是有限分划的优化问题 — 非常适合进化搜索 / 强化学习
每个候选分划的评估复杂度仅为 $O(N \log N)$

AI 攻击策略

用 LLM 引导的进化搜索寻找更优分划构造（压缩上界）
用 SAT/ILP 求解器证明小 $N$ 下的下界
分析近最优分划的结构，猜想精确常数

OEIS: A393584

问题 242 — Erdős-Straus 猜想

数论单位分数状态：可证伪 → 原始问题描述

对每个 $n > 2$，都存在不同的正整数 $1 \leq x < y < z$ 使得 $\frac{4}{n} = \frac{1}{x} + \frac{1}{y} + \frac{1}{z}$。

为什么 AI 能攻克

已验证到 $n \leq 10^{18}$ — 问题归结为覆盖素数的剩余类
已知的参数族解覆盖了绝大多数素数；剩余的"坏"类随着新族的发现而缩小
每个参数族本质是一个有限代数恒等式 — 非常适合模式搜索
等价于：对每个素数 $p$，找 $a,c,d \geq 1$ 满足特定模条件

AI 攻击策略

枚举现有参数族尚未覆盖的"坏"剩余类
AI 搜索覆盖这些类的新参数族
构建完整覆盖系统：证明所有族的并集覆盖全部素数
每一步都可以通过有限计算验证

OEIS: A073101 A075245 A075246 A287116

问题 23 — 无三角图的二部化

图论状态：可证伪 Lean ✓ → 原始问题描述

$5n$ 个顶点的无三角图，是否总能通过删除至多 $n^2$ 条边变成二部图？

为什么 AI 能攻克

当前最佳结果：删除 $1.064n^2$ 条边即可（Balogh-Clemen-Lidicky 2021）— 差距仅 6.4%
Flag algebra / SDP 问题 — 证明方法本身就是计算性的
可通过图生成 + SAT 求解搜索反例
已在 Lean 中形式化 — 任何证明可机器验证

AI 攻击策略

构建越来越精细的 flag algebra SDP
AI 引导选择 flag 类型并优化 SDP 公式
并行搜索反例：图枚举 + SAT 求解
在 Lean 中验证证明

OEIS: A389646

问题 82 — 最大正则导出子图

图论状态：开放 Lean ✓ → 原始问题描述

设 $F(n)$ 为使得每个 $n$ 顶点图都包含至少 $F(n)$ 个顶点的正则导出子图的最大值。证明 $F(n) / \log n \to \infty$。

为什么 AI 能攻克

14 条 OEIS 序列 — 所有 Erdős 开放问题中可计算数据最丰富的
已知：$\log n \ll F(n) \ll n^{1/2}$ — 有大量空间可探索
2026 年新计算的精确值：$G(5)=17$，$G(6)\geq 21$，$G(7)\geq 29$
AI 可推进精确计算并发现极值图的结构规律

AI 攻击策略

用分布式 SAT 求解器扩展 $G(k)$ 的精确计算
分析极值图的结构 — 发现不变量
利用规律猜想并证明 $F(n) \gg (\log n)^{1+\epsilon}$

OEIS: A120414 A390256 A390257 A394400 等 14 条

问题 168 — 避免 {n, 2n, 3n} 的集合密度

加法组合状态：开放 Lean ✓ → 原始问题描述

设 $F(N)$ 为 $\{1,\ldots,N\}$ 中不含 $\{n,2n,3n\}$ 形式子集的最大子集大小。$\lim_{N\to\infty} F(N)/N$ 等于多少？这个极限是无理数吗？

为什么 AI 能攻克

极限已被证明存在，且有涉及 3-光滑数的精确可计算公式
已计算到 $0.800965\ldots$ — 但它是否是无理数？
AI 可计算上千位精度 + 用 PSLQ/LLL 测试是否存在代数关系
若未发现代数关系 → 强有力的无理性证据，并可能指向证明路径

AI 攻击策略

利用精确公式计算常数到 1000+ 位
用 PSLQ 与已知常数数据库比对
研究指标集 $K$ 的结构规律
利用结构尝试标准无理性证明方法

OEIS: A004059 A057561 A094708 A386439

问题 647 — Erdős-Selfridge 除数间隙

数论 £25 状态：可验证 Lean ✓ → 原始问题描述

是否存在 $n > 24$ 使得 $\max_{m < n}(m + \tau(m)) \leq n + 2$？其中 $\tau(n)$ 是 $n$ 的因子个数。

为什么 AI 能攻克

可验证型 — 找到一个这样的 $n$ 就是完整证明
纯计算：用筛法求 $\tau(m)$，逐个检查条件
GPU 加速的因子筛法可以搜索到极大范围
Erdős 说"极度不可能存在" — 即便是大规模否定结果也有价值

AI 攻击策略

实现 GPU 加速的 $\tau(m)$ 筛法
搜索到 $N = 10^{13}$ 以上
分析"差一点"的情况：$\max_{m
建立启发式模型预测解是否存在

OEIS: A062249 A087280

问题 340 — 贪心 Sidon 序列（Mian-Chowla 序列）

加法组合 Sidon 集状态：开放 Lean ✓ → 原始问题描述

贪心 Sidon 序列 $A = \{1,2,4,8,13,21,31,45,\ldots\}$：从 1 开始，每次加入保持 Sidon 性质的最小正整数。是否 $|A \cap \{1,\ldots,N\}| \gg N^{1/2-\epsilon}$？

为什么 AI 能攻克

完全确定性、可计算的序列
已知增长率：$\gg N^{1/3}$；经验上看起来像 $\sim N^{1/2}$
AI 可以计算数百万项并拟合精确增长模型
子问题：$33$ 是否在差集 $A - A$ 中？可通过延伸序列计算验证

AI 攻击策略

将序列计算到 $10^{12}$ 以上
拟合增长模型：估计 $|A \cap [1,N]| \sim C \cdot N^{\alpha}$ 中的 $\alpha$
研究间隙结构和差集，寻找周期性或代数规律
确定 $33$ 是否属于 $A - A$

OEIS: A005282 A080200

问题 128 — 稠密子图蕴含三角形

图论 $250 状态：可证伪 Lean ✓ → 原始问题描述

设 $n$ 顶点图 $G$ 的每个不少于 $n/2$ 个顶点的导出子图都有超过 $n^2/50$ 条边。$G$ 是否必然包含三角形？

为什么 AI 能攻克

与问题 23 类似 — flag algebra / SDP 问题
Razborov（2022）：证明了将 $1/50$ 替换为 $27/1024 \approx 0.0264$ 时成立（目标：$0.02$）
差距在不断缩小，更优的 SDP 松弛可能突破
反例是具体的图 — 可搜索

AI 攻击策略

构建精细类型分解的 flag algebra SDP
AI 优化 SDP 层级和 flag 选取
搜索具有高子图密度的无三角图
缩小 0.0264 与 0.02 之间的差距

问题 470 — 奇怪异数

数论因子 $10 状态：开放 Lean ✓ → 原始问题描述

若 $\sigma(n) \geq 2n$ 且 $n$ 不能表示为其因子的任意子集之和，则称 $n$ 为"怪异数"(weird number)。是否存在奇数的怪异数？

为什么 AI 能攻克

$10^{21}$ 以下没有奇怪异数；必须有 $\geq 6$ 个素因子
搜索空间高度受限：奇数 + 盈数 + 不可伪完全
找到一个实例 = 完整解答
AI 可设计结合盈余条件 + 子集和可行性的智能搜索

AI 攻击策略

约束传播：奇数、盈数、$\geq 6$ 个素因子、特定盈余比率
对每个候选：在其因子上解子集和问题
将验证边界推进到 $10^{21}$ 以上
分析因子结构以缩小搜索或证明不可能

OEIS: A006037 A002975

#10

问题 699 — 二项式系数 GCD 中的素数

数论二项式系数状态：可证伪 Lean ✓ → 原始问题描述

对每个 $1 \leq i < j \leq n/2$，是否都存在素数 $p \geq i$ 使得 $p \mid \gcd\left(\binom{n}{i}, \binom{n}{j}\right)$？

为什么 AI 能攻克

$i \geq 4$ 时仅有一个已知反例：$\gcd(\binom{28}{5}, \binom{28}{14}) = 2^3 \cdot 3^3 \cdot 5$
二项式系数的 GCD 计算速度快 — 穷举搜索可行
反例的稀缺性暗示可利用的结构
发现新反例或证明 $i \geq 5$ 时不存在反例都是重要进展

AI 攻击策略

对所有 $n \leq 10^6$ 的有效三元组 $(n,i,j)$ 计算 $\gcd(\binom{n}{i}, \binom{n}{j})$
编目所有"差一点"的情况和反例
分析素因子分解的规律
构造新反例或证明大 $i$ 时的不可能性