AI 最有希望攻克的 10 个 Erdős 开放问题

从 703 个未解决的 Erdős 问题中,筛选出最适合 AI 优势的 10 个:大规模计算、模式识别、猜想生成,从小规律搭积木启发大突破。

1,212
问题总数
703
尚未解决
$38,370
悬赏总额
10
精选问题

筛选标准 — 为什么是这 10 个?

排名问题AI 攻击方式信心
1问题 36 — 最小重叠常数LLM/进化搜索(AI 已有贡献!)极高
2问题 242 — Erdős-Straus 猜想参数族搜索 + 覆盖系统
3问题 23 — 无三角图的二部化Flag algebra SDP 优化
4问题 82 — 最大正则导出子图精确计算 + 模式发现
5问题 168 — 避免 {n,2n,3n} 的密度高精度计算 + PSLQ 算法中高
6问题 647 — 除数函数间隙GPU 加速筛法搜索中高
7问题 340 — 贪心 Sidon 序列增长率大规模计算 + 增长分析
8问题 128 — 稠密子图蕴含三角形Flag algebra SDP
9问题 470 — 奇怪异数约束智能搜索
10问题 699 — 二项式系数 GCD 中的素数穷举枚举 + 模式识别
#1

问题 36 — 最小重叠问题

加法组合 状态:开放 → 原始问题描述
求最优常数 $c > 0$,使得对所有充分大的 $N$,若 $A \sqcup B = \{1,\ldots,2N\}$ 且 $|A|=|B|=N$,则存在某个 $x$ 使得 $a - b = x$($a \in A$,$b \in B$)的表示数至少为 $cN$。

为什么 AI 能攻克

  • AI 已经在此问题取得突破。TTT-Discover LLM 将上界改进至 $c < 0.380876$,Google 的 AlphaEvolve 也做出了贡献。
  • 当前上下界:$0.379005 < c < 0.380876$ — 差距仅 ~0.002
  • 本质是有限分划的优化问题 — 非常适合进化搜索 / 强化学习
  • 每个候选分划的评估复杂度仅为 $O(N \log N)$

AI 攻击策略

  1. 用 LLM 引导的进化搜索寻找更优分划构造(压缩上界)
  2. 用 SAT/ILP 求解器证明小 $N$ 下的下界
  3. 分析近最优分划的结构,猜想精确常数
#2

问题 242 — Erdős-Straus 猜想

数论 单位分数 状态:可证伪 → 原始问题描述
对每个 $n > 2$,都存在不同的正整数 $1 \leq x < y < z$ 使得 $\frac{4}{n} = \frac{1}{x} + \frac{1}{y} + \frac{1}{z}$。

为什么 AI 能攻克

  • 已验证到 $n \leq 10^{18}$ — 问题归结为覆盖素数的剩余类
  • 已知的参数族解覆盖了绝大多数素数;剩余的"坏"类随着新族的发现而缩小
  • 每个参数族本质是一个有限代数恒等式 — 非常适合模式搜索
  • 等价于:对每个素数 $p$,找 $a,c,d \geq 1$ 满足特定模条件

AI 攻击策略

  1. 枚举现有参数族尚未覆盖的"坏"剩余类
  2. AI 搜索覆盖这些类的新参数族
  3. 构建完整覆盖系统:证明所有族的并集覆盖全部素数
  4. 每一步都可以通过有限计算验证
#3

问题 23 — 无三角图的二部化

图论 状态:可证伪 Lean ✓ → 原始问题描述
$5n$ 个顶点的无三角图,是否总能通过删除至多 $n^2$ 条边变成二部图?

为什么 AI 能攻克

  • 当前最佳结果:删除 $1.064n^2$ 条边即可(Balogh-Clemen-Lidicky 2021)— 差距仅 6.4%
  • Flag algebra / SDP 问题 — 证明方法本身就是计算性的
  • 可通过图生成 + SAT 求解搜索反例
  • 已在 Lean 中形式化 — 任何证明可机器验证

AI 攻击策略

  1. 构建越来越精细的 flag algebra SDP
  2. AI 引导选择 flag 类型并优化 SDP 公式
  3. 并行搜索反例:图枚举 + SAT 求解
  4. 在 Lean 中验证证明
#4

问题 82 — 最大正则导出子图

图论 状态:开放 Lean ✓ → 原始问题描述
设 $F(n)$ 为使得每个 $n$ 顶点图都包含至少 $F(n)$ 个顶点的正则导出子图的最大值。证明 $F(n) / \log n \to \infty$。

为什么 AI 能攻克

  • 14 条 OEIS 序列 — 所有 Erdős 开放问题中可计算数据最丰富的
  • 已知:$\log n \ll F(n) \ll n^{1/2}$ — 有大量空间可探索
  • 2026 年新计算的精确值:$G(5)=17$,$G(6)\geq 21$,$G(7)\geq 29$
  • AI 可推进精确计算并发现极值图的结构规律

AI 攻击策略

  1. 用分布式 SAT 求解器扩展 $G(k)$ 的精确计算
  2. 分析极值图的结构 — 发现不变量
  3. 利用规律猜想并证明 $F(n) \gg (\log n)^{1+\epsilon}$
#5

问题 168 — 避免 {n, 2n, 3n} 的集合密度

加法组合 状态:开放 Lean ✓ → 原始问题描述
设 $F(N)$ 为 $\{1,\ldots,N\}$ 中不含 $\{n,2n,3n\}$ 形式子集的最大子集大小。$\lim_{N\to\infty} F(N)/N$ 等于多少?这个极限是无理数吗?

为什么 AI 能攻克

  • 极限已被证明存在,且有涉及 3-光滑数的精确可计算公式
  • 已计算到 $0.800965\ldots$ — 但它是否是无理数?
  • AI 可计算上千位精度 + 用 PSLQ/LLL 测试是否存在代数关系
  • 若未发现代数关系 → 强有力的无理性证据,并可能指向证明路径

AI 攻击策略

  1. 利用精确公式计算常数到 1000+ 位
  2. 用 PSLQ 与已知常数数据库比对
  3. 研究指标集 $K$ 的结构规律
  4. 利用结构尝试标准无理性证明方法
#6

问题 647 — Erdős-Selfridge 除数间隙

数论 £25 状态:可验证 Lean ✓ → 原始问题描述
是否存在 $n > 24$ 使得 $\max_{m < n}(m + \tau(m)) \leq n + 2$?其中 $\tau(n)$ 是 $n$ 的因子个数。

为什么 AI 能攻克

  • 可验证型 — 找到一个这样的 $n$ 就是完整证明
  • 纯计算:用筛法求 $\tau(m)$,逐个检查条件
  • GPU 加速的因子筛法可以搜索到极大范围
  • Erdős 说"极度不可能存在" — 即便是大规模否定结果也有价值

AI 攻击策略

  1. 实现 GPU 加速的 $\tau(m)$ 筛法
  2. 搜索到 $N = 10^{13}$ 以上
  3. 分析"差一点"的情况:$\max_{m
  4. 建立启发式模型预测解是否存在
#7

问题 340 — 贪心 Sidon 序列(Mian-Chowla 序列)

加法组合 Sidon 集 状态:开放 Lean ✓ → 原始问题描述
贪心 Sidon 序列 $A = \{1,2,4,8,13,21,31,45,\ldots\}$:从 1 开始,每次加入保持 Sidon 性质的最小正整数。是否 $|A \cap \{1,\ldots,N\}| \gg N^{1/2-\epsilon}$?

为什么 AI 能攻克

  • 完全确定性、可计算的序列
  • 已知增长率:$\gg N^{1/3}$;经验上看起来像 $\sim N^{1/2}$
  • AI 可以计算数百万项并拟合精确增长模型
  • 子问题:$33$ 是否在差集 $A - A$ 中?可通过延伸序列计算验证

AI 攻击策略

  1. 将序列计算到 $10^{12}$ 以上
  2. 拟合增长模型:估计 $|A \cap [1,N]| \sim C \cdot N^{\alpha}$ 中的 $\alpha$
  3. 研究间隙结构和差集,寻找周期性或代数规律
  4. 确定 $33$ 是否属于 $A - A$
#8

问题 128 — 稠密子图蕴含三角形

图论 $250 状态:可证伪 Lean ✓ → 原始问题描述
设 $n$ 顶点图 $G$ 的每个不少于 $n/2$ 个顶点的导出子图都有超过 $n^2/50$ 条边。$G$ 是否必然包含三角形?

为什么 AI 能攻克

  • 与问题 23 类似 — flag algebra / SDP 问题
  • Razborov(2022):证明了将 $1/50$ 替换为 $27/1024 \approx 0.0264$ 时成立(目标:$0.02$)
  • 差距在不断缩小,更优的 SDP 松弛可能突破
  • 反例是具体的图 — 可搜索

AI 攻击策略

  1. 构建精细类型分解的 flag algebra SDP
  2. AI 优化 SDP 层级和 flag 选取
  3. 搜索具有高子图密度的无三角图
  4. 缩小 0.0264 与 0.02 之间的差距
#9

问题 470 — 奇怪异数

数论 因子 $10 状态:开放 Lean ✓ → 原始问题描述
若 $\sigma(n) \geq 2n$ 且 $n$ 不能表示为其因子的任意子集之和,则称 $n$ 为"怪异数"(weird number)。是否存在奇数的怪异数?

为什么 AI 能攻克

  • $10^{21}$ 以下没有奇怪异数;必须有 $\geq 6$ 个素因子
  • 搜索空间高度受限:奇数 + 盈数 + 不可伪完全
  • 找到一个实例 = 完整解答
  • AI 可设计结合盈余条件 + 子集和可行性的智能搜索

AI 攻击策略

  1. 约束传播:奇数、盈数、$\geq 6$ 个素因子、特定盈余比率
  2. 对每个候选:在其因子上解子集和问题
  3. 将验证边界推进到 $10^{21}$ 以上
  4. 分析因子结构以缩小搜索或证明不可能
#10

问题 699 — 二项式系数 GCD 中的素数

数论 二项式系数 状态:可证伪 Lean ✓ → 原始问题描述
对每个 $1 \leq i < j \leq n/2$,是否都存在素数 $p \geq i$ 使得 $p \mid \gcd\left(\binom{n}{i}, \binom{n}{j}\right)$?

为什么 AI 能攻克

  • $i \geq 4$ 时仅有一个已知反例:$\gcd(\binom{28}{5}, \binom{28}{14}) = 2^3 \cdot 3^3 \cdot 5$
  • 二项式系数的 GCD 计算速度快 — 穷举搜索可行
  • 反例的稀缺性暗示可利用的结构
  • 发现新反例或证明 $i \geq 5$ 时不存在反例都是重要进展

AI 攻击策略

  1. 对所有 $n \leq 10^6$ 的有效三元组 $(n,i,j)$ 计算 $\gcd(\binom{n}{i}, \binom{n}{j})$
  2. 编目所有"差一点"的情况和反例
  3. 分析素因子分解的规律
  4. 构造新反例或证明大 $i$ 时的不可能性