高德纳惊呼!AI Claude 破解《计算机程序设计艺术》难题

高德纳惊呼 AI Claude 破解其《计算机程序设计艺术》难题,标志着 AI 在数学辅助证明和问题解决领域取得巨大进步。

原文标题:高德纳:「震惊!震惊!」Claude破解《计算机程序设计艺术》难题

原文作者:机器之心

冷月清谈:

著名计算机科学家高德纳(Donald Knuth)的论文《Claude’s Cycles》记录了 Anthropic 公司的 AI 模型 Claude Opus 成功解决了他在《计算机程序设计艺术》中提出的一个难题。该有向图由 m³ 个顶点构成,目标是找到一种通用的方法,将这些弧分解为三个长度为 m³ 的有向环。Claude 在朋友 Filip Stappers 的指导下,经过 31 步探索,最终编写了一个 Python 程序,能够为所有奇数找到解。高德纳随后为该方法撰写了证明。目前,偶数 m 的情况依然悬而未决。这次事件的核心意义在于,AI 在数学辅助证明中展现出了自主更换探索工具、排查无效路径的能力。AI 在解决复杂数学和逻辑问题上已经取得了多个具有实质性意义的突破,例如在国际奥数和编程竞赛中取得好成绩,并在科研中扮演更重要的角色。AI 开始减少对单次快速生成的依赖,采用「测试时计算扩展」或「慢思考」策略。

怜星夜思:

1、高德纳的难题被 Claude 破解,你认为这件事对计算机科学领域,特别是算法研究方向,会产生什么影响?AI 在算法设计中的角色会发生怎样的变化?
2、Claude 解决奇数情况,偶数情况仍然悬而未决。你认为偶数情况的难点在哪里?AI 在攻克类似难题时,可能会遇到哪些瓶颈?
3、文章提到 AI 在解决问题时展现出了自主更换探索工具、排查无效路径的能力。你认为这种能力是如何实现的?未来 AI 在科学研究中会扮演怎样的角色?

原文内容

图片
编辑|Panda


「震惊!震惊!」


是什么让著名计算机科学家和数学家、《计算机程序设计艺术》作者、图灵奖得主高德纳(Donald Knuth)发出了如此惊呼?


图片由 AI 生成


你没有猜错,正是 AI


在他近期在斯坦福大学官网上公布的一篇论文《Claude’s Cycles》中,开篇的「Shock! Shock!」非常直白地表达了他对于 AI 强大能力的震惊。



论文地址:https://cs.stanford.edu/~knuth/papers/claude-cycles.pdf


紧接着他便写到:「我昨天得知,我已经研究了几周的一个开放性问题刚刚被 Claude Opus 4.6——Anthropic 公司三周前发布的混合推理模型 —— 解决了!看来我得在某个时候重新审视我对『生成式 AI』的看法了。不仅我的猜想有了一个不错的解决方案,而且这标志着自动推理和创造性问题解决领域的巨大进步,这真是一件令人高兴的事。我会在这篇短文中简要讲述这个过程。」


此事引发了广泛关注,网友们纷纷点评,感叹新时代的到来。



这是 Hacker News 用户 Ian Danforth 给出的太长不读版本:高德纳提出一个问题,他的朋友借助 Claude 进行了 30 多次探索,在人类的仔细指导下,Claude 最终编写了一个 Python 程序,能够为所有奇数找到解。高德纳随后为该方法撰写了证明,并对 Claude 的贡献感到非常满意。偶数情况仍是未解之谜(Claude 在这方面未能取得太大进展)。



困扰算法泰斗的图论难题


高德纳在为《计算机程序设计艺术》未来卷撰写关于有向哈密顿环的内容时,遇到了一个棘手的开放性问题。


具体而言,需要考虑一个具有 m³ 个顶点的有向图,顶点坐标记为 ijk,其中 0≦ i, j, k<m。每个顶点有三条出弧,分别指向 i⁺jk、ij⁺k 和 ijk⁺,这里的加号表示加 1 后对 m 取模。最终目标是找到一种通用的方法,将这些弧分解为三个长度为 m³ 的有向环,适用于所有 m>2 的情况。


高德纳此前已经解决了 m=3 的基础情况,并将其作为书中的一道练习题。他的朋友 Filip Stappers 随后通过实验发现了 4≦ m≦16 的解,这使得所需分解法存在的可能性极高。为了寻找通解,Stappers 将这个问题原封不动地交给了 Claude 处理。


31 步探索:AI 的解题逻辑


在交互过程中,Stappers 对 Claude 设定了严格的规则指令:


  • 在运行完任何探测代码后,必须立即更新 plan.md 文件。

  • 在记录完成之前,绝对不允许开始下一步的探索。


Claude 采取了多种数学工具进行尝试。它最初尝试了简单的线性与二次函数,但均未奏效。接着,它尝试使用暴力深度优先搜索,最终因为搜索空间过大而放弃。随后,它引入了「2D 蛇形分析」,并准确识别出该有向图是一个带有两个生成元的凯莱图(Cayley digraph)。


问题的突破发生在后半程的探索中:


  • 在第 15 次探索时,Claude 引入了「纤维分解」框架,将问题转化为在坐标上选择算子的排列组合。

  • 在第 25 次探索后,它自主得出结论,认为模拟退火算法虽然能找到解,却无法给出通用构造,此时需要纯粹的数学推导。

  • 最终在第 31 次探索时,Claude 注意到每个纤维的选择仅依赖于单个坐标,并据此给出了一个具体的 Python 构造程序,成功得出了 m=3, 5, 7, 9, 11 的完美分解方案。


简化版的 Python 程序,用 C 语言形式写的


严谨的数学证明与偶数域的挑战


得出构造代码仅仅是第一步。Stappers 验证了 3 到 101 之间所有奇数 m 的情况,均获得了完美的分解方案。随后,高德纳接手进行了严谨的数学证明。他详细推导了生成的第一个环包含所有具备相同特征的 m² 个顶点,从而证实其长度确为 m³,是一个真正的哈密顿环。


高德纳进一步研究发现,在所有类似 Claude 生成逻辑的分解法中,恰好有 760 种对所有奇数 m>1 均有效的解。Claude 凭借自身推导准确找到了其中的一种。


目前,偶数 m 的情况依然悬而未决。


  • Claude 在探索中曾找到 m=4, 6, 8 的解,但未能发现其中的通用规律。

  • 当被要求继续攻克偶数情况时,Claude 陷入了困境,后续甚至无法正确编写探索程序。

  • 另一位研究者 Ho Boon Suan 借助 gpt-5.3-codex 生成了处理大于 8 的偶数 m 的代码,并在高达 m=2000 的规模下测试成功。

  • 但由于其模式过于复杂,目前人工证明其正确性的难度极大。


在 Hacker News 和 Reddit 等技术社区中,开发者们普遍认为这次事件的核心意义在于,AI 在数学辅助证明中展现出了自主更换探索工具、排查无效路径的能力。


正如高德纳在文末所感叹的那样,克劳德・香农(Claude Shannon在天之灵若能知晓他的名字与此类进步联系在一起,定会感到骄傲。


图片


Hats off to Claude!


AI 进军数学殿堂:从竞赛夺金到前沿探索


高德纳的惊叹并非孤例。事实上,在过去的一年多时间里, AI 在解决复杂数学和逻辑问题上已经取得了多个具有实质性意义的突破。


  • 国际奥数突破:2025 年 7 月,,取得 35 分,并能在接近正式考试条件下输出完整自然语言证明。与此同时,OpenAI 也披露其内部模型达到了类似水平,但官方认证与评测细节相对有限。

  • 编程竞赛能力跃升:2025 年 9 月,,能够在严格时间限制内解决高难度算法问题。不过,这些成绩主要来自平行测试或基准评估,并非以正式参赛身份在 International Collegiate Programming Contest 中获得官方金牌。

  • 从解题到科研协作:如今,AI 在科研中的角色显著增强。模型开始借助外部工具参与数学研究与问题验证,在复杂猜想与定理探索中发挥辅助作用。例如, GPT-5.2 借助外部工具,协助数学家解决了数个悬而未决的 Erdős 猜想,并部分系统已展示出生成研究草稿与进行结构化推理的能力。


驱动这些突破的核心机制也发生了改变。 AI 开始减少对单次快速生成的依赖。现在的模型普遍采用「测试时计算扩展」或「慢思考」策略。通过在推理阶段投入更多算力,模型能够并行探索多条解题路径并进行严格的自我验证。


展望未来, AI 与数学的结合将突破封闭环境下的标准化考题。随着自然语言理解力与形式化逻辑的深度融合,AI 将成为数学家与工程师身边得力的合作者,帮助人类共同攻克那些停滞多年的科学难题。



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

我觉得更重要的是,这体现了AI的"试错精神"。Claude尝试了多种方法,包括不成功的暴力搜索,最终才找到了正确的方向。这种试错精神,对于创新至关重要。在科研领域,我们经常需要尝试各种不同的思路,才能取得突破。AI的这种能力,可以加速科研的进程。

别忘了,Claude只是解决了奇数的情况,偶数的情况还悬而未决呢。这说明AI再强大,也离不开人类的指导和验证。所以我认为AI的影响是积极的,它会促使我们更深入地思考问题,而不是完全依赖机器。

这说明AI不仅仅是简单的执行指令,而是具备了一定的"问题解决策略"。这种能力意味着AI可以在复杂环境中,根据实际情况灵活调整方案,而不仅仅是依赖预设的程序。比如在自动驾驶领域,AI可以根据路况选择不同的驾驶模式,或者在医疗诊断领域,AI可以根据患者的症状选择不同的检查项目。

这种自主选择工具的能力,可以看作是AI"元学习"的一种体现。AI可以通过学习大量的案例,掌握不同工具的适用范围,并根据当前问题的特点,选择最合适的工具。这就像一个经验丰富的工匠,知道在不同的情况下使用不同的锤子。

同意楼上的看法,与其因此感到焦虑,不如拥抱AI,将它作为数学研究的强大助手。就像当年计算机的出现一样,虽然取代了一些重复性的计算工作,但也极大地拓展了数学研究的边界。未来可能出现人机协同的数学家,想想就觉得激动!

从计算的角度来看,偶数情况可能存在某种特殊的对称性或者约束,导致目前的算法无法有效地探索解空间。也许可以尝试一些更精细的搜索算法,比如遗传算法或者蚁群算法,也可能需要针对偶数情况设计特定的启发式策略。

我觉得这就像给科学家配了一个超级助手!以前科学家需要自己尝试各种方法,耗费大量时间和精力。现在有了 AI,它可以快速尝试各种方案,排除错误的路径,大大提高了科研效率。而且,AI 还能从大量数据中发现人类难以察觉的规律,为科学研究提供新的视角。

偶数情况的难点可能在于其内在结构更加复杂,规律更难被发现。奇数和偶数在数论上就有不同的性质,反映到这个问题上可能也是如此。个人认为AI在攻克难题时,最大的瓶颈还是在于缺乏真正的“理解”,它更多的是在模式匹配和搜索,一旦问题超出其学习范围,就容易陷入困境。

要我说,这压根不是啥新鲜事。AI辅助算法设计早就开始了,现在只是更进一步而已。以后会不会出现“AI算法工程师”这种新职业?专门负责调教AI,让它更好地设计算法,想想就刺激!不过,我们这些老牌算法工程师也不能掉以轻心,得赶紧学习AI相关的知识,不然就要被时代淘汰啦!

我觉得这事儿影响挺大的。以前我们觉得算法设计是人类的专属领域,现在 AI 也能来插一脚了,而且还能解决一些我们解决不了的问题。以后算法研究可能得变成“人机合作”模式了,AI 负责提供思路和方案,人类负责验证和优化,感觉效率会大大提升啊!

自主更换探索工具,这听起来很酷炫啊!我觉得这可能是因为 AI 内部有一个“元学习”机制,能够学习不同工具的适用场景,然后动态调整策略。未来 AI 就厉害了,感觉可以成为科研界的“外脑”,啥难题都交给它,我们安心喝咖啡就行了!

此事标志着算法研究范式的转变,AI不再仅仅是验证算法的工具,而是可以参与到算法的创造过程中。未来,研究者可能会更多地利用AI进行初步探索,发现潜在的解决方案,然后再进行理论上的验证和完善。但同时,人类对于算法的理解和对AI结果的批判性思维仍是至关重要的。

我觉得哈,偶数情况更难可能就是因为奇偶数的性质差异。奇数通常具有一些特殊的对称性或者规律,更容易被 AI 捕捉到。偶数相对来说可能更“随机”一些,探索空间更大,AI 就更容易迷路。AI 的瓶颈嘛,我觉得还是在于“创造性”不足,它能快速找到已知的解法,但很难提出全新的思路。

嗨,别想那么复杂。可能单纯就是算力不够呗!偶数情况的搜索空间更大,需要更多的计算资源。等哪天算力爆炸了,说不定 AI 分分钟就搞定了。AI 的瓶颈?我觉得是人类的耐心。我们总是希望 AI 能够立刻解决所有问题,但科学研究是需要时间的嘛!

说白了,就是试错呗!AI 尝试各种方法,如果发现某个方法行不通,就换一种。这种能力主要依赖于强大的计算能力和算法优化。未来嘛,AI 肯定会成为科研的标配,就像现在的电脑一样。不过,我们也不能过度依赖 AI,毕竟科研的本质还是在于创新和思考!