陶哲轩:ChatGPT 助力,4 小时完成开源项目验证数学估计

陶哲轩借助 ChatGPT,4 小时开发开源项目验证数学估计,填补了渐近估计验证工具的空白。他认为 AI 在数学研究中潜力巨大。

原文标题:陶哲轩:感谢ChatGPT,4小时独立完成了一个开源项目

原文作者:机器之心

冷月清谈:

陶哲轩在 ChatGPT 的协助下,用 4 小时开发了一个开源项目,用于验证涉及任意正参数的给定估计是否成立。该工具旨在自动(或半自动)证明分析中的估计值,填补了目前符号数学软件包在处理渐近估计方面的空白。起因是陶哲轩与 Bjoern Bringmann 讨论了函数估计的验证问题,即验证不等式对于任意大的参数是否成立。陶哲轩通过与 ChatGPT 的对话,逐步构建了处理符号表达式的 Python 类,最终完成了概念验证工具。他认为,AI 大模型在数学研究中具有巨大潜力,甚至可能在 2026 年成为值得信赖的合著者。同时,陶哲轩也建议数学家与程序员合作,以实现优势互补。

怜星夜思:

1、陶哲轩提到 AI 可能在 2026 年成为数学研究的可靠合著者,你觉得这个预测靠谱吗? 会对数学研究方式带来哪些变革?
2、陶哲轩这次用 ChatGPT 解决的是验证估计的问题,如果让你用 AI 来解决一个数学难题,你会选择哪个方向?为什么?
3、文章提到陶哲轩建议数学家与程序员合作开发此类软件,你觉得这种合作模式有哪些优势和挑战?

原文内容

机器之心报道

编辑:蛋酱、陈陈


这个五一假期,世界顶级数学家是如何度过的?


菲尔兹奖得主陶哲轩,似乎是忙着发布自己的开源项目:「我在大模型的协助下编写了一个概念验证软件工具,用于验证涉及任意正参数的给定估计是否成立(在常数因子范围内)。」



项目地址:https://github.com/teorth/estimates


在这个项目中,陶哲轩开发了一个用于自动(或半自动)证明分析中估计值的框架。估计值是 X≲Y(在渐近记法中表示 X=O (Y))或 X≪Y(在渐近符号中表示 X=o (Y))形式的不等式。


为什么要做这样一个工具?这就要从近期陶哲轩和 Bjoern Bringmann(陶哲轩曾经的博士生,现为普林斯顿大学助理教授)的讨论说起。


对于代数、微积分和数值分析等领域的许多数学任务来说,符号数学软件包已经非常「发达」了。但目前还没有类似的复杂工具来验证渐近估计 —— 在损失不变的情况下,对于任意大的参数都应该成立的不等式。尤其重要的是函数估计,其中参数涉及一个未知函数或序列(存在于某个合适的函数空间,如一个空间)。


陶哲轩将二人的讨论结果写成了一篇博客,重点讨论了更简单的渐近估计情况,即涉及有限数量的正实数,并使用加、乘、除、指数、最小值和最大值(但不包括减法)等算术运算进行组合。


「我过去曾希望能有一个工具能够自动判断此类估计是否成立(如果成立,则提供证明;如果不成立,则提供渐近反例)。」


现在,这个心愿实现了。


我们都知道,陶哲轩非常爱好使用大模型来辅助解决数学问题。过去的大多数情况是完成比较简单的编码任务,例如计算然后绘制一些稍微复杂的数学函数,或者对某些数据集进行一些基本的数据分析。


这次,他决定给自己一个更具挑战性的任务:编写一个可以处理上述形式不等式的验证器。


举个例子,一个典型的不等式可能是弱算术平均 - 几何平均不等式。


图片


其中 abc 是任意正实数,这里的图片表示我们愿意在估计中丢失一个未指定的(乘性)常数。


原则上,这类形式的简单不等式可以通过强力的案例拆分自动解决。单个这类的不等式都不太难手工求解,但有些应用需要检验大量这样的不等式,或者将其拆分成大量案例。这项任务似乎非常适合自动化,尤其是在现代技术的帮助下。


陶哲轩这次用到的 AI 工具仍然是 ChatGPT。经过大约四个小时的编程,在大模型的频繁协助下,他顺利做出了一个概念验证工具。


与此同时,陶哲轩还放出了与 ChatGPT 的对话过程,不难发现,对话过程还是蛮长的。


图片

链接:https://chatgpt.com/share/68143a97-9424-800e-b43a-ea9690485bd8


一开始,陶哲轩就对 ChatGPT 提出了自己的需求:「我想编写一些 Python 类来操作符号表达式。并且希望有一个表示变量的类,比如 x、y、z…… 你能帮我编写一些具有这种功能的基础类来入门吗?」



ChatGPT 思考了 6 秒钟就给出了答案。



这一步完成之后,下一轮对话开始,陶哲轩接着追问「我看到你用 add 实现了 + 操作,真棒。那么,实现 * 和 / 的对应方法是什么呢?」


ChatGPT 也给出了回答:



在整个过程中,陶哲轩不断询问,ChatGPT 也做到了有问必答,不管是简单的问题,还是复杂的问题,ChatGPT 都给解决了:



「如何在与当前 python 文件相同的目录下导入 python 文件?」



最终,在 ChatGPT 的大力协助下,陶哲轩完成了这个概念验证软件工具。


其实,在众多知名数学家中,陶哲轩是较早接受并发现 ChatGPT 这类 AI 大模型数学价值的一个。他曾预测「如果使用得当,到 2026 年,AI 将成为数学研究和许多其他领域值得信赖的合著者。」


陶哲轩不止一次借助大模型进行研究,他曾在 GPT-4 的帮助下成功解决了一个数学证明题(GPT4 提出了 8 种方法,其中 1 种成功解决了问题),还在 AI 的帮助下发现了自己论文中的一处隐藏 bug。



陶哲轩还建议大家如果想要开发这类软件,最好是数学家与专业程序员以协作的方式进行,这样才能优势互补。


「这当然是一个极其不优雅的证明,但优雅并非重点,重点在于它是自动化的。」


回顾整个过程,我们可以从陶哲轩的经历中得到一些启发,对大模型的开发使用,或许只是冰山一角,更多的功能等着大家去解锁。


参考链接:

https://terrytao.wordpress.com/2025/05/01/a-proof-of-concept-tool-to-verify-estimates/



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

优势很明显啊,数学家懂数学,程序员懂技术,双方合作可以优势互补,更快地开发出实用性强的工具。 挑战可能在于沟通和理解上,数学家的思维方式比较抽象,程序员更注重代码实现,需要双方互相学习和适应。

如果我能让 AI 帮我写作业,我就谢天谢地了。 数学分析简直是噩梦,如果 AI 能帮我检查证明过程,或者提供一些解题思路,我就不用天天熬夜了。 当然,前提是不能直接给我答案,不然就失去学习的意义了。

我感觉这个预测有点过于乐观了。虽然 AI 在某些特定任务上表现出色,比如验证、计算等,但真正具有创造性的数学研究,往往需要灵感和直觉,这方面目前 AI 仍然有所欠缺。不过,AI 肯定会改变数学研究的方式,比如加速验证过程,辅助寻找灵感等。也可能会诞生一些人机协同的新研究模式。

要我说,最大的挑战就是工资问题了。 数学家可能觉得自己的知识更值钱,程序员可能觉得自己的代码更辛苦。 怎么分配利益是个大问题,搞不好合作就崩了。 (手动狗头)

这种合作模式既有优势也有挑战。优势在于可以结合数学家的专业知识和程序员的编程技能,共同打造出更加高效和实用的工具。挑战在于数学家和程序员的思维方式和工作习惯可能存在差异,需要建立有效的沟通机制和协作流程,才能充分发挥合作的优势。

我可能会尝试用AI解决优化问题,例如大规模组合优化。这类问题往往计算量巨大,传统算法难以找到最优解。如果AI能够通过学习和模拟,发现一些新的启发式算法或者优化策略,或许能够在时间和精度上取得更好的平衡。

如果 AI 真的能成为可靠的合著者,那以后数学家是不是都要学编程了? 感觉以后数学家的工作,一部分会变成训练 AI,另一部分是验证 AI 提出的想法,还得防止 AI 瞎编乱造,想想就刺激。

三年后就成为可靠的合著者?我认为陶哲轩先生可能高估了目前AI的能力。虽然AI可以辅助完成一些任务,但是数学研究的核心在于提出新的理论和方法,这需要深刻的洞察力和创造力。AI可以作为一个强大的工具,但无法取代人类数学家的思考和创新,更谈不上成为可以信赖的合作者了。

我会尝试用 AI 辅助解决数论中的一些猜想,比如哥德巴赫猜想或者黎曼猜想。这些问题涉及大量的模式识别和计算,感觉 AI 在这方面应该能提供一些新的视角和突破口。当然,我也知道这很难,但试试总没错。