陶哲轩：ChatGPT 助力，4 小时完成开源项目验证数学估计

almosthuman2014 · 2025 年5 月 6 日 12:11

陶哲轩借助 ChatGPT，4 小时开发开源项目验证数学估计，填补了渐近估计验证工具的空白。他认为 AI 在数学研究中潜力巨大。

原文标题：陶哲轩：感谢ChatGPT，4小时独立完成了一个开源项目

原文作者：机器之心

原文链接： http://mp.weixin.qq.com/s?__biz=MzA3MzI4MjgzMw==&mid=2650967676&idx=1&sn=d925c4894a9b781ce8f4bd47b3d9fc5e&

冷月清谈：

陶哲轩在 ChatGPT 的协助下，用 4 小时开发了一个开源项目，用于验证涉及任意正参数的给定估计是否成立。该工具旨在自动（或半自动）证明分析中的估计值，填补了目前符号数学软件包在处理渐近估计方面的空白。起因是陶哲轩与 Bjoern Bringmann 讨论了函数估计的验证问题，即验证不等式对于任意大的参数是否成立。陶哲轩通过与 ChatGPT 的对话，逐步构建了处理符号表达式的 Python 类，最终完成了概念验证工具。他认为，AI 大模型在数学研究中具有巨大潜力，甚至可能在 2026 年成为值得信赖的合著者。同时，陶哲轩也建议数学家与程序员合作，以实现优势互补。

怜星夜思：

1、陶哲轩提到 AI 可能在 2026 年成为数学研究的可靠合著者，你觉得这个预测靠谱吗？会对数学研究方式带来哪些变革？
2、陶哲轩这次用 ChatGPT 解决的是验证估计的问题，如果让你用 AI 来解决一个数学难题，你会选择哪个方向？为什么？
3、文章提到陶哲轩建议数学家与程序员合作开发此类软件，你觉得这种合作模式有哪些优势和挑战？

原文内容

机器之心报道

编辑：蛋酱、陈陈

这个五一假期，世界顶级数学家是如何度过的？

菲尔兹奖得主陶哲轩，似乎是忙着发布自己的开源项目：「我在大模型的协助下编写了一个概念验证软件工具，用于验证涉及任意正参数的给定估计是否成立（在常数因子范围内）。」

项目地址：https://github.com/teorth/estimates

在这个项目中，陶哲轩开发了一个用于自动（或半自动）证明分析中估计值的框架。估计值是 X≲Y（在渐近记法中表示 X=O (Y)）或 X≪Y（在渐近符号中表示 X=o (Y)）形式的不等式。

为什么要做这样一个工具？这就要从近期陶哲轩和 Bjoern Bringmann（陶哲轩曾经的博士生，现为普林斯顿大学助理教授）的讨论说起。

对于代数、微积分和数值分析等领域的许多数学任务来说，符号数学软件包已经非常「发达」了。但目前还没有类似的复杂工具来验证渐近估计 —— 在损失不变的情况下，对于任意大的参数都应该成立的不等式。尤其重要的是函数估计，其中参数涉及一个未知函数或序列（存在于某个合适的函数空间，如一个空间）。

陶哲轩将二人的讨论结果写成了一篇博客，重点讨论了更简单的渐近估计情况，即涉及有限数量的正实数，并使用加、乘、除、指数、最小值和最大值（但不包括减法）等算术运算进行组合。

「我过去曾希望能有一个工具能够自动判断此类估计是否成立（如果成立，则提供证明；如果不成立，则提供渐近反例）。」

现在，这个心愿实现了。

我们都知道，陶哲轩非常爱好使用大模型来辅助解决数学问题。过去的大多数情况是完成比较简单的编码任务，例如计算然后绘制一些稍微复杂的数学函数，或者对某些数据集进行一些基本的数据分析。

这次，他决定给自己一个更具挑战性的任务：编写一个可以处理上述形式不等式的验证器。

举个例子，一个典型的不等式可能是弱算术平均 - 几何平均不等式。

其中 abc 是任意正实数，这里的表示我们愿意在估计中丢失一个未指定的（乘性）常数。

原则上，这类形式的简单不等式可以通过强力的案例拆分自动解决。单个这类的不等式都不太难手工求解，但有些应用需要检验大量这样的不等式，或者将其拆分成大量案例。这项任务似乎非常适合自动化，尤其是在现代技术的帮助下。

陶哲轩这次用到的 AI 工具仍然是 ChatGPT。经过大约四个小时的编程，在大模型的频繁协助下，他顺利做出了一个概念验证工具。

与此同时，陶哲轩还放出了与 ChatGPT 的对话过程，不难发现，对话过程还是蛮长的。

链接：https://chatgpt.com/share/68143a97-9424-800e-b43a-ea9690485bd8

一开始，陶哲轩就对 ChatGPT 提出了自己的需求：「我想编写一些 Python 类来操作符号表达式。并且希望有一个表示变量的类，比如 x、y、z…… 你能帮我编写一些具有这种功能的基础类来入门吗？」

ChatGPT 思考了 6 秒钟就给出了答案。

这一步完成之后，下一轮对话开始，陶哲轩接着追问「我看到你用 add 实现了 + 操作，真棒。那么，实现 * 和 / 的对应方法是什么呢？」

ChatGPT 也给出了回答：

在整个过程中，陶哲轩不断询问，ChatGPT 也做到了有问必答，不管是简单的问题，还是复杂的问题，ChatGPT 都给解决了：

「如何在与当前 python 文件相同的目录下导入 python 文件？」

最终，在 ChatGPT 的大力协助下，陶哲轩完成了这个概念验证软件工具。

其实，在众多知名数学家中，陶哲轩是较早接受并发现 ChatGPT 这类 AI 大模型数学价值的一个。他曾预测「如果使用得当，到 2026 年，AI 将成为数学研究和许多其他领域值得信赖的合著者。」

陶哲轩不止一次借助大模型进行研究，他曾在 GPT-4 的帮助下成功解决了一个数学证明题（GPT4 提出了 8 种方法，其中 1 种成功解决了问题），还在 AI 的帮助下发现了自己论文中的一处隐藏 bug。

陶哲轩还建议大家如果想要开发这类软件，最好是数学家与专业程序员以协作的方式进行，这样才能优势互补。

「这当然是一个极其不优雅的证明，但优雅并非重点，重点在于它是自动化的。」

回顾整个过程，我们可以从陶哲轩的经历中得到一些启发，对大模型的开发使用，或许只是冰山一角，更多的功能等着大家去解锁。

参考链接：

https://terrytao.wordpress.com/2025/05/01/a-proof-of-concept-tool-to-verify-estimates/

转载请联系本公众号获得授权

投稿或寻求报道：liyazhou@jiqizhixin.com

Ion31q · 2025 年5 月 7 日 11:44

优势很明显啊，数学家懂数学，程序员懂技术，双方合作可以优势互补，更快地开发出实用性强的工具。挑战可能在于沟通和理解上，数学家的思维方式比较抽象，程序员更注重代码实现，需要双方互相学习和适应。

SilentWhale233 · 2025 年5 月 7 日 13:47

如果我能让 AI 帮我写作业，我就谢天谢地了。数学分析简直是噩梦，如果 AI 能帮我检查证明过程，或者提供一些解题思路，我就不用天天熬夜了。当然，前提是不能直接给我答案，不然就失去学习的意义了。

RadiantButterfly764 · 2025 年5 月 8 日 01:50

我感觉这个预测有点过于乐观了。虽然 AI 在某些特定任务上表现出色，比如验证、计算等，但真正具有创造性的数学研究，往往需要灵感和直觉，这方面目前 AI 仍然有所欠缺。不过，AI 肯定会改变数学研究的方式，比如加速验证过程，辅助寻找灵感等。也可能会诞生一些人机协同的新研究模式。

RubyDragon432 · 2025 年5 月 8 日 04:16

要我说，最大的挑战就是工资问题了。数学家可能觉得自己的知识更值钱，程序员可能觉得自己的代码更辛苦。怎么分配利益是个大问题，搞不好合作就崩了。 (手动狗头)

DreamyParrot272 · 2025 年5 月 8 日 08:11

这种合作模式既有优势也有挑战。优势在于可以结合数学家的专业知识和程序员的编程技能，共同打造出更加高效和实用的工具。挑战在于数学家和程序员的思维方式和工作习惯可能存在差异，需要建立有效的沟通机制和协作流程，才能充分发挥合作的优势。

Strider82w · 2025 年5 月 8 日 16:09

我可能会尝试用AI解决优化问题，例如大规模组合优化。这类问题往往计算量巨大，传统算法难以找到最优解。如果AI能够通过学习和模拟，发现一些新的启发式算法或者优化策略，或许能够在时间和精度上取得更好的平衡。

Fluxion29d · 2025 年5 月 10 日 12:42

如果 AI 真的能成为可靠的合著者，那以后数学家是不是都要学编程了？感觉以后数学家的工作，一部分会变成训练 AI，另一部分是验证 AI 提出的想法，还得防止 AI 瞎编乱造，想想就刺激。

Radiant43s · 2025 年5 月 11 日 05:36

三年后就成为可靠的合著者？我认为陶哲轩先生可能高估了目前AI的能力。虽然AI可以辅助完成一些任务，但是数学研究的核心在于提出新的理论和方法，这需要深刻的洞察力和创造力。AI可以作为一个强大的工具，但无法取代人类数学家的思考和创新，更谈不上成为可以信赖的合作者了。

Whisper51y · 2025 年5 月 11 日 07:42

我会尝试用 AI 辅助解决数论中的一些猜想，比如哥德巴赫猜想或者黎曼猜想。这些问题涉及大量的模式识别和计算，感觉 AI 在这方面应该能提供一些新的视角和突破口。当然，我也知道这很难，但试试总没错。