CMU博士论文提出利用语言模型实现可验证的数学自动化,结合语言模型的理解能力和自动推理器的推理能力,提出了新的定理证明研究范式。
原文标题:【CMU博士论文】可验证数学自动化的语言模型交互、集成与自动形式化
原文作者:数据派THU
冷月清谈:
具体来说,论文进行了以下几个方面的研究:
1. 评估语言模型在非正式数学推理中的表现:发现语言模型在记忆和灵活输入输出方面表现出色,但在复杂推理和代数运算方面存在不足。
2. 提出了Thor方法:结合自动定理证明器和语言模型进行证明搜索。Thor利用语言模型进行创造性推理,并使用自动定理证明器补充细节。同时,还开发了Magnushammer,一个用于过滤相关性的工具,提升了Thor的效率。
3. 探索自动形式化:使用语言模型将非正式数学定理和证明转换为形式化语言。并通过构建大规模平行数据集MMA,提高了语言模型的自动形式化能力。
4. 提出了Draft、Sketch和Prove方法:将非正式证明转换为形式化证明草图,再由自动定理证明器完成最终的证明。
总而言之,这篇论文提出了一种新的定理证明研究范式,将语言模型作为自动化引擎和人机交互的桥梁,为数学自动化提供了新的思路。
怜星夜思:
2、Thor方法中结合了语言模型和自动定理证明器,这种“人机合作”的模式在其他领域还有哪些潜在的应用?
3、自动形式化将非正式数学文本转化为形式化语言,这除了用于定理证明,还能在哪些方面发挥作用?
原文内容
来源:专知本文约1000字,建议阅读5分钟
本论文的研究提出了一种新的定理证明研究范式,在这种范式中,语言模型既是自动化众多任务的可扩展动力引擎,又是人类用户与机器推理之间的可访问桥梁。
-
我们进行首次互动评估,评估语言模型在非正式数学推理中的表现。 评估结果揭示了语言模型在记忆和具有灵活输入/输出方面的内在优势,但在复杂推理和代数运算方面的弱点。
-
基于语言模型的优缺点,我们提出了结合自动定理证明器和语言模型进行证明搜索的首个方法:Thor。 Thor使用语言模型进行创意推理步骤,并调用Sledgehammer(Isabelle的工具,具有多个自动定理证明器)来填充前提选择的细节。我们还开发了Magnushammer,这是一个基于变换器的相关性过滤器的系统,并证明了Magnushammer在个体和作为Thor插件的情况下都优于Sledgehammer。
-
目前所有现有的证明搜索方法仅在自然语言或形式语言上进行操作,而未将它们各自的表达力和严谨性结合起来。 为了弥补这一二分法,我们使用语言模型进行自动形式化(autoformalization),即将非正式的数学定理和证明转化为形式化的过程。通过展示自动形式化定理可作为训练数据来改进证明搜索系统,我们验证了自动形式化的实用性。我们还将多个语言的形式化定理库转化为自然语言,最终形成了一个大规模的平行数据集MMA,证明在语言模型进行微调后,能显著提高自动形式化能力。
-
最后,我们构建了Draft、Sketch和Prove,这是一种方法论,利用语言模型将非正式证明转换为形式化证明草图,然后调用自动定理证明器填补其中的空白。 这种神经符号方法通过有效地将非正式证明转化为形式化证明并验证它们,赋予了非正式证明严谨性。