微积分导论:从斜率、切线到导数与应用

深入浅出探索微积分的诞生、核心概念及其在现实世界的广泛应用,理解数学之美与力量。

原文标题:如果只读一本“数学史”入门书,那必须是这一本!

原文作者:图灵编辑部

冷月清谈:

文章从微积分在现代科学与工程中的核心地位切入,阐述了其作为17世纪数学最高成就的重要性。它详细介绍了微积分的诞生,包括戈特弗里德·威廉·莱布尼茨在1684年首次发表微分学著作,以及艾萨克·牛顿早年独立发展“流数”的史实,并提及了两人之间著名的优先权争议。

随后,文章深入浅出地讲解了微分学的基本概念:从直线斜率的定义,到如何通过切线理解曲线在某一点的斜率。通过一系列直观的例子和图示,它逐步引入了割线斜率逼近切线斜率的思想,并最终导向了导数的定义及其计算方法。文章还探讨了导数在函数极大值与极小值问题中的关键应用,例如如何通过导数为零来确定顶点或优化利润,证明了微积分在解决现实世界问题中的强大威力,同时也简要提到了导数存在的局限性(如尖角处无导数)。

怜星夜思:

1、文章里提到牛顿和莱布尼茨关于微积分优先权的争议是数学史上不幸的一段插曲。大家觉得,这场争议除了让那两位大佬不愉快,还对数学发展产生了哪些具体影响呢?是加速了还是阻碍了某个方面?
2、虽然微积分看起来很高深,但文章里也提到了它在测速、利润计算这些比较具体的应用。除了飞机速度、边际利润,大家还能想到生活中哪些看似平常,但背后却藏着微积分原理的例子吗?不用很复杂,随便说说你觉得有趣的就好!
3、现在人工智能这么火,像文章里提到的微积分,作为现代数学的基石,在机器学习或者AI的算法里扮演了什么角色?是不是学AI的人也得把微积分弄懂?

原文内容

在传统的大学本科课程中, 微积分是进入高等数学的入口。它已经成为工程师、物理学家、化学家、经济学家等各种专业人士的不可或缺的工具。


微积分显然是17世纪数学的最高成就, 很多人认为它是整个数学发展史上的最高成就。


20世纪最具影响力的数学家之一约翰 • 冯·诺依曼(John von Neumann, 1903—1957)写道:“微积分是现代数学取得的最高成就, 对它的重要性怎样强调都不会过分。”

来源 | 《数学那些事:伟大的问题与非凡的人》
作者 | [美] 威廉·邓纳姆(William Dunham)
译者 | 冯速


1684年, 一篇数学论文发表在《教师学报》上。它的作者是戈特弗里德 • 威廉 • 莱布尼茨, 这是一位兴趣广泛且有无限创造力的德国学者和外交家。这篇论文里密密麻麻地挤满了拉丁词语和数学符号, 当时的读者可能会觉得很难理解。今天看来, 理解这篇论文的主题的最好线索就是论文标题末尾出现的一个词:微积分(calculi)。

这是第一部正式出版的微积分著述。它的题目翻译为《一种求极大值与极小值以及求切线的新方法, 适用于有理量与无理量, 以及这种新方法的奇妙微积分计算》。calculus一词的本意是“一组规则”, 此处指的是适用于有关极大值、极小值以及切线等一类问题的一些规则, 莱布尼茨声称这些规则适用于有理数和无理数。他的发现意义如此重大, 后来这个单词成了不朽的数学名词。事实上, 数学家想要对这门学问给予特殊的关注时就会把它称为“the calculus”, 这听起来似乎更令人敬畏。

它是令人敬畏的。在传统的大学本科课程中, 微积分是进入高等数学的入口(遗憾的是, 对某些人来说是一种障碍)。它已经成为工程师、物理学家、化学家、经济学家等各种专业人士的不可或缺的工具。微积分显然是17世纪数学的最高成就, 很多人认为它是整个数学发展史上的最高成就。20世纪最具影响力的数学家之一约翰 • 冯·诺依曼(John von Neumann, 1903—1957)写道:“微积分是现代数学取得的最高成就, 对它的重要性怎样强调都不会过分。”(注意, 冯 • 诺依曼此处提到的就是the calculus。)

莱布尼茨写于1684年的论文内容是微分, 这是这门学科的两个分支之一。另外一个分支是积分, 1686年, 莱布尼茨在同一期刊上介绍了它。

在探讨微分之前, 我们应该简单介绍一下它的起源。尽管是莱布尼茨首先在17世纪80年代中期公开描述了微积分, 然而, 是艾萨克 • 牛顿在1664年到1666年首先研究了这个课题。当时还是剑桥大学三一学院的学生的牛顿创造了他所谓的“流数”, 这也是一组规则, 利用它们也可以求得极大值、极小值和切线, 它们也适用于有理数和无理数。总之, 牛顿的流数要比莱布尼茨发表的微积分早二十年。

现代学者认为他们二人分别独立发现了微积分。但是当时的数学界怀疑这是一种剽窃, 他们对这一荣誉的分配几乎毫无雅量。于是, 英国人坚持认为牛顿优先, 而欧洲大陆的数学家们则坚信莱布尼茨优先, 双方展开了一场激烈的争论。这场争论可以说是数学史上最不幸的一段插曲。

牛顿和莱布尼茨发现的究竟是什么呢?微分学的核心是斜率和切线的概念, 一般高中的代数课会介绍斜率, 而切线则是高中几何课程的关键概念。切线出现在莱布尼茨的论文标题中, 但是我们先从斜率开始讨论。

假设在坐标平面内有一条直线。我们可以分别研究图片坐标和图片坐标, 但是研究图片图片是如何连带变化的通常更有益。例如, 如果图片增加4个单位, 那么相应的图片的值如何变化呢?

答案与问题中的直线的坡度有关。在图D-1中, 左边的直线逐渐上升, 所以图片坐标值增加4个单位(即水平轴上增加4个单位)导致图片坐标值产生较小的变化(即垂直变化非常小)。但是对于右边倾斜较大的直线来说, 图片增加4个单位则导致图片的值产生较大的变化。

图 D-1

为了用数学语言描述这一概念, 我们定义直线的斜率为:

如果一条直线的斜率是2/5, 那么当图片增加5个单位时, 图片会增加2个单位, 缓缓上升。而如果斜率是5/2, 则表明当图片增加2个单位时, 图片整整增加5个单位, 此时攀升速度相当快。如果我们要把一架钢琴拉上一个斜坡, 我们希望其斜率是2/5而不是5/2。

表示斜率的符号通常是图片,如图D-2所示的那样, 通过点图片和点图片的直线的斜率定义是

图 D-2

对于一条斜率为5/2的直线, 水平方向增加2个单位导致垂直方向上升5个单位。因此, 如果图片增加图片个单位, 那么图片则相应地增加图片个单位。同样(这是解释斜率的关键), 图片向右增加一个单位将导致图片增加5/2=2.5个单位。对于斜率是2/5的直线来说, 图片增加一个单位则导致图片增加2/5=0.4个单位。因此, 我们可以把直线的斜率看成图片每单位改变量引发的图片的改变量, 即斜率告诉我们当图片增加1时, 图片增加多少。

这一切似乎没有什么现实意义, 但是事实并非如此。例如, 假设我们正在考虑一架飞机的运动, 其中图片代表这架飞机在高空飞行的时间, 图片是它在图片小时内飞行的距离。假设图片关系的图像是一条直线, 那么我们把这条直线的斜率解释为单位时间变化(图片的变化)所对应的距离的变化(图片的变化), 即这个斜率代表飞机的速率(用每小时的飞行距离来衡量)。这个速率对飞行员来说非常重要, 这一点是无可否认的。这一切都与斜率这样一个抽象的数学概念密切相关, 说明这种思想在纯数学领域之外是何等重要。

下面再考虑一个经济学问题。我们考虑与某个制造过程相关的两个变量:图片是生产出的产品数量, 图片是销售图片件产品后产生的利润。如果图片关系的图像是一条直线, 那么我们把这条直线的斜率解释为对应于单位销售量的变化而产生的利润变化, 即每销售一件产品所增加的效益。经济学家对这个概念是如此倾心, 他们甚至给它起了一个特殊的名字——边际利润, 它的值可以决定大型产业的发展过程。

生活中有很多斜率的例子。像每公里耗油量、每秒前进距离或单位重量价格这样的度量, 表明斜率就在我们的身边。毫无疑问, 一些最重要的数学应用只要涉及一个量相对另一个量的变化比值, 就会体现出斜率的思想。

对于我们刚才的例子, 图片增加一个单位导致图片有一个相应的增加。从图D-2上看, 这表明当我们向右移动时, 这条直线是向上攀升的。但是并不是所有线性关系都是这一类型。显然我们可能遇到这样的例子, 图片增加导致图片减少。还用飞机的例子, 我们可以设图片是飞机在空中飞行的时间, 图片是飞机与其目的地的距离。于是, 当图片增加时, 图片就会减少。这种情况可以用图D-3左图的直线说明, 对于这条直线, 当图片增加2时, 图片减少5。这里

还有最后一种情况, 对于微分学非常重要, 它是如图D-3右图所示的水平线。在这里, 图片的增加不会导致图片的增加或者减少, 因为图片没有变化。于是

图 D-3

总之, 上升直线有正斜率, 下降直线有负斜率, 水平直线有零斜率(它是上升直线与下降直线的分界线, 其斜率也是正负的分界线)。它们步调一致。

遗憾的是, 这一理论只适用于直线, 因为整条直线显示出相同的倾斜度, 即有相同的斜率。在数学中直线当然非常重要, 但是显然现实世界的很多现象显现出多变的非线性的性质。飞机不可能以某个固定的速度飞行, 生产过程也不可能呈现出不变的边际利润。总之, 我们如何确定曲线的斜率呢?要描述这个问题, 我们最终要进入微分学领域。

为了说明这一问题, 我们考虑图D-4所示的抛物线图片的图像。当图片时, 我们发现图片, 并在这条曲线上标出这个点(3, 4)为图片

显然, 整个抛物线没有固定的斜率。当我们沿着这条曲线移动时, 要不断地改变方向, 从左边进入, 开始下降, 然后在底部趋于水平, 之后向右上升。基本原理很显然:曲线不同于直线, 它每一点的斜率都不同。

那么如何确定这条曲线在点图片的斜率呢?从图上看, 在点图片画出这条抛物线的切线, 并把抛物线(曲线)的斜率看成在这点的切线(直线)的斜率似乎比较合理。下面的情景给出了这种方法的合理性。

假设我们沿着这条抛物线路径开一辆小车。我们先从左边往下开, 再水平移动, 然后向右往上爬, 越向上越陡。当正好到达点(3, 4)时, 我们突然飞出这辆车, 在车子继续沿着抛物线向上运行的同时, 我们则沿直线前进(如图D-4所示的箭头方向)。因此, 我们的飞行直线是这条曲线在点(3, 4)处的切线, 这条切线的斜率就是抛物线在点图片处的斜率。

图 D-4

这就简单多了。但如何求这条切线的斜率还不是很显然。在探讨解决方案之前, 我们应该明示其中存在的困难。因为斜率定义为

图片

所以需要直线上的两个点来计算。然而在上面的例子中, 我们只知道这条切线上的一个点, 即点图片。如果我们还知道这条切线上的另一个点, 那么很快就可以求得它的斜率。没有这样的信息, 我们就好像进入了死胡同, 但是微分学给出了绕过这一障碍的方法, 那就是间接地逼近这条切线的斜率。这是一条绝妙的进攻路线。

对于我们的问题, 我们要求的是这条曲线在图片处的斜率, 首先我们考虑在图片时的情况。此时, 没有办法知道对应于图片的这条切线上的点, 但是我们可以确定图片时抛物线上的点, 此时图片。我们在图D-5上标出这个点(4, 7)为图片, 图D-5给出了这条曲线这个关键部分的放大图。于是很容易求得通过点图片和点图片的直线的斜率, 我们称这条直线为连接图片图片的割线:

图片

这是一个非常简单的计算, 遗憾的是, 它不是切线自身的斜率, 而是那条割线的斜率, 只能作为一个粗略的近似。我们如何改进这个估测呢?

为什么不在这条抛物线上选出一个比图片更靠近图片的点呢?比如说设图片。相应的图片值是图片, 所以抛物线上有坐标为(3.5, 5.25)的点图片。连接图片图片的割线有斜率

图片

如果你想象在图D-5上在点图片图片之间画一条直线, 它显然比我们第一次尝试的图片图片之间的直线更加接近切线。于是2.50的斜率比我们第一个估测值3.0更加接近切线的斜率。

图 D-5

下一步应该是可以预测的:在抛物线上取一个更加接近点图片的点。例如设图片, 于是图片, 令图片是点(3.10, 4.21)。连接点图片图片的割线显然更加接近要求的切线, 它的斜率是

图片

继续照这样进行, 设我们的点沿着抛物线向图片移动, 并计算我们行驶过程中相应的割线的斜率。这样的一连串计算出现在下面的表格里。

出现了一个明显的模式。当我们的点沿抛物线向图片移动时, 对应的割线也旋转着, 不断靠近这条切线, 它们的斜率显然逐渐逼近无法求得的切线斜率的更精确的估测值。在我们的例子中, 我们能够很快地猜测出问题中的切线斜率是这些割线斜率无限靠近的那个数:抛物线图片在点(3, 4)处的切线的斜率显然是2。

至此, 一切都很完美。但是, 如果我们要求同一抛物线在点(1, 4)处的斜率又如何是好呢?我们或许不得不进行类似的计算并准备一张类似的表格。如果给我们另外十多个点, 需要求得在这些点处的切线斜率, 那又如何是好呢?我们可能要面对十多张表格, 而且整个操作将变得非常乏味。能够改善这种计算斜率的过程吗?

答案是肯定的。事实上, 这就是莱布尼茨在1684年发表的那篇论文中描述的规则所实现的目标。这种改善要求我们稍微采用更抽象的观点, 也就是说更代数的观点。现在我们不再关注特定的点(3, 4), 而是要创造一个求抛物线图片上任意点图片处的切线的斜率公式。

图片有坐标图片, 且图片。同上, 选择一个靠近点图片的点, 使用割线的斜率近似切线的斜率。

图 D-6

如图D-6所示, 习惯上把这个“邻近”点的第一坐标记为图片。这样一来, 我们就能认为图片是非常小的一般量, 是一个只超出图片一点点的小增量。抛物线上相应的点被标为图中的图片点。为了求它的第二坐标, 我们只需把图片代入抛物线的方程, 即用图片代替图片。这样的代入给出图片的第二坐标是

图片

所以图片点是图片。读者可能注意到, 这个问题的代数强度已经上升了一两个等级, 但是为了寻找一个一般公式, 这样的努力还是值得的。

下一步是使用求图片的公式确定过点图片图片的割线的斜率:

总之, 对于任意的小增量图片, 过点图片图片的割线的斜率是图片。但是沿着抛物线向图片点“滑动”图片的想法只是相当于让图片更加接近零。换句话说, 在确定这条切线的准确斜率时, 我们只需要取当图片趋近于零时这条割线斜率的极限就可以了。因此, 对于我们的例子, 切线的斜率是由下面的极限给出的:

图片

因为当图片向零靠近时, 图片都保持不变。(符号图片读作“当图片趋近于零时的极限”。)

顺便提醒读者注意, 我们可以对前面例子中引用的抛物线图片运用这个一般公式。此时图片。因此, 在点图片(其中图片)处切线的斜率是图片, 这和前面表格给出的答案相同。如果我们要求点(1, 4)处的切线的斜率, 那么只需设图片, 于是斜率是图片。图像证实了这条抛物线在这一点处是下降的, 与负斜率吻合。

重述:曲线的切线斜率是当图片趋近于零时相应割线斜率的极限。这个极限称为导数, 求导数的过程称为微分, 研究这些相关问题的数学分支称为微分学。

微分学的目标之一就是发展更一般的公式。我们肯定不想局限于处理抛物线。使用与上述过程类似的过程, 数学家从一般函数图片开始, 求其上任意点图片处的切线的斜率。同上, 我们在这条曲线上选择一个邻近点, 它的第一坐标是图片, 第二坐标则相应地是图片;接下来, 确定割线的斜率:

图片

最后求当图片时, 上面这个商的极限值。

莱布尼茨把导数记为图片。后来约瑟夫-路易 • 拉格朗日(Joseph-Louis Lagrange, 1736—1813)引入了更强大的记法, 他使用符号图片表示图片的导数。利用这一记法, 我们可以得到一个在所有微分学书籍中都可以找到的基本公式:

图片

从这个一般定义开始, 我们可以给出许多函数的导数。当微分图片的幂函数, 即求形如图片的函数的导数时, 一个非常优美的模式出现了, 即

图片

用语言描述的话, 它说的是求图片的导数只需要把指数拿下来放在前面当系数, 然后把幂降低一次。因此, 图片的导数是图片, 而图片的导数是图片。这是一个奇特又美妙的规则。曲线的性质及其切线的性质就蕴藏在数学中, 它们可以被阐述成如此简单的东西, 真是奇妙!

在此我们要说明关于导数定义的几点注意事项。首先, 尽管有些函数的导数很容易从相关代数获得, 但是有很多函数的导数公式却导致数学上的混乱。更糟糕的是, 对于某些函数来说, 它在一个点或几个点处甚至没有导数。对于这样的函数来说, 我们无法对有问题的点指定任意数作为这条曲线在该点处的切线的斜率。

图D-7给出了这样一个例子。在点(2, 1)处, 这个图像有一个尖角。没有办法画出这条曲线在点(2, 1)处的唯一一条切线, 因为在这里它突然改变了方向。但是, 如果我们不能画出一条切线, 那么当然也就无法确定切线的斜率, 而斜率才是它的导数的意义。这个函数以及其他有锯齿状图像的函数在尖角处都没有导数。

图 D-7

上面的例子说明, 伴随导数可能会出现不好处理的难题。这些通常涉及“极限”这个概念, 从古时候起, 数学家就以不同形式与这种思想纠缠。极限的理论意义非常重大, 我们借它定义了导数。在此我们没有必要谈及和深究这个概念的哲学意义。其实, 莱布尼茨也没有这样做。他很高兴地从“求极大值和极小值以及求切线的新方法”中寻求更直接的效益, 而不过度担心它们的理论基础。

我们已经花了很长时间讨论切线。在最后, 我们讨论一下微分在极大值和极小值中的应用。

首先要强调, 知道一个函数能达到多大或多小, 换句话说, 知道一个函数的极大值或极小值, 在数学理论和应用两方面都是非常重要的。在什么样的条件下, 我们可以极大化利润, 极小化汽油的消耗?极值问题是在现实世界中左右我们做出各种决定的关键。微分学为回答这些问题提供了工具, 这一事实充分说明了它的威力。

来看一下它是如何工作的。考虑图D-8所示的一般函数图片的图像。这个例子显然不是线性的, 因为当图片向右移动时, 它时而上升时而下降, 而且对于其上的两个点要格外注意。这两个点是图片图片, 其中图片是这条曲线能够达到的极大值, 而图片是这条曲线达到的极小值。确定图片图片的坐标当然是非常有意义的。

图 D-8

但是如何确定呢?求极大值和极小值的关键是我们前面讨论的斜率:在小山的顶部或峡谷的底部, 曲线的切线是水平的, 即是一条水平直线, 正如我们前面所说的那样, 它的斜率是零。因此求极大值和极小值就促使我们去寻找一些特殊点, 满足曲线在这些点处的切线的斜率是零, 即在这些点导数等于零。用代数语言表示, 我们的任务就是求解方程图片, 然后就可以求函数的极值。

作为一个例子, 看一下意大利数学家吉罗拉莫 • 卡尔达诺(Girolamo Cardano, 1501—1576)的一个论断, 我们将在第Z章中从不同的角度再次讨论此人。在考虑一个代数问题时, 卡尔达诺断言不存在两个实数满足其和等于10且其积等于40。利用微分学, 我们很容易证明他的结论。

那就是, 设这两个实数之一是图片, 另一个是图片。它们的和等于10可以表示成方程图片, 根据这个方程, 我们很快就可以得到图片。我们希望确定积图片如何变大。显然图片, 所以我们引入乘积函数

图片

并且运用微积分来求极大值。

我们已经求得一般二次函数图片的导数是图片, 因此, 函数图片的导数是图片(因为图片)。为了求极大积, 我们只求曲线有水平切线的那些图片值。因此我们设图片。求解相应的导数方程得图片

图片

图D-9所示的这个乘积函数图片的图像支持这个结论, 因为这条抛物线的顶点是图片。此时图片图片的乘积是图片, 这就是这个积所能取到的极大值。换句话说, 和等于10的两个实数有极大积25。卡尔达诺说不存在和等于10的两个实数, 它们的乘积等于40, 显然他是正确的。

图 D-9

前面这几个例子已使我们领略了微分学的风范, 而这只是微分学的表面。



  推荐阅读



作者:[美] 威廉·邓纳姆(William Dunham)

译者:冯速

深受读者喜爱的十年经典,千呼万唤的好书再版重出!

看完顿感舒爽,让数学课堂上的知识变得更好懂、更通透;

无需动用纸笔,纵览数学世界不可不谈的伟大定理、难题和争论;

好奇心大满足,纵览数学的核心知识和历史八卦。


我想到一个比较搞笑的。比如你玩一个手机游戏,角色升级需要的经验值曲线,一开始很平缓,后来就越来越陡峭。或者玩跑酷游戏,跳过去的时机、力度,其实都是在无意识中去“计算”一个最佳的抛物线轨迹,才能完美落地。虽然我们是用“感觉”在玩,但游戏设计者在背后肯定是用微积分来设计这些参数的,让游戏体验既有挑战性又不至于太离谱。还有你减肥的时候,体重下降的速度曲线,如果一下子掉太多,可能会反弹更快,这可能也是一个“导数”的问题,哈哈!

哈哈,这个我想到了一个特别贴近生活的例子——开车!我们开车时踩油门,车速变化就是加速度。加速度,不就是速度对时间求导嘛!另外,导航软件计算最佳路线,考虑路况、红绿灯,甚至预测未来几分钟的交通流量,这背后都是复杂的优化问题,离不开微积分的支撑。再比如,你家装修,水电师傅铺电线水管,如何用最省材料的方式走线,同时满足各种条件限制,这也是一个最小化问题,跟文章里求极值那块儿挺像的!

我觉得这争议首先就是人性的体现,谁都想抢头功嘛!但要说影响,我觉得更多是负面的。你想想,如果没有这场内耗,大家的力量是不是能拧成一股绳,共同把微积分这门学问推向更高峰?搞不好很多概念都能更早地统一和规范化,后来的学生也不用学两套记号搞得头大。感觉就是,人类的嫉妒心和荣誉感,有时候真是把双刃剑啊。

我不是科班出身的AIer,但我的经验是,不一定要把微积分的所有细枝末节都弄得一清二楚(毕竟当年的牛顿和莱布尼茨都吵架了,咱普通人更难:joy:),但核心思想一定要抓住。比如导数代表变化率,梯度指明了优化的方向。你不需要手算特别复杂的求导,因为有自动微分库(AutoDiff)帮你搞定,但如果你连“梯度是个啥”都不知道,那肯定连代码都看不懂。所以,理解概念比死记硬算更重要,那些最能体现微积分“威力”的部分,才是AI学习者最应该关注的。

这个问题提得很好!从学术角度看,牛顿和莱布尼茨的微积分之争确实影响深远。它最直接的后果是造成了英国数学界和欧洲大陆数学界长达一个多世纪的隔阂。英国人固守牛顿的流数记号和方法,而大陆则采纳莱布尼茨更为直观、易于操作的符号系统。这种分裂在一定程度上阻碍了数学思想的交流和融合,使得英国在分析学领域的进步相对缓慢。比如,很多重要的数学成果,如柯西、黎曼等人的工作,首先在欧洲大陆传播并发展开来。但也有观点认为,这场竞争也在某种程度上促使双方加速完善各自的理论体系,算是“无心插柳柳成荫”吧。

其实很多我们习以为常的东西,比如手机拍照的图像处理、视频压缩、音频降噪、天气预报模型的建立,甚至股票走势的预测模型,虽然不直接求导,但其核心算法都大量使用了微积分的思想和工具。图像的锐化、模糊,就是通过卷积运算,本质上也是一种积分或微分的离散形式。所以感觉微积分就像个“幕后英雄”,虽然我们不直接跟它打交道,但它的影响无处不在。

是的,学AI的话,微积分是逃不掉的硬核基础!文章里讲的导数求极值,在机器学习里简直是家常便饭。比如我们训练神经网络,就是要找到一个让损失函数(loss function)最小化的参数组合,这个过程就是通过“梯度下降”(gradient descent)算法来实现的。而梯度,说白了就是多变量函数的导数,它告诉我们沿着哪个方向调整参数能最快地让损失函数“下降”。所以,理解导数的概念,以及链式法则等求导规则,是理解深度学习优化过程的关键。

我觉得不光是算法层面,微积分在理解AI的很多深层原理和进行理论创新时都非常重要。比如概率论和统计学,它们是AI的另一个基石,而像连续随机变量的概率密度函数、期望的计算,都离不开积分。再者,许多用于描述复杂系统的数学模型,比如强化学习中的动态规划,也经常涉及到连续时间或连续状态空间,这都需要微积分的工具。所以,如果只是“使用”AI工具,可能不深入也能跑起来,但要“理解”和“创新”,微积分是绕不过去的坎儿。