Peter Lax线性代数经典著作再版,豆瓣9.4高分!

线性代数大师Peter Lax经典著作《线性代数及其应用》第二版修订版上市,豆瓣9.4高分!

原文标题:新书上市 | 当代最杰出的数学家之一,阿贝尔奖与沃尔夫奖双料得主Peter Lax线性代数代表作,豆瓣9.4高分!

原文作者:图灵编辑部

冷月清谈:

应用数学和纯数学领域大师Peter Lax的线性代数代表作《线性代数及其应用》第二版修订版现已上市!这本备受赞誉的书籍在豆瓣评分高达9.4,曾一度绝版,如今终于回归。本书全面覆盖线性代数的核心内容,包括线性空间、线性映射、矩阵、行列式、谱理论以及欧几里得结构等,并独具特色地讨论了向量值与矩阵值函数的微积分、动力学、凸集、赋范线性空间以及自伴随矩阵的本征值计算等专题。
本书不仅注重理论,更强调应用和算法,在抽象性和实用性之间取得了平衡,弥补了传统线性代数课程的不足,能让读者从高观点洞悉线性代数的本质。本书适合已经学习过初级线性代数课程的学生以及高等数学领域的研究者阅读。作者Peter Lax是阿贝尔奖与沃尔夫数学奖的双料得主,也是美国国家科学院院士和纽约大学库朗数学科学研究所教授。书中内容源于他在纽约大学多年来的教学经验,并融入了他对线性代数的独到见解。

怜星夜思:

1、书中提到了线性代数在小波理论中的应用,大家在学习或研究中还有遇到哪些线性代数在其他领域中的有趣应用?
2、对于行列式和谱理论这些抽象概念,除了书中提到的引入方式,大家还有没有其他更直观或更容易理解的理解方法?
3、书中提到了Strassen算法可以优化矩阵乘法的计算速度,除了这个算法之外,大家还了解哪些其他的矩阵运算优化算法?

原文内容

2009年,图灵出版了阿贝尔奖、沃尔夫数学奖得主,美国国家科学院院士,纽约大学库朗数学科学研究所教授,应用数学和纯数学领域大师彼得·拉克斯(Peter Lax)代表作《线性代数及其应用》


引来众多数学专业人士的交口称赞,至今保持着豆瓣9.4的高分。虽然之后一度绝版,但读者依然保持着很高的热情。因此,这本书终于迎来再版!第2版·修订版正式上市!


本书以独特的视角呈现线性代数的全貌,全面覆盖了线性空间与线性映射、矩阵与行列式、谱理论、欧几里得结构等核心理论,还单独讨论了向量值与矩阵值函数的微积分、动力学、凸集、赋范线性空间、自伴随矩阵的本征值计算等特色专题,理论和应用相结合。


从高观点洞悉线性代数的本质。本书在介绍应用和算法的同时,也保留了线性代数的理论结构,在抽象性和实用性之间找到平衡,弥补了传统线性代数课程的不足。

来源 | 《线性代数及其应用(第2版·修订版)》
作者 | [美] 彼得·拉克斯(Peter Lax)
译者 | 傅莺莺,沈复兴
文章 | 摘自《美国数学月刊》

评论者 Mark A. Kon

什么是线性代数?或许最简单的描述是,它是研究有限维向量空间以及作用于其上的线性算子(矩阵)。这个学科在几十年前似乎已经被征服了,直到高性能计算机和对计算方法的详细研究的出现。计算机适合执行线性操作,而非线性操作通常可以被简化为线性操作的序列,例如在解决非线性微分方程时使用Runge-Kutta和其他算法。

数值数学中对诸如解线性方程组、求本征值和求逆矩阵的需求,引发了对高效实现这些操作的算法进行分析的研究热潮。这些研究至今仍在持续进行。

关于线性代数的一个有趣事实是,长久以来,它在高等数学中既无处不在又无处可寻。尽管线性代数默认地只关注有限维空间,但泛函分析在一定程度上已经吸收和使用了线性代数的思想和语言。泛函分析中的谱理论更加通用,也适用于赋范线性空间,并且包含了有限维谱理论的大部分内容。

尽管如此,在有限维的线性代数中也有许多在其泛函分析的版本中丢失的内容,例如行列式、本征多项式和标准形。

无论如何,线性代数是数学的基本板块。数学家们认为,我们和其他以任何高于微积分的水平上使用数学的人都应该对它非常熟悉,而且它是“有效的”:如果遇到可以放在线性代数背景下的问题,通常都能找到解决它的工具。

线性代数在分析中的重要性在我教授的一门本科应用数学课程中变得尤为明显。这门课程专注于小波理论,这是一个基本概念非常适合用线性代数的观点来发展的学科。

小波理论中的多分辨率分析涉及一系列嵌套向量空间,许多“小儿科”的线性代数术语都会在短时间内出现。涉及线性无关性、张成、正交性、互补空间等线性代数基础的主题在课堂上以非常自然和实用的情景被引入。

线性代数教材主要针对本科生,主要分为两类。第一类是针对工学、计算机科学或物理学专业的二、三年级学生的“实用”但通常严谨的讲法。这类书中的主题已经变得非常标准化,包括基本向量空间理论(线性相关性、子空间等)、线性方程组、本征值和本征向量,可能还包括奇异值分解和抽象向量空间。这类教材的理念是,线性代数是一个重要的应用学科,但应该在严谨的数学背景下呈现。(这与微积分的呈现方式形成对比,至少在许多美国教材中,严谨性明显地让位于实用性。)

第二类是针对大学数学专业的本科生,有时是应用领域的研究生,它具有更强的理论性。这类教材传统上包括更严谨的代数导向的书,如Nomizu [5],以及分析导向的书,如Hoffman, Kunze [1],它仍在许多针对大学数学专业的本科生和更进阶的学生在课程中使用。还有一些书籍,如Lancaster, Tismenetsky [4]和Horn, Johnson [2][3],它们针对的是更高阶的读者。

我们所评论的这本书,主要基于作者在纽约大学多年来教授的课程,针对的是已经学过初级线性代数课程的学生。它的范围超出了[1]和[5],并且比[2]、[3]和[4]更具有分析导向。选择的主题显然是一位经验丰富的应用数学人的最爱。它的一个目标是,在算法方面已经成为主导的应用线性代数中,将理论恢复到应有的位置。

第二个目标是展示丰富的应用,第三个目标是讲解一些不寻常的数值算法。这本书反映了作者的观点,即已知的有趣的数学内容正在爆炸式增加,教科书应该与数学的新的重要领域保持联系。在这本书中,Lax提供了触手可及的高等材料。

Lax的这本书以对基本理论的快速回顾为开始,定义了线性无关性、维度、对偶和线性变换等概念,并且推导了一些基本关系(如零空间和值域的维度之间的标准关系)。Lax利用商空间的技巧,以避免在讨论线性方程组时进行变量计数,使得证明简洁通透。这些基本框架通过一些很不简单的应用得到充实,如求积公式、多项式插值和离散Dirichlet问题的解。所有这些都在前三十页左右,书的其余部分以类似的节奏进行。

这本书努力传达一些较不直观但很重要的线性代数概念,这些概念揭示了抽象数学与现实世界之间令人眼花缭乱的联系的奥秘,其中两个概念是行列式和矩阵的谱。这些根本性的思想是自然界许多方面的真正基础,但在人类最基本的认知水平上并不自然存在。

也就是说,它们是构造性概念的范例,对于那些与之打交道的人来说是熟悉而自然的,但对于那些第一次看到它们的人来说可能是不可思议的。行列式广泛地出现在基本的数学构造中,因而数学家将其视为第二本质,但它的定义有些不太直观。

同样,谱理论是量子现实物理学的核心。如此出乎意料地重要的东西,乍看之下其定义可能莫名其妙,现在却成为一些人的常识,这都要归功于人类的智慧。编写线性代数书籍的作者必须处理这样一件事:无论这些概念对专家来说多么直观清楚,其动机对初学者来说可能显得很牵强。

Lax引入行列式的动机是基于单形的体积,这对我来说是引入这个主题最自然的方式。这种几何背景有一个直接的代数结果,即行列式是其向量参数的多重线性交替函数。所有其他性质均由此(连同标准化性质图片)得出,当然包括行列式的标准公式。

Lax引入谱理论的动机相当吸引人。他举了一个看似简单的例子,涉及矩阵高次幂的趋势,由对线性动态系统的研究引出,值得在这里复述一下:四个矩阵是

Lax指出

图片

其中第一个不等式表示矩阵的每个元素的大小都超过图片,最后一个的含义类似。第二和第三个式子只需通过观察到图片图片即可解释清楚解释第一和第四个式子的关键是征向量和征值的概念。

我很高兴看到谱理论与“现实”之间的简单联系,如果假定后者包括基本的矩阵运算的话。一直以来(特别是在高等数学中),通过展示看似没有动机的定义来锻炼学生的学习能力已经成为一种传统。

结果,少数具有明显抽象倾向的学生熟练地掌握这些定义,而那些得益于新概念在“现实”中的联系的学生在很大程度上被排除在外。Lax能够为并不直观的概念提供自然的联系,这是此书的与众不同之处。

此外,还有很有趣的一章是关于向量和矩阵的参数化族的。主要结果是,如果一个矩阵可微地依赖于参数,那么它的单本征值也是如此。连续矩阵值函数这一主题在应用数学中非常重要,例如其无限维版本在非谐振子及其本征值结构的研究中,但我没想到会在线性代数教材中看到这个话题。

一个值得注意的结果是错开交叉现象,其中两个参数化的本征值看似要交叉,但如懦夫博弈一样,在最后一刻转向并错开彼此。其解释很简单,是一个计数论证,它表明在对称矩阵空间中,具有多个本征值的矩阵构成一个余维度为2的子流形。因此,单参数曲线通常接近然后却离开这个子流形,而永远不会与之相交。

这本书以算子理论为导向,矩阵代数中与此框架不符的部分在很大程度上被省略了。例如,没有提到将矩阵视为外积之和的用处。另一方面,书中的一些主题可以当作对泛函分析中所研究的其无限维类似物的一个很好的介绍。

例如,Hahn-Banach定理就是凸性结果的一个例子,而Perron定理,即正矩阵具有与最大本征值相对应的正本征向量,是正微分算子(在取逆之后)的基本本征函数的正性的类似物。不过,有限维的线性代数也从未落后。

例如Carathéodory定理,该定理指出,n维空间中的凸集K中的每个点都可以表示为K的n+1个极点的凸组合。

证明几乎总是简明扼要的,让人觉得作者很喜欢为线性代数中的标准结果寻找令人愉快的简洁证明。Gram-Schmidt正交化方法由七行证明推导得出,利用其作为递归算法的定义,Jordan标准形和本征向量及本征值的完备性则通过新颖而引人注目的技巧来证明。

应用往往紧扣理论。有一章是关于运动学和动力学的,涉及矩阵和向量方程。旋转矩阵及其无穷小生成元是李群和李代数的一个基本例子,在动力学的背景下得以呈现,而引入时间依赖性引出了瞬时旋转轴和角速度的概念。

此外,质点振动系统也以矩阵方程的形式进行研究。Perron定理应用于基本的进化生物学模型,其中随机矩阵的幂的极限被证明收敛于主本征向量的正数倍。其他章节涉及在经济学和博弈论中的应用。

这本书有很多个附录,每个只有几页,提供了一般教材中不常见的令人惊讶的材料,包括特殊行列式、辛矩阵、张量积、Gershgorin定理、本征值的重数等。一个附录涉及Pfaff定理,该定理指出,偶数阶反对称矩阵的行列式是其元素的齐次多项式的平方。

另一个附录研究了快速矩阵乘法以及在图片乘法运算以内图片矩阵乘积的可能性这是通过对Strassen算法的分析实现的,该算法给出了一个幂为图片而不是3的复杂度快速矩阵乘法已经成为数值分析和计算机科学中的一种潮流,许多算法都在Strassen算法彼此的基础上进行了改进

现在,我想给可能采用这本书作为课程教材的人写下一些评论。这本书不适合初学者,它假设读者有一定的线性代数的经验,写作风格简洁而不拘一格,让人感觉像是讲义而非精致的文本。

在语言上有一些随意,例如根据作者对维度的定义,平凡子空间没有任何维度。作者以两种不同的方式使用“正矩阵”这一术语(尽管他对此作出了提醒),而且他使用了向量空间的直和的两个定义。这种风格有时会使内容变得紧凑,例如零空间的定义蕴涵它是一个子空间的事实,这理论上是需要证明的。

出于这些原因,我建议在采用之前先审阅这本书。尽管如此,这本书还是值得作为一本教材,供那些成熟的学生阅读,使他们从快速的教授风格中受益。这本书应该对有野心的本科生和研究生一样有所帮助。事实上,一些本科课程已经采用了这本书来培养优秀的学生。

至少这些年来,线性代数的高级教材还很少见。因此,在这个细分市场中几乎没有竞争。这本书证明了有许多主题值得这样的努力,而它也确实填补了课程的空白。

总之,这本书采用的方法具有指导性和独创性,而且内容全面,因此推荐给教师、研究人员和学生阅读。事实上,它在每个数学人的书架上都应该占有一席之地。证明是直接的、新颖的、优雅的,其表述方式启发了人们重新思考那些变得太过常规的材料。


参考文献

1. K. Hoffman & R. Kunze, Linear Algebra, Prentice-Hall, Englewood Cliffs, NJ, 1971.

2. R. Horn & C. Johnson, Matrix Analysis, Cambridge University Press, Cambridge, U.K., 1985.

3. R. Horn & C. Johnson, Topics in Matrix Analysis, Cambridge University Press, Cambridge, U.K., 1991.

4. P. Lancaster & M. Tismenetsky, The Theory of Matrices, Academic Press, New York, 1985.

5. K. Nomizu, Fundamentals of Linear Algebra, McGraw-Hill, New York, 1966.




  推荐阅读

《线性代数及其应用(第2版·修订版)》

作者: [美] 彼得·拉克斯(Peter Lax)

译者:傅莺莺,沈复兴


阿贝尔奖、沃尔夫数学奖得主,美国国家科学院院士,纽约大学库朗数学科学研究所教授,应用数学和纯数学领域大师彼得·拉克斯(Peter Lax)代表作《线性代数及其应用(第2版)》全新修订版!


这本书涵盖了线性代数的核心知识和方法,也融入了丰富的应用案例,并在具体的计算和抽象的论述之间找到平衡,弥补了传统线性代数课程的不足。

关于矩阵乘法,其实还有很多优化算法,比如Coppersmith–Winograd 算法及其各种变体,它们都是Strassen算法的改进版本,可以进一步降低计算复杂度,不过实际应用中Strassen算法用的比较多。

对于谱理论,我觉得可以从线性变换的角度来理解。一个矩阵代表一个线性变换,特征值和特征向量就是在这个变换下保持方向不变的向量和对应的缩放比例。这样就能比较直观地理解特征值和特征向量的意义了。

说到这个,我想到的是在机器学习里,线性代数简直就是基石啊。各种降维、分类、回归算法,背后都是线性代数的各种矩阵运算、特征值分解之类的操作。比如主成分分析(PCA)就用到了特征值分解来找到数据的主要特征。

补充一点,关于谱理论,还可以结合一些物理应用来理解,比如在量子力学中,算符的本征值对应于可观测量的值,本征态对应于系统的状态。这样就更能体会到谱理论的物理意义了。

对于稀疏矩阵,有很多专门的存储格式和运算算法,比如压缩稀疏行(CSR)、压缩稀疏列(CSC)等等,可以大大减少存储空间和计算时间。

针对特定类型的矩阵,比如对称矩阵、正定矩阵等,也有一些特定的优化算法,可以利用矩阵的特殊结构来提高计算效率。 “书中提到了Strassen算法可以优化矩阵乘法的计算速度,除了这个算法之外,大家还了解哪些其他的矩阵运算优化算法?”这个问题很有意思,可以深入研究一下。

我记得图论里也用到了不少线性代数的知识,特别是邻接矩阵和关联矩阵,可以用来表示图的结构,然后通过矩阵运算来研究图的性质,比如连通性、最短路径等等。

关于行列式,可以把它理解成一个平行多面体的体积(带符号)。这样的话,行列式的性质,比如交换两行行列式变号,某一行乘以一个常数行列式也乘以这个常数等等,就比较容易理解了。

控制理论里,线性代数也扮演着重要角色。状态空间模型就是用矩阵和向量来描述系统的状态和输入输出关系,然后通过线性代数的方法来分析系统的稳定性、可控性等等。