《线性代数应该这样学》第四版上市:风靡全球420所高校的经典教材迎来更新

《线性代数应该这样学(第4版)》新版上市!本书以几何视角领悟线性代数本质,内容习题均有增加,是加州伯克利、麻省理工等420所高校教材。

原文标题:新书上市 | 加州伯克利、麻省理工等全球420所高校使用的线性代数顶尖教材终于出新版了!

原文作者:图灵编辑部

冷月清谈:

本文介绍了美国数学家 Sheldon Axler 的经典著作《线性代数应该这样学(第4版)》。该书自出版以来广受好评,已被全球超过 420 所高校用作教材,包括加州伯克利、麻省理工等顶尖名校。本书的特点在于重塑数学观,从几何视角领悟线性代数的本质,避免繁琐的代数计算,强调概念理解而非计算技巧。新版在内容和习题上均有大幅增加,更增加了 250 多道习题,更配有导读视频。文章还追溯了线性代数教学中代数计算与几何直观两派的渊源,并推荐读者结合该书和哈尔莫斯的《有限维向量空间》进行学习。

怜星夜思:

1、书中提到作者阿克斯勒提倡“打倒行列式”,这与我们通常学习线性代数的顺序有所不同。你认为先学习行列式对于理解线性代数是必要的吗?或者说,不依赖行列式的学习方式有哪些优势和劣势?
2、文章提到了线性代数教学中“代数计算”和“几何直观”两派,你更倾向于哪一种教学方式?为什么?在学习线性代数时,你是如何平衡这两者的?
3、文章中提到该书可以作为学习泛函分析的预备知识,你认为学习线性代数对于理解泛函分析有哪些帮助?

原文内容

美国数学家、数学教育家阿克斯勒的经典之作《线性代数应该这样学(第4版)》自引进出版后,广受好评,收获了十余万读者的认可。

这本书长销了30年,被超过50个国家的420所学校使用,其实不乏顶尖名校,如加州伯克利、麻省理工、苏黎世联邦理工、巴黎高师等国际名校都用于教材。

在内容上,这本书重塑数学观的线性代数教材,解决了学生在学习过程中遇到的常见困惑,告别烦琐的代数计算,从几何视角领悟线性代数的思想本质,思路行云流水,定理环环相扣,贴心讲解定义的引入动机和证明的灵感启发。


同时配有10小时导读视频,700多道高质量习题。


而此次出版的第四版变化有:内容增加15%,习题增加35%,除内容更新外,更增加了250多道习题。

图 | 作者谢尔登•阿克斯勒(Sheldon Axler)和他的猫

作者 | 林开亮,现任教于西北农林科技大学理学院

在中国,线性代数一般等同于矩阵论,这主要是受华罗庚先生的影响,他的矩阵功底炉火纯青,因此他的学生曾肯成教授这样说:“龙生龙,凤生凤,华罗庚的学生会打洞。”所谓“打洞”,就是用相似变换或其它矩阵变换将矩阵化成标准型(其中有很多元素为0,即“洞”)

据华罗庚的另一得意弟子陆启铿院士讲,当初邀请华罗庚访问美国普林斯顿高等研究所的外尔(H. Weyl)曾这样评价:“华罗庚玩矩阵就像玩数字一样得心应手。”大概是陆启铿先生的话被人听岔了,做出这一评价的外尔教授,有时被讹传为韦伊(A. Weil)。稍微了解韦伊的人都知道,他不可能说这话。为什么呢?因为韦伊是法国布尔巴基学派的灵魂人物,他跟谢瓦莱(C. Chevalley)都致力于消除代数中的行列式、结式等计算性的概念,而华罗庚是以矩阵计算见长,绝非韦伊所欣赏的风格。

即便是本科生的线性代数教学,也留下了阿廷(E. Artin)清晰可见的印记:他在我们面前从来绝口不提基和行列式(考虑到他是那么喜欢计算,这真是奇怪的禁令)。阿廷的盟友,谢瓦莱和韦伊,竭尽全力将行列式和结式驱逐出代数。每每想到革命尚未成功,九泉之下的两位(注:指1962年过世的阿廷和1984年过世的谢瓦莱,韦伊也在1998年过世)可能都无心睡眠。

在这方面,韦伊和谢瓦莱的先驱,正是罗塔这里所提到的阿廷。荷兰数学家范德瓦尔登(van der Waerden)曾根据阿廷诺特(E. Noether)的讲义,写成抽象代数的经典名著《近世代数》(后来更名为《代数学》,有中译本,科学出版社),此书直接刺激了布尔巴基学派的诞生。希尔伯特(Hilbert)诺特阿廷是近世代数的先驱,近世代数的思想一度在德国盛行。特别地,受到量子力学的刺激,冯•诺依曼(von Neumann)将这一思想应用到无限维空间的泛函分析中,导致了线性代数的几何化。

这方面的第一本书,就是冯•诺依曼在普林斯顿高等研究院的助手哈尔莫斯(P.R. Halmos)根据他的讲义写成的《有限维向量空间》(Finite-Dimensional Vector Spaces)。该书1942年出版,之后多次再版,现已成为经典(期待有朝一日能够引进中译本,这是笔者心目中独一无二的线代数圣经)

眼下这本《线性代数应该这样学》(Linear Algebra Done Right 第三版),可以说,基本上是按照《有限维向量空间》的精神写的一本新书。这毫不奇怪,作者是圣弗朗西斯科州立大学数学系的教授阿克斯勒(Sheldon Axler)。他是哈尔莫斯的徒孙,中间的链接是萨拉森(Donald Sarason)。阿克斯勒写作这本书,可以追溯到他在1995年发表在《美国数学月刊》上的一篇阐述性文章《打倒行列式!》(Down with determinants!),该文次年获得了美国数学协会颁发的 Lester R. Ford 写作奖。标题取名为“打倒行列式! ”,也许在中国的读者看来,有点不可思议!因为在通行的线性代数教科书中,行列式通常放在一开头讲的,如果直接扔掉了,后面还怎么讲?事实上,这是完全可以做到的,《线性代数应该这样学》就做到了这一点。在全书中,迹和行列式是最后一章,而之前讲完了线性代数所有其它内容(尤其是作为矩阵灵魂的特征值与特征向量),根本不需用到这两个概念!

阿克斯勒之所以要打倒行列式,可能主要是想突出线性代数的本质方面是概念而非计算。正是出于对后一个看法的支持,促使我在这里向读者推荐这本书。

如前所说,线性代数的教学分两派:一派注重代数计算,以华罗庚先生为代表,这条线最终可溯源到美国的代数与数论学家迪克森(L. E. Dickson),中间的链接是杨武之教授杨振宁的父亲,把近世代数和数论引进到中国);一派注重几何直观,以哈尔莫斯为代表,最终追溯到诺特和阿廷,中间的链接是冯•诺依曼。虽然我本人经受的课堂训练是偏计算的(教材用北大的经典《高等代数》,它以丁石孙先生的《高等代数简明教程》为蓝本,丁先生在自传中说他借鉴了苏联斯米尔诺夫的《高等数学教程》;课堂之外,我的高等代数老师、天津大学数学系田代军教授指引我去读华罗庚、万哲先的《典型群》以及雅各布森(N. Jacobson)的抽象代数著作),然而只是在我后来用哈尔莫斯的《有限维向量空间》重新学了一遍线性代数以后,我才敢说我对线性代数有了一点底气。我希望我说这话时,你不要认为我是在吹牛,我甚至希望这话能得到专业人士的认可,因为我在博士论文中的部分工作,就是用阿廷、冯•诺依曼、哈尔莫斯那一派的几何观念和方法,完善了华罗庚先生1947年的一项纯代数的矩阵工作。因此可以说,我是华罗庚先生和哈尔莫斯教授两派结合的产物。

代数计算将线性代数机械化了(我有一次在打乒乓球时感觉每一次回球就像在做一次初等变换),同时也变得有点无聊。我常常有一种天真的想法,也许可以考虑用吴文俊先生倡导的数学机械化,将华罗庚学派炉火纯青的打洞技术给实现了!

要想让线性代数生动起来,除了介绍一些精彩应用的例子外, 一个可行的办法是强调几何的语言。几何的语言, 自然是相对于代数的语言而说的。简单讲, 就是用线性变换代替矩阵, 用抽象向量代替列向量。几何语言的优点是简洁明快, 例如“作用(action)”这个词给人的感觉就是如此。代数语言的好处是具体清晰, 两个矩阵“相乘”在我们头脑中的图象,是一系列具体运算的运作。通常的教科书往往过分强调了代数的语言, 这同时也充分暴露了其诸多弊端。最大的缺点在于容易将几何淹没于代数。而且,在很多问题中坐标的选取并不重要,我们所需要的往往只是一些基本的运算规律, 例如分配律、结合律等。这时抽象的几何语言就十分适用了, 例如在内积空间的理论中, 我们往往采用几何语言。其实,数学家正是靠这种几何观点来指引具体的代数运算的, 例如所谓Gram-Schmidt正交化, 无非就是将第二个向量沿第一个向量作垂线(从三角形的一个顶点往底边引高线), 一旦指出这一点,  Gram-Schmidt正交化的公式就很容易理解了。更近一步,理解Cauchy-Schwarz不等式就是水到渠成的了:它所对应的,无非是这样一个熟知的几何事实:直角三角形的直角边长不超过斜边长。

我要指出,我这里并非说代数计算不好,我想强调的是,要尽可能在在几何直观的指引下做代数计算。我觉得借用阿廷在其名著《几何化的代数》(Geometric Algebra,1957年出版)一书中的一句话来评论阿克斯勒的《线性代数应该这样学》再好不过了:

我的经验是,一个用矩阵进行的证明,如果你抛开矩阵的话往往可以使这个证明缩短一半。有时,这一点是办不到的,你需要计算一个行列式。

我将阿克斯勒的这本书郑重推荐给所有想重新从几何的观点看待线性代数的朋友,所有想从零开始学习线性代数的朋友。该书继承和发扬了哈尔莫斯《有限维向量空间》的几何化特色,以几何引代数,以概念指导计算!它会告诉你,线性代数不仅仅是矩阵论,或者更恰当地说,从几何的观点看,线性代数和矩阵论原来可以很简单!你不再需要 -矩阵,不再需要分块矩阵,更不必担心复杂的行列式计算会挡住你前行的道路!而且,额外的好处是,一旦熟悉了这种几何的观念和思维,当你应用线性代数和学习泛函分析时会更加得心应手。

根据我的经验,要使线性代数在你心中扎根,你需要读哈尔莫斯的Finite-Dimensional Vector Spaces。如果你还不习惯读外文教材,那么阿克斯勒的《线性代数应该这样学》中译本在目前是首选。

下面我们简单介绍一下本书的内容。全书共十章,其中三章讲向量空间(1,2,6), 一章讲多项式(4),六章讲线性映射(其余)。

第一章讲向量空间,从经典的 维实列向量空间与 维复列向量空间出发,引出线性空间的一般概念。向量空间是线性代数演出的舞台。(记得我博士毕业找工作时面试高校教师时抽到的一刻钟试讲题目,就是向量空间。)

第二章讲有限维向量空间,维数是向量空间的基本不变量,借助基与坐标映射可以给出抽象向量空间到列空间的同构。限制于有限维的好处是,所有的运算都是有限的代数运算(不会涉及无穷)

现在舞台搭好,主角要出场了,第三章给出线性映射的基本概念。线性映射是向量空间之间的自然映射,在基底下体现为矩阵。给定一个线性映射,就诱导出两个重要的子空间,核空间与像空间。线性映射的基本定理(3.22节)给出了这两个子空间的维数关系。(这样一个定量关系,其实可以用线性方程组的基本定理来描述。)这个基本定理只是对线性映射给出了最粗略的描述,为了更精细地观察线性映射,我们需要将它分解为简单的线性映射。

为此,一个有效的工具是多项式,这是第四章的主题。这个概念其实不属于线性代数,但它的理论可以服务于线性变换,此即第五章的内容。主要的原因在于,当一个线性变换 作用于有限维向量空间 时,一定存在多项式 ,使得 。这样的零化多项式 可用于研究 。例如, 的分解就对应给出 的不变子空间分解。在最理想的情况,若 分解为不同的一次因子的乘积,则 就分解为特征子空间的直和。(特征值与特征向量是观察线性变换的最佳视角,不过并非所有的线性变换都可以完全通过特征向量刻画)。

第六章讨论内积空间。内积空间中因为赋予了可以度量长度、角度等几何观念的内积,从而拓展了中学阶段所熟悉的平面向量和空间向量的几何知识,例如勾股定理、正交投影等。但这不只是简单地重新唤醒我们的记忆,让我们将向量几何从二维三维推广到高维;现在有了前面关于向量空间与线性映射的概念,自然我们就要问,内积空间的不变量如何刻画?这就自然引出正交变换的概念,最终我们发现,原来正交变换(以及平移变换——注意它一般不是线性变换)就是我们中学所学习的全等(也称为欧几里得运动)概念的实质。(在中学时,我从未了解到,平面上两个图形全等的真正含义是,存在平面上的一个全等变换可以将其中一个图形一一映射成另一个图形。)

第七章的主题是谱定理,主要的结果是内积空间上的对称变换可正交分解为一些伸缩变换的直和。这是线性代数最核心的结果。据我分析,每年高等数学考研线性代数两道大题,分别考察线性方程组的基本定理与实对称矩阵的谱定理。遗憾的是,我接触到的一些迎考学生甚至在线性代数课程中都没有学过谱定理!在我看来,对大部分学生,线性代数至少要学到这里,还应知道正交变换的谱定理——因为只有知道了旋转与反射的几何图景,你才会与全等变换的直观印象联系起来,代数与几何才合二为一。就我个人来说,我真的是学完第2遍线性代数才明白我们通常说的三维空间的旋转是什么含义!

致敬科比(单指转球可以看成三维空间的一系列旋转)

第八章讲复向量空间上的线性变换的标准型,第九章讲实向量空间上线性变换的标准型,它们都是线性代数中的经典结果,要用到诸如广义特征向量之类的概念。不过对一般读者来说,也许你知道有这么一回事就可以了,毕竟通常呈现在你眼前的线性变换(或矩阵)都是比较简单而特殊的,用不到如此一般的系统理论。

第十章是迹与行列式,这是线性变换的两个基本不变量。行列式比迹要复杂,所以放在后面。我的朋友吴帆在线性代数教学方面颇有心得,他曾说过,任何一本线性代数教材,如果一开头就讲行列式,学生基本上就学不会线性代数了。我想,这正是国内许多人学不会线性代数的原因吧。因此,我们特别提醒那些想学会线性代数的读者,如果你不想一开头就被行列式弄头大,不妨选择我们推荐的这本书。

对了,各章开头插入的精美彩图也会令你眼前一亮,心向往之!我们仅取第一章和最后一章的两幅插图为证!

第一章插图:笛卡儿(右一)在向瑞典女王克里斯蒂娜讲解自己的工作


第十章插图:英国数学家和计算机科学先驱艾达•洛夫莱斯

本书的前两版曾在美国近420所院校作为教材使用,作者因此收到了成千上万条反馈意见,可以想见,第三版将何等卓越。奇文共欣赏,疑义相与析。预祝你们阅读愉快,有疑问不妨直接与作者联系,据我的经历,阿克斯勒非常欢迎读者给他提意见与建议。


注:正规矩阵(normal matrix)是一类重要的矩阵。此处的笑点在于,normal 在英文中是“正常”的意思。所以,如果要真正体现出幽默来,可能要将“正规矩阵”翻译为“正常矩阵”。请允许我多说一句,可以说,正规矩阵的谱定理(各个版本)是线性代数中最重要的一个定理。


  • 温馨提示1:虽然这本书中穿插着一些幽默的图片与言论(如上图,取自原书7.B节习题15,题目是求图片中第一个矩阵被挡住的右下角元素。),但它更适合比较严肃的读者,特别是数学系的学生。读完这本书,再接触抽象代数(如小阿廷(M. Artin)的著作),应该会比较容易。对于非数学专业的学生,我想可能你们会更适应MIT数学系教授Gilbert Strang的线性代数教材和公开课视频。我想这两本书的差别可以概括为:本书重线性映射的理论,从不变量的角度以几何的观点考察线性代数;Strang的书重矩阵的应用,强调具体计算以诠释线性代数的种种应用。简单说,如果你更喜欢线性映射之类的几何语言,那么用本书;如果你更习惯矩阵之类的代数语言,用Strang的书。当然,并无绝对,本质上线性代数是代数与几何的统一,两种观点都是需要的。Strang的个人主页为:
    http://www-math.mit.edu/~gs/
  • 温馨提示2:《线性代数应该这样学》原书在2016年出版了一个删节版,可以在作者的个人主页免费下载:
    http://linear.axler.net/LinearAbridged.pdf
  • 温馨提示3:作者制作了本书的音频(带幻灯片),有兴趣的读者可以浏览:
    https://www.bilibili.com/video/av63561127/
致谢:感谢本刊编委、美国南密西西比大学丁玖教授和付晓青博士对初稿提出了有价值的建议!




  推荐阅读

《线性代数应该这样学(第4版)》

作者:【美】阿克斯勒(Sheldon Axler)

译者:杜现昆、刘大艳、刘阿明、杨行

美国数学家、数学教育家阿克斯勒的经典之作,影响全球数学教育的线性代数教学标杆;

加州伯克利、麻省理工、苏黎世联邦理工、巴黎高师等国际名校教材;

长销30年,被超过50个国家的420所学校使用,不依赖行列式的线性代数教学法;

新版变化:内容增加15%,习题增加35%,除内容更新外,更增加了250多道习题。


同意楼上!行列式在判断矩阵是否可逆的时候非常有用。行列式非零等价于矩阵可逆,这个结论在很多地方都会用到。虽然也可以用其他方法来判断矩阵是否可逆,比如高斯消元法,但是行列式提供了一种更直接的方式。尤其是在理论推导中,行列式往往能简化证明过程。

我觉得最大的挑战是放下面子,承认自己以前学的可能只是“术”,而不是“道”。然后,像个小白一样,重新开始学习,不带任何偏见,Open Mind 最重要!

emmm,对我这种学渣来说,还是几何直观一点比较友好。代数计算太枯燥了,容易算错不说,还容易忘了背后的意义。几何的话,至少还能在脑子里有个大概的图像,方便理解和记忆。当然,真要用的时候,还得靠代数计算来落地。

我觉得这两种流派各有千秋,对于初学者要看情况。如果是有一定数学基础,抽象思维能力比较强的,直接从几何入手可能更容易抓住本质。但如果数学基础比较薄弱,可能先从代数计算入手,通过大量的练习来建立直观感觉,然后再慢慢过渡到几何理解,也是一个不错的选择。关键是要找到适合自己的学习方式。

对于已经学过线性代数的朋友,这本书最大的帮助应该是提供了一个全新的视角,让你从几何的高度重新审视线性代数。可以帮助你摆脱对矩阵和计算的过度依赖,更关注线性变换、向量空间等更本质的概念。个人感觉需要注意的是,这本书的抽象程度相对较高,可能需要一定的数学基础才能比较顺利地阅读。可以结合一些具体的例子和应用来辅助理解。

这本书对于已经学过线性代数的同学而言,能够帮助他们深化对线性代数本质的理解。通过几何的视角,可以将原本孤立的知识点串联起来,形成一个完整的知识体系。然而,需要注意的是,这本书的风格偏抽象,对读者的数学素养要求较高。建议在阅读本书之前,先复习一下线性代数的基本概念和定理,并结合一些实际应用案例进行学习,以更好地理解书中的内容。

“打倒行列式”更多的是一种教学理念的革新,强调从更本质的概念出发理解线性代数。行列式本身作为一种计算工具,在很多领域仍然有应用,比如求解线性方程组、计算特征值等。但过早或过度强调行列式可能会让学生陷入繁琐的计算,而忽略了线性代数的几何意义和内在联系。对于非数学专业的学生,个人觉得应该更侧重于理解线性代数的思想和应用,例如线性变换、向量空间、特征值等概念,以及它们在机器学习、数据分析等领域的应用。计算方面,可以通过软件工具来辅助。

这个问题问得好!我之前也是习惯了算算算,后来发现概念理解才是王道。我的建议是,可以先从可视化工具入手,比如 GeoGebra,把线性变换的几何意义画出来,多玩玩。然后再对照着书上的定义,把几何直观和抽象概念对应起来。另外,MIT 的 Gilbert Strang 教授的线性代数公开课也是个不错的补充,虽然他更侧重计算,但也能帮你打好基础。

学习原版教材的优势在于更原汁原味,可以避免翻译带来的信息损失。但对于初学者来说,直接阅读原版教材可能会遇到语言障碍,导致学习效率降低。中文教材的优势在于易于理解,但可能会在某些细节上有所省略或简化。因此,我的建议是,先通过中文教材建立基础,再选择性地阅读原版教材,加深理解。

“打倒行列式!”其实是一种教学理念的体现,作者想强调的是线性代数的重点在于概念理解,而不是繁琐的计算。行列式当然有它的用处,比如判断矩阵是否可逆,但过早地陷入行列式的计算,容易让学生只见树木不见森林,忽略了背后更重要的线性空间和变换的几何意义。所以,作者并不是说行列式完全不重要,而是想调整学习的优先级。

个人理解,“打倒行列式”并非真的要完全抛弃行列式,而是要避免过度依赖行列式进行计算,本末倒置。行列式当然有用,但它只是一个工具,不应该成为学习线性代数的障碍。就像开车,学会了用方向盘和油门就能上路,但也要了解发动机的原理,才能更好地应对各种情况。
如果为了避免一开始就被劝退,可以考虑先跳过行列式相关的章节,等对线性代数有了整体的把握之后,再回过头来学习行列式,可能会更容易理解。

别慌,代数计算是基本功,几何直观是更高维度的理解。可以试着做思维导图,把代数公式和几何意义联系起来,形成自己的知识网络。另外,多看看书里的例题和图示,跟着作者的思路走,慢慢就能体会到几何的魅力了。记住,罗马不是一天建成的!

一个是“刀法精湛”,招招致命;一个是“内力深厚”,以不变应万变。华老的方法适合解决具体问题,冯·诺依曼的方法更注重理论高度。现在嘛,最好是内外兼修,既能快速解题,又能深刻理解背后的原理。当然,如果实在选一个,我觉得还是几何方法更重要,毕竟理解了本质才能更好地应用。

对于习惯代数计算的同学,适应几何直观可能需要一个渐进的过程。可以先从简单的例子入手,比如二维、三维空间中的向量和变换。然后,尝试将代数运算与几何图形联系起来,例如将矩阵乘法理解为空间中的旋转、缩放等变换。此外,阅读一些经典的几何书籍或观看相关的教学视频也能帮助建立几何直觉。

这标题有点cult啊!但仔细想想,行列式确实容易让人陷入算术的泥潭。没有行列式,线性代数照样能玩转,关键是理解线性变换的本质。就像学武功,内功心法练好了,招式自然水到渠成。不过,该背的公式还是要背的,毕竟考试要用嘛!

华罗庚先生的矩阵方法,可以理解为着重从代数的角度,通过对矩阵进行运算和变换来研究线性代数问题,这种方法在工程计算等领域有广泛应用。而冯·诺依曼的几何方法,则是强调从几何直观出发,通过研究向量空间和线性变换的几何性质来理解线性代数。这两种方法是相辅相成的,前者是后者的基础,后者为前者提供了直观的解释。对于今天的线性代数学习,我认为两者都不可或缺,关键在于根据具体问题选择合适的方法。

个人觉得“打倒行列式”并非完全抛弃,而是强调在线性代数学习中概念理解的重要性高于纯粹的计算。行列式固然重要,但如果一开始就陷入复杂的计算,很容易迷失方向,看不到线性代数的本质。先建立起清晰的几何直观,再回头学习行列式,可能会有更深刻的理解。当然,对于需要大量计算的工程领域,熟练掌握行列式计算也是必要的。

我个人更喜欢几何直观,毕竟人是视觉动物,能够把抽象的代数概念和具体的几何图像联系起来,更容易理解和记忆。而且几何直观往往能提供解决问题的思路。但是,代数计算是必不可少的工具,没有扎实的计算能力,很多想法也无法实现。鱼和熊掌,最好兼得。

哈哈,这个深有体会!刚开始学的时候,各种矩阵变换、特征值特征向量,感觉就像在做题。后来慢慢才意识到,这些东西背后都对应着空间中的某种变换。理解了这种对应关系,再看线性代数,感觉就不一样了,很多之前难以理解的概念也变得清晰起来。所以说,线性代数不仅仅是计算,更重要的是理解其几何意义。