李航新著《机器学习方法(第2版)》发布:七年打磨,强化学习独立成篇

李航新书《机器学习方法(第2版)》发布,强化学习独立成篇,构建完整AI学习框架。

原文标题:打磨7年,李航新书《机器学习方法(第2版)》发布,有了强化学习,赠书20本

原文作者:机器之心

冷月清谈:

李航老师著作《机器学习方法(第2版)》近日正式发布,这部历时七年打磨的新作,是在广受好评的《统计学习方法》及《机器学习方法(第1版)》基础上进行的全面升级。新版最大的亮点在于将强化学习独立成篇,系统介绍了其基本框架与代表算法,填补了此前许多教材在此领域的空白。

全书构建了一个完整的机器学习知识体系,分为四大核心部分:监督学习、无监督学习、深度学习和强化学习。每个部分都深入讲解了各自领域的核心方法,如监督学习中的支持向量机、提升方法;无监督学习中的聚类、EM算法;深度学习中的Transformer、扩散模型;以及强化学习中的马尔可夫决策过程、深度 Q 网络等。

除了新增强化学习篇章,本书还对监督学习与无监督学习的现有内容进行了大幅修订与优化,增加了线性回归等方法,并删除了部分不再常用的技术,确保内容的实效性和实用性。作者注重从具体例子入手,结合严谨的数学推导,帮助读者深入理解原理。书中还配备了习题与参考文献,方便巩固学习和进一步探索。

《机器学习方法(第2版)》主要定位为大学教材、辅助读物以及专业人员的参考书,要求读者具备微积分、线性代数、概率统计和计算机科学基础知识。这本书旨在对最基础、最常用的技术进行透彻讲解。作者李航博士是ACM、ACL、IEEE Fellow,在自然语言处理、信息检索、机器学习等领域有深厚造诣。文章最后提到了20本赠书活动。

怜星夜思:

1、这次李航老师的新书把强化学习单独拿出来讲,是不是意味着强化学习在AI领域的重要性越来越高了?大家觉得强化学习未来在哪些方面会有突破性的应用,或者它在实际开发中还有哪些挑战啊?
2、《机器学习方法(第2版)》涵盖了监督、无监督、深度学习和强化学习四大分支,知识量这么大,对于想系统学习AI的朋友们,你们觉得应该按照什么顺序来学习这些内容比较高效?是先打好传统基础再进阶深度和强化,还是有其他更推荐的路径呢?
3、李航老师这本书从2018年开始打磨,历时7年才完成最终版,期间还删改了一些‘不常用’的技术。大家觉得在AI技术飞速发展的当下,一本机器学习教材的‘寿命’大概有多长?我们应该如何平衡学习基础理论和追逐最新技术呢?

原文内容

机器之心报道

机器之心编辑部


每个领域的发展,都离不开几本奠定基础的经典书籍,人工智能亦是如此。


此前,李航老师的《统计学习方法》《统计学习方法(第 2 版)》可以说是机器学习宝典,很多学生、老师都将此书奉为必读书籍。


然而,随着 AI 技术的快速发展,特别是深度学习的飞跃式进展,一本仅覆盖传统机器学习的教材,已无法全面反映当前机器学习技术的全貌。 


因此,李航老师在前两版的基础上,又推出了《机器学习方法》,新增深度学习内容。


而近期,AI 圈对于强化学习的关注也在迅速升温。从大模型与智能体的融合尝试,到强化学习在游戏、机器人控制、决策优化中的广泛应用,这一方向再次成为焦点。然而,此前许多教材对此涉及较少,甚至完全缺席,导致很多人无法系统学习。


现在这个问题也解决了。李航老师全新上线新书《机器学习方法(第 2 版)》,将强化学习独立成篇,系统介绍了强化学习的基本框架与代表算法,包括马尔可夫决策过程、多臂老虎机问题、深度 Q 网络等。


全书共分为 4 篇( 或 4 册),对应监督学习、无监督学习、深度学习和强化学习 4 个主要分支。


至此,《机器学习方法(第 2 版)》构建起了一个覆盖监督学习、无监督学习、深度学习与强化学习的完整知识框架,为希望系统学习 AI 的读者提供了由浅入深、循序渐进的学习路径。



  • 第 1 篇:介绍监督学习的主要方法,包括线性回归、感知机、支持向量机、最大熵模型与逻辑斯谛回归、提升方法、隐马尔可夫模型和条件随机场等。

  • 第 2 篇:介绍无监督学习的主要方法,包括聚类、奇异值分解、主成分分析、马尔可夫链蒙特卡罗法、EM 算法、潜在语义分析、潜在狄利克雷分配等。

  • 第 3 篇:介绍深度学习的主要方法,包括前馈神经网络、卷积神经网络、循环神经网络、Transformer、扩散模型、生成对抗模型等。

  • 第 4 篇:介绍强化学习的主要方法,包括马尔可夫决策、多臂老虎机、近端策略优化、深度 Q 网络等。


《机器学习方法(第 2 版)》第 4 篇部分目录


除了新增篇章,《机器学习方法(第 2 版)》还增加了若干监督学习方法,如线性回归;基于读者的反馈,新书对监督学习的大部分内容和无监督学习的少部分内容做了大幅修改,删除了一部分目前已不常用的技术,如部分机器学习优化算法。


书中每章会介绍一两种机器学习方法,详细叙述各个方法的模型、策略和算法。从具体例子入手,由浅入深,帮助读者直观地理解基本思路,同时从理论角度出发,给出严格的数学推导,严谨翔实,让读者更好地掌握基本原理和概念。


《机器学习方法(第 2 版)》第 4 篇部分内容,可以看出有公式,有图表,非常适合当教材。


为满足读者进一步学习的需要,书中还对各个方法的要点进行了总结,给出了一些习题,并列出了主要参考文献。


习题示例,利于读者巩固知识


进一步的,为了增加可读性,整本书中尽量统一了符号用法;修改了大大小小几十处错误;重新绘制了几乎所有的插图。


本书主要定位为大学教材或辅助读物,以及专业人员的参考书。假设读者已具备一定的微积分、线性代数、概率统计和计算机科学知识。本书并不试图涵盖所有内容,而是希望对最基本、最常用的技术进行透彻的讲解和分析,帮助读者学习和掌握。


李航老师表示,该书从 2018 年开始写作,中间历经 2022 年出版的《机器学习方法》第 1 版(增加了深度学习内容),至 2024 年 12 月完成《机器学习方法(第 2 版)》,历经 7 年时间,按照李航老师最初写作《统计学习方法》时的规划,完成了最终版。


作者介绍


李航,ACM Fellow,ACL Fellow,IEEE Fellow。京都大学毕业,东京大学博士。曾就职于 NEC 公司中央研究所、微软亚洲研究院、华为诺亚方舟实验室,目前在字节跳动 Seed 部门工作。主要研究方向为自然语言处理、信息检索、机器学习、数据挖掘。


最后,还有个好消息,李航老师的《机器学习方法(第 2 版)》将限量免费赠送 20 本


我们将从留言中选取 20 位点赞数最高的读者,把这本书送到你手中。


上海 AI Lab 26 届校招正式批开启!全岗位「无限复活甲」助你 offer 到手!
  • 投递 0 限制:简历可多次投递,心仪岗位大胆冲!

  • 100+ 职位,赛道超丰富,细分方向任你选!

  • 顶级科研平台与资源:超大规模算力集群,PB 级数据,亿级研发投入!
  • 清晰的职业发展通道:由实验室出题,为你链接顶尖高校、科研机构和行业企业!

扫描下方二维码即可投递简历。

© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com

针对“强化学习未来还能在哪些意想不到的地方发挥巨大作用”这个问题,我认为强化学习在金融领域的应用潜力巨大,例如自动交易策略优化、风险管理和投资组合决策,可以动态调整策略以适应市场波动。在医疗健康方面,个性化治疗方案的推荐、药物剂量优化、甚至手术机器人的实时路径规划等,都有很大的探索空间。此外,智慧城市管理,如交通流量优化、能源分配调度等复杂系统控制,RL模型也具有天然优势,能处理动态、不确定的环境。

说的更新速度,我感觉AI领域已经卷到每年都在创造新名词了。教材作者简直是“炼丹师”转“历史学家”,既要懂“怎么炼”,又要“记录炉火纯青的丹方”,还得“预测下一炉丹药会是什么味”。挑战就是,当你把Transformer写进书里,Diffusion Models又火了;当你把Diffusion Models加进去,可能下一个GenAI模型又刷屏了。所以我觉得,最好的教材是能教给你“学习如何学习”的框架,而不是穷举所有技术。

强化学习独立成篇,确实体现了其日益增长的重要性。在现实世界中,除了大家熟知的游戏(AlphaGo、星际争霸),RL在许多领域都有突破性应用。比如,在工业自动化与机器人控制中,RL可以训练机器臂完成复杂操作,优化生产流程;在推荐系统和广告投放中,RL能学习用户行为,动态调整策略以提高转化率;在金融领域,可以用于投资组合优化和高频交易策略。未来,RL与大模型的结合,有望催生出更加智能的AI Agent,在更广泛的复杂决策任务中发挥关键作用,例如智能城市管理、自动驾驶决策甚至医疗诊断辅助等。

RL简直是酷炫科技的代名词啊!除了玩游戏,我听说SpaceX的火箭着陆系统也用了类似RL的技术来优化控制策略,想想都觉得Amazing!另外,自动驾驶绝对是RL的未来主战场之一,怎么让车子在复杂路况下做出最安全、最高效的决策,RL大有可为。我个人还很期待它在医疗健康领域的应用,比如个性化治疗方案的推荐,或者手术机器人的智能辅助,感觉能拯救好多生命!

问得好!强化学习听起来高大上,但其实我们生活中已经能感受到它带来的便利了。像一些智能家居系统,它能“学习”你的使用习惯,自动调节温度、灯光,不就是一种简单的RL思想嘛。还有一些外卖平台的配送优化,怎么规划最短路径、最高效地送餐,背后也有RL的影子。未来我觉得它还会渗透到更深的决策层面,比如怎么让AI更好地理解我们的意图,完成更复杂的任务,就像电影里的AI管家一样!

对于AI/ML新手来说,李航老师这本书无疑是个很好的起点。我的建议是,先从第一篇《监督学习》和第二篇《无监督学习》着手,它们是机器学习的基石,学好这些能打下扎实的数学和统计基础。接着再进入《深度学习》,因为深度学习很大程度上可以看作是更复杂的监督/无监督学习模型。最后攻克《强化学习》,这个领域相对独立且对动态决策要求更高。在学习过程中,除了书本理论,强烈建议搭配Python编程和主流框架如PyTorch/TensorFlow的实践,通过做一些小项目来巩固知识。另外,一些大学的公开课(如CS229、CS231N)和在线教程也是很好的补充。

这个问题问得好!我认为一本好的AI教材,要保持经典性,首先要深入讲解那些原理性、普适性强的模型和算法,比如统计学基础、优化理论、泛化能力等核心概念,这些是不会过时的。同时,为了跟上技术前沿,它需要有一个可扩展的架构,能方便地引入新的章节或模块,比如这次加入强化学习。至于教材形式,未来确实可能更多地转向在线平台或交互式电子书,便于实时更新和融合多媒体内容,传统纸质书可能更多地成为查阅经典理论的参考资料。

强化学习最核心的优势在于其序贯决策和自主探索学习能力。与监督学习依赖大量标注数据不同,强化学习通过与环境的交互,从试错中学习最优策略,这使其在反馈延迟、状态空间巨大且奖励稀疏的问题中表现卓越。比如,在没有明确’正确’答案,只有长期目标和即时奖励的环境下,它能找到非显式的最优路径。除了游戏和决策优化,其潜力应用广泛:**机器人控制(如复杂任务规划、运动学习)、自动驾驶(决策制定、路径规划)、金融交易(高频策略、风险管理)、智能制造(生产调度、质量控制)、医疗健康(个性化治疗方案、药物发现的试验优化)**等等,凡是涉及长期动态规划和自主适应的场景,强化学习都能发挥独特作用。

要我说,跟上时代就得多加点’新潮’内容,比如最新的LLM、扩散模型啥的,不然学生会觉得不够用。但经典基础也绝不能丢,那些算法背后的数学思想是万变不离其宗的。感觉现在很多教材都是基础一本,进阶一本,或者分模块更新。至于纸质书嘛,我觉得还是有市场的,毕竟捧着纸书阅读的体验感是电子书给不了的,不过辅助性资源比如代码实现、数据集肯定都是线上化的,这才是大趋势。

关于“李航新书与其他教材对比及实用性”的问题,论特点,李航老师的书一大优势是它的体系性和严谨性。它往往从“模型、策略、算法”三要素出发,对每个方法都提供了深入的数学推导,这对于想理解算法深层原理的读者来说非常宝贵,尤其是对比一些侧重应用的教材。西瓜书(周志华《机器学习》)可能更偏向中国学者的视角和广泛覆盖,而花书(Goodfellow《深度学习》)则更聚焦深度学习。李航老师的新版此次整合了强化学习,使得其在内容完整性上达到了一个新高度,对于构建AI全面知识体系很有帮助。对于实践派而言,虽然书中有很多理论推导,但它提供了习题和详尽的算法描述,是理解算法实现细节的好资源。不过,如果纯粹追求快速上手调包,可能需要配合其他实战性更强的资源。

选啥教材?看目录!有没有Transformer?有没有扩散模型?有没有强化学习?如果这些都没有,那肯定是上个时代的眼泪了。李航这本《机器学习方法(第2版)》就挺与时俱进的,至少把最热的几个点都覆盖了。当然,最快的办法是:找个大佬推荐,或者看他书架上摆的是哪几本。别忘了,书只是敲门砖,动手实践才是王道。

强化学习之所以火,还能有啥原因?因为其他算法玩不转呀!开个玩笑,但也有点道理。你想,让AI自己玩游戏赢过人类,这多炫酷?再说了,大模型再牛,也得靠强化学习训练才能实现真正的‘智能涌现’,甚至学会拒绝人类提的‘奇怪’要求。说白了,它就是AI的‘成长必修课’,能让AI从‘知道’变成‘会做’。

这是一个永恒的矛盾啊!我的策略是‘经典打底,前沿补充’。经典教材如李航老师这本,它的价值在于原理的系统性和数学的严谨性,这些基础知识是‘硬骨头’,无论技术如何演进,其底层逻辑和思想是相对稳定的。掌握了这些,你才能真正理解新论文的创新点在哪里,而不是盲目追风。同时,对于像深度学习、强化学习这类发展迅猛的领域,确实需要通过顶会论文、GitHub开源项目、专业博客和线上课程来获取最新进展。可以每个月或每季度固定时间去刷刷新论文,或者关注一些权威社区的动态。总之,基础是地基,新知是上层建筑,两者缺一不可。

关于强化学习独立成篇的意义,我觉得这绝对是顺应潮流,而且极具前瞻性的举动。传统的监督、无监督学习更多是处理静态数据或已知规则下的预测与模式识别。但现实世界中,很多决策过程是动态的,需要智能体通过与环境的交互来学习最优策略,这正是强化学习的核心价值所在。它的独立成篇不仅体系化了这一复杂领域,更预示着RL将成为未来AI,尤其是在自动驾驶、机器人、复杂系统优化等领域不可或缺的基石。对于学习者来说,这意味着他们能更早、更系统地接触到行动-反馈-学习的闭环思维,这对于培养解决实际问题的能力至关重要。

选教材嘛,我觉得主要看三点:第一,权威性;第二,内容的全面性和更新速度;第三,讲解的易懂程度(对我这种数学不太灵光的尤其重要)。李航老师这本,权威性自不用说,更新速度也跟上了时代,现在还加了RL,基本把主流都涵盖了。至于易懂程度,虽然是理论性很强的书,但既然说了从例子入手,那肯定比纯粹的数学教材好啃。所以,如果你想系统学AI,不是那种看个科普文章就够的,这本绝对值得入手。不过,数学基础还是要有的,别指望它能手把手教你微积分。

我觉得强化学习肯定会更热,尤其在大模型、机器人和自动驾驶这些需要“决策”和“行动”的领域。深度学习擅长“看”和“听”,强化学习就是教AI“做”。当然,它的局限性也很明显,比如训练周期长得吓人,需要海量数据和算力。还有,它很怕“局部最优”,一旦被困住就很难跳出来。但随着算法和算力进步,这些应该都能慢慢解决的。

我觉得这是个平衡。AI领域变化太快是事实,但很多底层的东西,比如概率论、线性代数、优化方法,还有基本的监督/无监督学习范式,是不会变的。新的模型往往是在旧模型基础上改进或组合出来的。这本书如果能把这些‘不变’的基础讲透,再把‘变’的前沿(如LLM的底层逻辑,Diffusion如何从概率角度解释)梳理清晰,那它的价值就很大。它不会让你成为最新的论文专家,但绝对能帮你理解最新论文的基础,给你一个扎实的跳板。至于过时,我觉得任何知识都会有更新,关键是你是否具备快速学习新知识的能力,而经典教材正是培养这种能力的最佳途径之一。

关于‘李航老师这本新书的理论价值’,我觉得理论基础就像内功心法,实践是招式变化。没有深厚的内功,招式再灵活也难成大家。尤其是在模型遇到瓶颈、结果不尽如人意时,如果只知道调参而不理解背后的数学原理和假设,往往会力不从心。了解理论能帮助我们更好地理解模型失效的原因,优化方向,甚至是创造新的解决方案。这本教材作为系统性的理论梳理,能帮助构建一个扎实的知识体系,长期来看对职业发展大有裨益。

对于机器学习初学者,选择哪本书取决于其背景和学习目标。《统计学习方法》偏重统计学与数学推导,能为读者构建扎实的理论基础与严谨的科研思维,适合未来有意深入研究或从事算法开发的学习者。而《机器学习方法(第2版)》则更全面,覆盖了深度学习和强化学习等前沿领域,适合希望系统了解当前AI全貌,或侧重应用实践的读者。建议若时间充裕且追求深度理解,可先《统计学习方法》再补充《机器学习方法》相关章节;若想快速掌握主流技术,则可直接从后者入手,但需准备应对更宽泛的知识面挑战。