大模型入门不再难:精选优质课程助你快速上手

还在苦恼大模型入门?这有一份课程清单,帮你快速掌握Transformer、模型训练等核心技术,更有配套图书和社群,扫清学习障碍!

原文标题:大模型学不会,建议都去蹭这几位老师的课!

原文作者:图灵编辑部

冷月清谈:

文章汇总了一系列优质的大模型学习课程,旨在帮助读者克服大模型学习中的难点。课程涵盖了Transformer架构、模型训练、ChatGPT等主题,适合不同水平的学习者。推荐课程包括《大模型原理速成课》、《从零构建大模型》、《深入理解类ChatGPT的LLM技术》、《构建LLM大语言模型》、《3小时超快速入门Python》、《生成式AI时代下的机器学习》以及Chip Huyen的AI工程分享。此外,文章还推荐了相关图书和图灵「大模型技术共学营」,为学习者提供更全面的学习资源。

怜星夜思:

1、这么多课程,感觉都很有用,但时间有限,大家觉得对于完全的新手,优先级最高的课程是哪个?理由是什么?
2、文章里提到了好几本书,大家有读过其中哪些吗?感觉怎么样?有没有其他的相关书籍推荐?
3、大家觉得参加这种“大模型技术共学营”有用吗?会不会只是收割韭菜?

原文内容

刷到这条的你,可能正卡在大模型学习的某个难点上:Transformer 看过但没真正搞懂,注意力机制总觉得玄乎;想动手训练模型,却不知道该从哪一步开始;论文越读越多,实操反而更没底。

别担心,小图已经帮你把网上最值得看的大模型学习课程全整理好了。不仅讲得清楚,动画、图示、代码全都有,最关键的是:看得懂,还能跟得上!

不管你是刚入门,还是想系统啃点技术硬骨头,这些课程都能对上你的节奏:
有 Stanford 大牛、有 GitHub 红人、有 Ng 教授团队,还有 Chip Huyen 本人现身讲解。

下面这份课程清单,建议你收藏好,一步步学起来👇 !


课程名称:《大模型原理速成课》
课程简介这个视频由袋鼠书的作者Jay Alammar和‪Maarten Grootendorst ‬联合 Andrew Ng 创作,是一门为开发者量身打造的免费速成课,用约 90 分钟带你全面掌握 Transformer 架构的核心原理。

你将学习现代大语言模型(LLM)的基本构造,包括分词器、词嵌入、注意力机制、Transformer Block、语言建模头,以及 Mixture-of-Experts 等前沿技术。课程配有精美动画、清晰图示与实用代码示例,帮助你快速建立从理论到实操的直觉。

适合希望读懂 LLM 论文、深入理解模型原理、开发 AI 应用的技术学习者。

观看地址

https://www.youtube.com/watch?v=k1ILy23t89E

图书搭配《图解大模型》


课程名称:《从零构建大模型》
课程简介全网最火爆的大模型教程,由 Github 44k Star 项目 LLMs from scratch 作者 Sebastian Raschka 创作。全视频概述了大模型开发的三个阶段:搭建、训练和微调,重点通过解析每个步骤的运作方式来解释大模型的工作原理。对于刚开始学习大模型的人来说这个视频十分有价值,作者语言清晰易懂,可以帮助大家理顺大模型的底层原理以及如何利用好大模型。

观看地址

https://www.youtube.com/watch?v=yAcWnfsZhzo&t=38s

图书搭配《从零构建大模型》《大模型技术30讲》


课程名称《深入理解类 ChatGPT 的 LLM 技术》
课程简介:大佬卡帕西的大模型教程,面向所有开发者,旨在深入讲解,聚焦于支撑 ChatGPT 等产品的大语言模型(LLM)技术。内容涵盖模型开发的完整训练流程,同时也介绍了如何构建关于模型“心理机制”的理解方式,并讲解如何在实际应用中最大化利用这些模型的能力。

观看地址

https://www.youtube.com/watch?v=7xTGNNLPyMI

图书搭配:《大模型应用开发极简入门(第2版)》


课程名称:《构建LLM大语言模型》
课程简介斯坦福 cs229 机器学习最新入门讲座。本课程助你了解如何一步步构建一个类 ChatGPT 的大语言模型!讲解内容涵盖预训练(语言建模)与后训练(SFT/RLHF),包括数据收集、算法选择、模型评估等关键环节。

主讲人是斯坦福博士生 Yann Dubois,他是 Alpaca 项目的核心成员之一,专注于在资源有限的条件下高效训练语言模型。

观看地址

https://www.youtube.com/watch?v=9vM4p9NN0Ts


课程名称:《3小时超快速入门Python
课程简介:对于没有 Python 基础但是还想入门大模型的同学,这门课程专为你准备,作者林粒粒将 Python 教程做成了动画片,教学通俗易懂。同时她也是《Python编程从入门到实践(第3版)》官方教学视频的制作者。视频风格有趣简洁,受到超多读者喜爱。

观看地址

3小时超快速入门Python

https://www.bilibili.com/video/BV1Jgf6YvE8e?spm_id_from=333.788
《Python编程从入门到实践(第3版)》官方教学视频

https://www.bilibili.com/video/BV1Sd4y1a7Us?spm_id_from=333.788

图书搭配:

课程名称《生成式AI时代下的机器学习》
课程简介一堂课搞懂生成式人工智慧的技术突破与未来发展!

观看地址

https://www.youtube.com/watch?v=QLiKmca4kzI

图书搭配:《深度学习详解》

课程名称:《 Chip Huyen 讲 AI 工程》
课程简介计算机科学家、AI Engineering 的作者 Chip Huyen 视频分享。Chip 曾在 Netflix 担任研究员,是 NVIDIA 的核心开发人员之一(参与构建生成式 AI 框架 NeMo),还是 Claypot AI 的联合创始人。同时,她还曾在斯坦福大学教授机器课程。
在这次对话中,作者深入探讨了不断演进的 AI 工程领域,并围绕 Chip 的新书分享了许多关键见解,包括:
  • AI 工程与机器学习工程的本质区别
  • 为什么微调(fine-tuning)通常不是你需要采用的策略
  • 面向客服问题的一系列解决方案——有些甚至不需要用到 AI
  • 大语言模型评估(LLM eval)面临的挑战
  • 项目式学习为何有价值——以及为何配合结构化学习效果更佳
  • AI 在教育与娱乐领域令人兴奋的潜在应用场景
  • 更多精彩内容......

观看地址

https://www.youtube.com/watch?v=98o_L3jlixw

图书搭配:《AI工程》【待出版】


当然,学习大模型的路并不总是笔直顺畅的。当你遇到瓶颈,觉得一个人入门大模型太困难,不妨找点靠谱的学习搭子。欢迎加入图灵 「大模型技术共学营」!

和一群热爱学习的小伙伴一起读书、听直播、深度交流:

5 本精选图书全国包邮送到家;
8 场左右的主题直播拆解最前沿的大模型知识;
365 天不失联的高质量共读社群陪你进阶!

一整年的大模型共学,原价 2529 元,早鸟价仅需 299 元!感兴趣的小伙伴火速加入呀~

另外有个好消息,最新一期的大模型技术共学营直播时间已经敲定,我们邀请了《大模型技术30讲》的译者叶文滔老师做客图灵直播间,欢迎大家动动手指预约吧!

最后,也请小伙伴评论区安利你觉得还不错的大模型课程吧~

我读过《图解大模型》,强烈推荐!里面用大量的图示和动画来解释复杂的Transformer结构,非常直观易懂。对于我这种数学不太好的小白来说简直是救星。另外,最近也在看《大模型技术30讲》,内容比较系统,适合进阶学习。

这种共学营,就看你能否坚持,有没有收获就看个人了。如果能认真完成布置的任务,积极参与讨论,肯定是有帮助的。但如果只是想花钱买个心安,大概率是浪费钱。关键还是看自己。

我觉得挺有用的,有人带你一起学习,可以避免走弯路。并且社群里的氛围也很重要,可以和大家一起交流心得,互相鼓励。当然,前提是这个共学营的质量要高,老师要靠谱。

如果对AI工程感兴趣,可以关注一下Chip Huyen的《AI工程》(虽然还没出版)。她对AI工程的理解非常深刻,有很多独到的见解。她的博客我也经常看,受益匪浅。

我觉得对于完全的新手来说,《3小时超快速入门Python》优先级最高。大模型再厉害也得用代码跑起来,没Python基础就是空中楼阁,其他课程再好也看不懂。有了Python基础,再去看《大模型原理速成课》会更容易理解。

如果是零基础,我建议直接上《大模型原理速成课》,配合《图解大模型》这本书。先对大模型有个整体认知,知道它是什么,能做什么,然后再去补Python。这样学习更有动力,不容易半途而废。反正我是这么过来的,痛苦但是快乐!

《Python编程从入门到实践》是我的Python入门教材,确实很经典。书中的例子都很实用,跟着做一遍就能掌握基本的语法。如果想深入了解大模型,可以看看李沐老师的《动手学深度学习》,讲得很透彻。

我参加过类似的共学营,感觉最大的收获是认识了一群志同道合的朋友。大家一起学习,一起解决问题,这种感觉非常好。至于知识方面,当然也能学到不少,但更重要的是培养了学习的习惯和方法。

同意楼上!Python是基础中的基础,尤其是对于非科班出身的朋友。可以先快速过一遍Python语法,然后直接上手《从零构建大模型》,在实践中学习效率更高。而且《从零构建大模型》作者的讲解风格也很适合初学者。