Andrej Karpathy 重磅推新课:从头搭建 ChatGPT 式 AI,直呼良心

原文标题:墙裂推荐!Karpathy大模型培训课LLM101n上线了,非常基础

原文作者:机器之心

冷月清谈:

大家好,今天给大家推荐一个良心课程:**《LLM101n:从头开始构建类似 ChatGPT 的模型》**。它的作者是 Andrej Karpathy,一位在人工智能领域颇具影响力的大佬。

这门课程的特点是:

  • 从语言建模、机器学习的基础知识开始,循序渐进地讲解;
  • 涵盖从多模态、RLHF 到模型部署的各个方面;
  • 采用 Python、C 和 CUDA 等语言从头开始构建项目,不需要太多的计算机科学基础。

课程大纲非常详实,包括了 17 章内容,涵盖了 AI、LLM 和深度学习等相关知识。如果你想深入了解 AI 领域,特别是大语言模型,那么这门课程绝对不容错过。课程地址:https://github.com/karpathy/LLM101n 。赶快点击链接,开启你的学习之旅吧!




怜星夜思:


1、你觉得《LLM101n》课程中有没有什么需要改进的地方?




原文内容



机器之心报道

机器之心编辑部

让我们训练一个 Storyteller。


今天外网又被 Andrej Karpathy 这一良心课程刷屏了!


项目是 11 小时前被 Karpathy 上传到 Github 的,目的是要构建一个能够创作、提炼和阐释小故事的大语言模型。如今已经被许多网友转发推荐。



项目地址:https://github.com/karpathy/LLM101n


有网友表示,这是 karpathy 老师的新冒险。它将带您从语言建模、机器学习的基础知识开始学习,然后到多模态、RLHF、模型部署。



也有网友称:看起来 karpathy 正在做一门完整的、类似 cs231n 的课程, 《LLM101n》将讲授如何从头开始构建类似 ChatGPT 的模型,非常雄心勃勃!



以下是该课程的项目简介:


在本课程中,我们将构建一个 Storyteller AI 大型语言模型 (LLM),旨在使用 AI 创建、完善和说明小故事,涵盖从基础到类似于 ChatGPT 的可运行 Web 应用程序,并使用 Python、C 和 CUDA 从头开始构建项目,并且只需要最少的计算机科学前提条件。这门课程将使学生对 AI、LLM 和深度学习有相对深入的了解。


教学大纲如下:


  • 第 01 章 Bigram 语言模型(语言建模)

  • 第 02 章 Micrograd(机器学习、反向传播)

  • 第 03 章 N-gram 模型(多层感知器、matmul、gelu)

  • 第 04 章 Attention(attention、softmax、位置编码器)

  • 第 05 章 Transformer(transformer、residue、layernorm、GPT-2)

  • 第 06 章 Tokenization(minBPE、字节对编码)

  • 第 07 章 优化(初始化、优化、AdamW)

  • 第 08 章 极品飞车 I:设备(设备,CPU,GPU,...)

  • 第 09 章 极品飞车 II:精度(混合精度训练,fp16,bf16,fp8,......)

  • 第 10 章 极品飞车 III:分布式(分布式优化、DDP、ZeRO)

  • 第 11 章 数据集(数据集、数据加载、合成数据生成)

  • 第 12 章 推理 I:kv-cache(kv-cache)

  • 第 13 章 推理 II:量化(quantization

  • 第 14 章 微调 I:SFT(监督微调 SFT、PEFT、LoRA、聊天(chat))

  • 第 15 章 微调 II:RL(强化学习,RLHF,PPO,DPO)

  • 第 16 章 部署(API、Web 应用程序)

  • 第 17 章 多模态(VQVAE、扩散 transformer)


那还等什么,学起来吧!



© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

课程中可以加入一些与其他人工智能社区的互动环节,比如讨论区或论坛,这样学习者可以相互交流学习心得和解决问题。

课程中的一些数学公式和技术细节可能会对初学者来说比较难以理解。建议加入一些更通俗易懂的解释。

我认为课程应该提供更多的代码示例和练习题,让学习者可以亲自动手实践,加深理解。

建议在课程中穿插一些挑战性的项目,让学习者可以在项目实践中巩固所学知识并培养解决实际问题的技能。

我觉得课程可以加入一些实际案例,这样可以帮助学习者更好地理解所学知识如何在实际应用中发挥作用。