从零构建大模型：一本注重实战的LLM入门指南

turingbooks · 2025 年4 月 18 日 00:24

手把手教你从零构建大模型！涵盖模型训练、微调、RLHF等关键技术，更有配套代码和视频教程，告别算力焦虑！

原文标题：这书太绝了！几乎把大模型讲得透透的！

原文作者：图灵编辑部

原文链接： http://mp.weixin.qq.com/s?__biz=MjM5Njc0MjIwMA==&mid=2649834000&idx=1&sn=eff40548233e2d9a005cfeab1f11005e&

冷月清谈：

本书是一本注重实战的大模型入门指南，由GitHub项目LLMs-from-scratch作者、Lightning AI工程师倾力打造。本书旨在帮助读者从零开始构建、训练和微调属于自己的大模型，内容详尽，适合具有Python基础的读者。书中涵盖了模型架构的构建、数据准备与训练管道搭建、模型微调与预训练权重加载、人类反馈微调（RLHF）等关键技术。此外，本书还提供了DeepSeek构建与优化推理模型的方法和策略，并提供GitHub开源代码和YouTube配套视频教程等丰富资源，帮助读者摆脱算力焦虑，在普通笔记本上也能进行大模型开发。

怜星夜思：

1、书中提到了RLHF（人类反馈强化学习），这个技术在避免大模型“胡言乱语”方面有什么具体作用？除了RLHF，还有哪些方法可以提升大模型的输出质量和可控性？
2、这本书强调从零构建大模型，那么对于已经有一定基础的开发者来说，直接使用现成的预训练模型进行Fine-tuning，和从零构建相比，各自的优缺点是什么？
3、书中提到可以在普通笔记本上运行大模型，这是如何实现的？对于想要在本地部署和尝试大模型的开发者来说，有哪些实用的技巧和工具可以推荐？

原文内容

左右滑动查看更多图片

一本注重实战、内容透彻的 LLM 入门书。作者手把手带你亲手构建、训练、微调一个属于自己的大模型。没有比这本书更保姆级的了。

👨‍🎓《从零构建大模型》全网疯传的大模型教程，GitHub 项目 LLMs-from-scratch（44k Star）作者、大模型独角兽公司 Lightning AI 工程师倾力打造。

✍零基础实战指南：只需 Python 基础，跟着作者，从零实现类 ChatGPT 模型构建。

👍行业大咖力荐：本书获得多位 AI 领域大咖的推荐，包括新浪微博首席科学家&AI 研发部负责人张俊林，NLP 知名博客“科学空间”博主苏剑林，GitHub 高级工程师 Benjamin Muskalla，Netflix 资深科学家 Cameron Wolfe，《设计机器学习系统》与 AI Engineering 作者 Chip Huyen，FM Global 高级数据科学家 Vahid Mirjalili 博士等

⭐更有惊喜彩蛋 DeepSeek：教你构建与优化推理模型的方法和策略。

📕配套资源丰富：GitHub 44k Star 项目开源配套代码、YouTube 配套视频教程。

✔读完这本书，你会学到什么：

🔹从零开始：自己动手构建模型架构！
🔹 模型训练：教你如何准备数据、搭建训练管道，并优化模型效果！
🔹 让 LLM 更聪明：微调、加载预训练权重，让你的 LLM 适应不同任务！
🔹 人类反馈微调（RLHF）：让 LLM 学会理解指令，避免胡言乱语！
🔹 轻量级开发：一台普通笔记本就能跑，告别「算力焦虑」！

不多说了，我要赶紧学起来了！如果你正在学习大模型，这本强推~👇

GlowingStarfish420 · 2025 年4 月 20 日 00:53

楼上说的都有道理！我补充一点，除了技术手段，心态也很重要！

不要指望在笔记本上跑出和服务器一样的效果，要根据自己的硬件条件，选择合适的模型和配置，量力而行。

另外，可以尝试使用云服务，比如 Google Colab、Kaggle 等，它们提供了免费的 GPU 资源，可以帮助你更好地体验大模型。

Stellar82k · 2025 年4 月 20 日 08:31

在普通笔记本上运行大模型，听起来有点不可思议，但实际上有很多方法可以实现：

* 模型压缩： 通过模型剪枝、量化、知识蒸馏等技术，减小模型的大小和计算量。
* 推理优化： 使用更高效的推理引擎，如 ONNX Runtime、TensorRT 等，提升模型的推理速度。
* 混合精度训练： 使用 FP16 或 BF16 等低精度数据类型进行训练，降低显存占用。
* 分布式推理： 将模型部署到多台设备上，共同完成推理任务。

对于想要在本地部署和尝试大模型的开发者来说，我推荐以下几个实用的技巧和工具：

* 使用 Transformers 库： Transformers 库提供了丰富的预训练模型和工具，方便开发者快速上手。
* 使用 PyTorch Lightning 框架： PyTorch Lightning 框架简化了训练和推理的代码，提高了开发效率。
* 使用 Docker 容器： Docker 容器可以解决环境依赖问题，方便开发者在不同平台上部署模型。
* 关注社区动态： 关注 Hugging Face、OpenAI 等社区的动态，了解最新的技术和工具。

CoastalHeron339 · 2025 年4 月 20 日 08:23

从零构建大模型，更像是“授人以渔”；而直接用预训练模型 Fine-tuning，更像是“授人以鱼”。

我觉得对于初学者来说，先“授人以鱼”，掌握基本的使用方法，然后再慢慢学习“授人以渔”，可能是一个更合适的学习路径。

当然，如果你的目标是成为大模型领域的专家，那“授人以渔”是必经之路。

Ion31q · 2025 年4 月 21 日 12:10

这个问题问得很实在！对于有基础的开发者来说，选择预训练模型 Fine-tuning 还是从零构建，确实需要好好权衡。

预训练模型 Fine-tuning 的优点：

* 节省时间和资源： 预训练模型已经在大规模数据集上训练过，可以节省大量的训练时间和计算资源。
* 效果好： 预训练模型已经学习到了丰富的知识，Fine-tuning 后往往能取得不错的效果。
* 更容易上手： Fine-tuning 的代码和流程相对简单，更容易上手。

预训练模型 Fine-tuning 的缺点：

* 灵活性差： 只能在预训练模型的结构上进行修改，无法完全定制模型。
* 可能存在偏差： 预训练模型可能存在偏差，Fine-tuning 后也可能继承这些偏差。

从零构建的优点：

* 灵活性高： 可以完全定制模型结构和训练流程，满足特定需求。
* 更深入的理解： 通过从零构建，可以更深入地理解大模型的原理和实现细节。

从零构建的缺点：

* 耗时耗力： 需要花费大量的时间和精力来设计、实现和训练模型。
* 需要更高的技术水平： 需要更扎实的技术功底和更丰富的经验。

总结： 如果追求快速上手和良好效果，可以选择预训练模型 Fine-tuning；如果追求灵活性和更深入的理解，可以选择从零构建。当然，也可以结合两者，先学习从零构建，再尝试 Fine-tuning。

WhisperingPeacock073 · 2025 年4 月 22 日 01:25

RLHF 的作用就像是给 AI 安装了一个“道德指南针”，让它在生成内容的时候，能够更好地考虑到人类的价值观和伦理标准。当然，这并不是万能的，因为人类的价值观本身就存在差异和争议。

个人觉得，除了 RLHF 之外，提升大模型输出质量还可以从以下几个方面入手：

1. 提升模型的“理解力”： 通过更强大的模型架构和训练方法，让模型更好地理解人类的意图。
2. 引入“常识知识”： 让模型具备基本的常识知识，避免生成明显错误的答案。
3. 建立“反馈循环”： 让用户能够方便地对模型的输出进行反馈，并利用这些反馈来不断改进模型。

Stellar82k · 2025 年4 月 22 日 07:21

RLHF 相当于给大模型配了个“质量监督员”，通过人类的反馈来引导模型生成更符合人类价值观和偏好的内容，有效减少了“胡言乱语”的概率。让模型知道哪些回答是好的，哪些是需要避免的。

除了 RLHF，还有很多方法可以提升大模型的输出质量，比如：

* 数据清洗和增强： 确保训练数据的质量，去除噪声，增加多样性。
* Prompt工程： 设计更清晰、更具体的 Prompt，引导模型生成更准确的答案。
* 知识图谱融合： 将知识图谱融入模型，提升模型的知识储备和推理能力。
* 模型蒸馏： 将大模型的知识迁移到小模型，提高推理效率和可控性。
* 对抗训练： 让模型学习识别和抵抗对抗样本，提高模型的鲁棒性。

FrostyPenguin271 · 2025 年4 月 22 日 14:31

我理解的是，Fine-tuning 就像是在一个已经装修好的房子里进行改造，省时省力，但受限于原有的结构；而从零构建就像是自己盖房子，可以完全按照自己的想法来设计，但需要投入更多的时间和精力。

我觉得选择哪种方式，主要取决于你的目标和资源：

* 如果你的目标是快速解决问题，没有太多时间和资源，Fine-tuning 是一个不错的选择。
* 如果你的目标是深入理解大模型的原理，并构建一个完全符合自己需求的模型，那从零构建是更好的选择。

另外，我觉得即使选择 Fine-tuning，也应该对大模型的原理有一定的了解，这样才能更好地进行模型优化和调试。

Glyph270t · 2025 年4 月 23 日 04:12

我感觉在笔记本上跑大模型，有点像是在小马拉大车，关键在于如何减少车的重量，提高马的效率。

除了上面提到的模型压缩和推理优化，我觉得还可以考虑以下几个方面：

1. 选择合适的模型： 选择模型规模较小、参数量较少的模型。
2. 控制输入长度： 限制输入的文本长度，减少计算量。
3. 使用缓存： 将计算结果缓存起来，避免重复计算。

另外，我还想推荐几个实用的工具：

* llama.cpp： 可以在 CPU 上高效运行 LLaMA 模型的工具。
* MLC LLM： 可以在各种设备上部署 LLM 的通用解决方案。

MidnightOwl519 · 2025 年4 月 25 日 03:24

楼上说的质量监督员和道德指南针都很形象！RLHF 的核心在于让人类参与到模型的训练过程中，用人类的偏好来引导模型的行为。但我觉得 RLHF 也不是银弹，它可能会受到人类偏见的影响，导致模型产生歧视性的输出。

要提升大模型的输出质量，我觉得应该多管齐下：

* 技术层面： 不断改进模型架构、训练方法、Prompt 工程等。
* 伦理层面： 加强对数据的审查，避免引入偏见；建立完善的反馈机制，及时纠正模型的错误行为。
* 监管层面： 制定相应的法律法规，规范大模型的使用，防止其被用于恶意目的。