《大模型技术30讲》:小白入门到进阶,掌握大模型核心技术

想快速入门大模型?《大模型技术30讲》或许是不错的选择。从基础理论到工程实践,带你系统掌握大模型核心技术。

原文标题:想学大模型又怕卷?这30讲让你掌握核心技术!

原文作者:图灵编辑部

冷月清谈:

上海人工智能实验室发布“以人为本”评测体系,旨在解决传统大模型评测“高分低能”问题,大模型的社会价值日益凸显,但也面临“欺骗性价值对齐”的风险。对于初学者,《大模型技术30讲》梳理了大模型的基础知识,从神经网络到自然语言处理,再到关键技术实践,构建了一套从基础理论到产业落地的完整知识体系。本书以“大模型技术”为核心脉络,通过五大模块、30个专题的立体化架构,系统性地展现了人工智能领域的前沿技术、工程实践与评估体系。章节后的思考题和附录解答,更有助于读者深入理解。理论与实践并重,内容涵盖基础夯实、领域深化、工程落地和评估闭环,共同对大模型相关的前沿知识进行了梳理,还提供了最佳的实践指南。并以BLEU为例,详细说明大模型生成质量的评测步骤和改进方向。

怜星夜思:

1、大模型评测体系从“高分”到“以人为本”,你认为未来大模型评测还应该关注哪些维度?
2、《大模型技术30讲》强调理论与实践的结合,你认为在学习大模型时,理论和实践哪个更重要?
3、周鸿祎提出“以模制模”的安全方案,你认为这种方案的可行性和潜在风险有哪些?

原文内容

最近上海人工智能实验室在 2025 全球开发者先锋大会(GDC)上发布“以人为本”(Human-Centric Eval)评测体系,旨在解决传统大模型评测“高分低能”问题。          

该体系通过模拟真实人类需求(如学术研究、决策支持等),结合人类主观反馈评估模型的实际应用价值。实验显示,DeepSeek-R1、GPT-o3-mini 和 Grok-3 在不同领域各有优势,例如 DeepSeek-R1 在生物和教育领域表现突出。这一评测思路标志着行业从单纯追求技术指标转向关注社会价值。           

可以看出,人们对大模型的运用越来越关注其社会价值了。价值和风险并存,很多学者对于大模型的“欺骗性价值对齐”问题引发担忧,例如:生成误导性内容或泄露隐私数据。360 创始人周鸿祎曾提出“以模制模”方案,构建覆盖基座模型、知识库和智能体的全链路安全体系。        

而对于我们小白或者刚刚开始学习大模型的读者来说,我们现在最重要的就是理清大模型的基础知识,包括大模型相关的基础知识,底层的神经网络以及自然语言处理相关的关键技术实践。
最近刚阅读完塞巴斯蒂安·拉施卡(Sebastian Raschka)的《大模型技术30讲》,这本书的作者是真是超级厉害,记得当年入门机器学习的时候,就是使用他的一本关于机器学习的图书。如今这本书新书中,有关大模型的基本技术和知识点介绍得也很不错,这里想跟大家分享一下。  
内容概览
           
首先我们来看看这本书的内容,它深入探讨了当今机器学习和人工智能领域中最重要的 30 个问题,问题涉及神经网络、计算机视觉和自然语言处理等相关的领域,书籍结构和详细目录如下:         
可以看出本书以“大模型技术”为核心脉络,构建了一套从基础理论到产业落地的完整知识体系。通过五大模块、30 个专题的立体化架构,系统性地展现了人工智能领域的前沿技术、工程实践与评估体系。         
当然了还有一个特点,就是在每一章节的最后部分,作者都留下了一下值得思考的小问题,比如说基于 MINST 数据集如何进行小样本数据集的划分和小样本的学习。章节后的每一个问题都值得我们去研究,作者还在书的附录部分做了非常详细的解答。
理论与实践的螺旋式演进           
既然我看了这本书,我就谈一下个人对这本书的感觉吧:这本书有基础、有深入、有工程也有相应的闭环内容:          
  • 基础夯实(第 1-13 章):嵌入表示与潜空间理论为深度学习奠定数学基础,结合小样本学习、多源模型等章节,解析模型如何从数据中提炼知识;数据优化与模型改进体现的辩证思维让人叹为观止,而 Transformer 架构与生成式 AI 的深度拆解,揭示了当前技术革命的底层逻辑,你现在明白 Attention 是多么伟大了吧!
  • 领域深化(计算机视觉与 NLP):通过图像过拟合优化(第 5-6 章)、自然语言数据增强(第 15 章)等专题,渗透 CV 与 NLP 的核心挑战揭示深入理解的重要性。编码器-解码器架构(第 17 章)和文本生成评测,直击大模型在语言任务中的关键技术瓶颈,毕竟自然语言相关的技术基本上就是大模型的基础啊。
  • 工程落地(第 20-23 章):好的大模型的工程落地肯定也是非常优秀的,这些章节讲述了从无状态训练到推理加速,构建了从实验室到生产环境的技术通路。数据分布偏移的专题分析,为工业级模型部署提供了风险预警框架。 
  • 评估闭环(第 24-30 章):置信区间将统计学严谨性注入 AI 评估,直指当前大模型验证体系的盲区。大模型的评估工作越来越多,让我们重新审视大模型给生产生活带来的优势和弊端,如何平衡两者之间的关系才是科技为民啊。
这些章节的内容技术共同对大模型相关的前沿知识进行了梳理,还提供了最佳的实践指南,可以说不管哪个大模型火,你都绕不开这 30 个核心问题!一个章节一个技术,不管在理论还是实践都非常详细,理论与实践的螺旋式演进。 
章节赏析           
评测大模型已从单一质量评估发展为覆盖技术、伦理、经济价值的综合体系,一般的评测维度有:
               
有生成质量、多样性、安全性等角度的评测,我们来看一下本书中的关于生成质量的评测,该方法是 BLEU:                
           
可以看出,作者非常详细的解释了 BLEU 的计算步骤,通过使用简短的例子非常好地说明了如何对一个大模型的生成质量进行细致的评测,作者也针对 BLEU 方法的缺陷提出了改进方法。
这对于不了解大模型评测方法的我来说,一下子就能掌握多种评测方法以及改进的方向,所以这本书在一定程度上面对层出不穷的新模型、新概念,其提供了稳定的技术锚点。这也是我们对这本书的期待的一面。

作译者简介


作者塞巴斯蒂安·拉施卡(Sebastian Raschka) 极具影响力的人工智能专家,GitHub 项目 LLMs-from-scratch 的 star 数达 42k。 现在大模型独角兽公司 Lightning AI 任资深研究工程师。博士毕业于密歇根州立大学,2018~2023 年威斯康星大学麦迪逊分校助理教授(终身教职),从事深度学习科研和教学。 除本书外,他还写作了畅销书《从零构建大模型》和《Python机器学习》。 

译者叶文滔,中国计算机学会自然语言处理专委会委员。曾任职于字节跳动、蚂蚁集团、星环科技、平安科技等互联网科技企业,负责过多个人工智能、大模型领域研发项目,并拥有多项人工智能相关专利,并著有多篇相关论文。
适合谁读           
  • 掌握大模型已经不是非常陌生的一个话题了,不管是高校学生作为能力提升还是开发者提升办公效率都是非常必要的,那这本书适合谁来读呢?      
  • 计算机科学或工程专业的学生:无论是计算机专业的学生还是软件开发者,这本书都值得一读。学习本书不需要深厚的数学或编程背景,但它能帮助你更好地理解大模型的底层技术实现。
  • 对大模型技术感兴趣的自学者:大模型蕴含的知识就像一个浩瀚的宇宙,如果你对 LLM 或生成式 AI 充满兴趣,并希望深入探索相关领域,这本书将是你的绝佳入门指南。
  • 大模型工程师:如果你正在从事 LLM 或大模型相关工作,这本书不仅能帮助你加深理解,还能让你在实践中温故知新,拓展思维。

扫码进群,找搭子一起交流。群里能畅聊图书内容、技术难题,还能抢先读新书,紧跟领域新进展,更有专属福利。别等了,快进群,咱们抱团学习,一起进步!

图片

“以模制模”听起来像是一种军备竞赛啊!可行性在于,如果能构建一个更强大的模型来识别和防御恶意攻击,那确实能有效提升大模型的安全性。但潜在风险也很明显,攻击者也可以用类似的手段来提升攻击能力,形成一种螺旋上升的对抗。而且,这种方案的成本可能会很高,需要持续投入大量的资源。

我更担心的是“以模制模”可能导致安全风险的集中化。如果安全模型本身出现问题,或者被攻击者攻破,那整个大模型的安全体系就可能崩溃。所以,在采用这种方案的同时,还要考虑多样化的安全策略,避免把所有鸡蛋放在一个篮子里。另外,还要加强对安全模型的监管,确保其自身的安全性。

我觉得理论是地基,实践是高楼。没有扎实的理论基础,实践就成了无根之木,只能照猫画虎,难以创新。但如果只学理论,不去实践,那就成了纸上谈兵,书本上的知识永远无法转化为真正的能力。所以,两者都很重要,必须相辅相成。

同意楼上,可解释性太重要了!现在很多大模型就像黑盒子,虽然结果看起来很好,但我们并不清楚它内部的运作机制。此外,我认为还应该关注模型的公平性,避免对特定群体产生歧视。安全、伦理、公平,这些都是需要持续关注的维度。

文章中提到的新评测体系是个好方向!除了这些,我认为可解释性也很重要。如果一个模型给出的结果我们无法理解其原因,那在关键决策场景下就很难信任它。此外,不同文化背景下的适用性也值得关注,避免模型在特定文化中出现偏差。

感觉有点像杀毒软件的思路,用新的病毒库来查杀旧的病毒。但大模型的安全问题比病毒复杂得多,涉及到数据、算法、应用等多个层面。“以模制模”可能只是一种辅助手段,更重要的是要建立完善的安全体系,包括数据治理、模型安全评估、访问控制等等。不能指望一个模型解决所有问题。

对初学者来说,可能实践更能激发学习兴趣吧。先跑起来,做出点东西,再回头补理论,这样更有动力。当然,如果一开始就对理论很感兴趣,那也可以先啃理论,再搞实践。反正条条大路通罗马,找到适合自己的学习方式最重要。

感觉除了文章里提到的生成质量、多样性和安全性,伦理道德和社会影响也应该被重点关注。毕竟技术发展最终是为了服务人类,如果伦理上站不住脚,或者对社会造成负面影响,那“高分”还有什么意义呢?还得考虑可持续发展,能源消耗也是大头。

我个人更看重理论,因为大模型发展日新月异,各种新的架构、算法层出不穷。如果我们只关注实践,很容易被表面的变化所迷惑。只有掌握了底层的理论,才能抓住本质,更好地应对未来的挑战。当然,实践也很重要,它可以帮助我们检验理论的正确性,加深对理论的理解。