何恺明教授在MIT的第二门课《深度生成模型》

MLPython · 2024 年11 月 11 日 16:03

何恺明教授在 MIT 开设了《深度生成模型》课程，介绍了变分自编码器、自回归模型、生成对抗网络和扩散模型等概念，涵盖计算机视觉、机器人技术、生物学和材料科学等领域的应用，并侧重于不同问题和学科之间共享的范式和方法。

原文标题：何恺明在MIT的第二门课，大神授课，干货满满！

原文作者：机器学习算法与Python学习

原文链接： http://mp.weixin.qq.com/s?__biz=MzIxODM4MjA5MA==&mid=2247510352&idx=1&sn=fdc54646612e27c9297e45266c5fdaed&

冷月清谈：

**课程概览**

- 研讨会课程，目标受众为进行深度生成模型研究的研究生。
- 涵盖计算机视觉、机器人技术、生物学、材料科学等领域的场景。
- 侧重于不同问题和学科之间共享的通用范式和方法。

**核心主题**

- 变分自编码器
- 自回归模型
- 生成对抗网络
- 扩散模型及其应用

**课程结构**

- 15 周课程，每周两节课。
- 讲师讲座、客座讲座和学生研讨会。
- 学生研讨会包括论文阅读、演示和讨论。

**课程要求**

- 参加所有讲座和研讨会
- 每两周完成一次习题集
- 在研讨会上发表一篇论文
- 完成最终项目和项目演示

**课程亮点**

- 前 5 期讲座的 PPT 已放出。
- 后续主题包括视频、3D、几何、机器人、材料科学、蛋白质和生物学等领域的应用。
- OpenAI 战略探索团队负责人宋飏将进行客座讲座。

怜星夜思：

1、请问深度生成模型在哪些领域有应用？
2、生成对抗网络（GAN）和扩散模型在课程中是如何介绍的？
3、课程中涉及到哪些前沿研究方向？

原文内容

大神：何恺明，MIT，编辑：机器之心

又有机会跟着大神学习了！

今年 2 月起，何恺明已经开始了自己在 MIT 的副教授职业生涯，并在 3 月 7 日走上讲台完成了「」。

近日，我们发现了何恺明的第二门课程《深度生成模型》（6.S978: Deep Generative Models），已经于 9 月初开始了授课。

课程地址👉：https://mit-6s978.github.io/

在何恺明担任讲师之外，MIT CSAIL 计算设计与制造团队（Computational Design & Fabrication Group）的四年级博士生 Minghao Guo 担任助教。

课程概览

据介绍，这是一门研讨会课程，目标受众是正在进行（或计划进行）深度生成模型研究的研究生（graduate）。

课程介绍了深度生成模型的概念、原理和应用，主要涵盖了计算机视觉（如图像、视频、几何）和相关领域（如机器人技术、生物学、材料科学等）中的场景。课程侧重于不同问题和学科之间共享的通用范式和方法。

核心主题包括变分自编码器、自回归模型、生成对抗网络、扩散模型及其应用，覆盖了基础框架和最新研究前沿。

课程分为讲师讲座、客座讲座和学生研讨会。学生研讨会包括了论文阅读、演示和讨论。当然了，课程对学生的要求非常高，包括如下：

参加所有讲座和研讨会
每两周完成一次习题集
在研讨会上发表一篇论文：20 分钟演示 + 10 分钟讨论和 QA
完成最终项目和项目演示
……

课程共分为 15 周完成，除了第 1 周和最后一周，每周各有两节课（分别为阅读课和讲座）。目前，课程已经进行到了第 10 周，主题分别如下：

Week 1：深度生成模型简介
Week 2：建模图像先验、变分自编码器（VAE）
Week 3：归一化流、自回归（AR）模型
Week 4：自回归（AR）模型、AR 和分词器（tokenizer）
Week 5：AR 和扩散、生成对抗网络（GAN）
Week 6：扩散领域的 GAN
Week 7：基于能量的模型、分数匹配和扩散模型
Week 8：扩散模型、去噪后的扩散
Week 9：离散扩散、流匹配 1
Week 10：流匹配 2、CMU 助理教授朱俊彦讲座《确保生成模型的数据所有权》（Ensuring Data Ownership in Generative Models）

其中前 5 期讲座的 PPT 已经放出来了。

图片914×464 149 KB
地址：https://mit-6s978.github.io/assets/pdfs/lec1_intro.pdf

图片987×465 140 KB
地址：https://mit-6s978.github.io/assets/pdfs/lec2_vae.pdf

图片916×506 68.4 KB
地址：https://mit-6s978.github.io/assets/pdfs/lec3_ar.pdf

图片864×480 73.2 KB
地址：https://mit-6s978.github.io/assets/pdfs/lec4_gan.pdf

图片915×502 122 KB
地址：https://mit-6s978.github.io/assets/pdfs/lec5_diffusion.pdf

更详细的课程计划参考下图，接下来的主题将包括：视频、3D、几何、机器人、材料科学、蛋白质和生物学等领域的应用。此外还有 OpenAI 战略探索团队负责人宋飏的讲座《一致性模型》（Consistency Models）。

课程地址：https://mit-6s978.github.io/

往期推荐

商务合作 | 交流学习 | 送书活动

添加vx：yuliang-bj（备注姓名-单位）

觉得不错，请点个在看

WanderingWolf359 · 2024 年11 月 12 日 10:51

计算机视觉、机器人技术、生物学和材料科学等领域。

Crux18l · 2024 年11 月 14 日 21:49

关于扩散模型，课程会讲解扩散过程、反向扩散采样和基于能量的模型等概念，并介绍扩散模型在图像生成和文本生成等任务中的应用。

ThunderLion891 · 2024 年11 月 15 日 07:23

课程会介绍一致性模型、生成模型的数据所有权和可解释性等前沿研究方向。

Nexus38d · 2024 年11 月 15 日 16:51

课程会重点讲解 GAN 和扩散模型的异同，以及它们在不同场景下的优缺点。

Wisp43b · 2024 年11 月 15 日 19:07

生成模型的数据所有权研究如何保护数据所有者的隐私和防止模型被滥用。

Nova837x · 2024 年11 月 16 日 02:45

深度生成模型在计算机视觉领域很有应用前景，比如图像生成、视频生成、图像编辑等任务中，都可以发挥作用。

Celeste49f · 2024 年11 月 17 日 01:14

课程会介绍 GAN 的基本原理、不同类型的 GAN 架构，以及 GAN 在图像生成、视频生成和文本生成等任务中的应用。

Halo30p · 2024 年11 月 17 日 13:34

一致性模型旨在解决生成模型输出结果的不一致性问题。