何恺明 MIT 深度生成模型课程火热开讲,PPT 已公开!
机器之心报道
今年 2 月,何恺明正式开启了他在 MIT 的副教授生涯,并于 3 月 7 日完成了人生中的第一堂课。近日,我们发现他已于 9 月初开设了第二门课程——《深度生成模型》(6.S978: Deep Generative Models),并已陆续发布了前五周的讲座 PPT。
这门课程被热心网友推荐给准备教授计算机视觉与深度学习的人作为参考,并感慨何恺明是残差网络(ResNet)的发明者,非常厉害。不过,想要学习这门课程,需要具备较为扎实的学习背景,课程难度较高。
课程概览
据介绍,这是一门研讨会课程,目标受众是正在进行(或计划进行)深度生成模型研究的研究生。课程内容涵盖了深度生成模型的概念、原理和应用,主要应用于计算机视觉(如图像、视频、几何)和相关领域(如机器人技术、生物学、材料科学等)。
课程侧重于不同问题和学科之间共享的通用范式和方法,核心主题包括变分自编码器、自回归模型、生成对抗网络、扩散模型及其应用,覆盖了基础框架和最新研究前沿。
课程安排
课程共分为 15 周完成,除了第 1 周和最后一周,每周各有两节课(分别为阅读课和讲座)。目前,课程已经进行到了第 10 周,主题分别如下:
- Week 1:深度生成模型简介
- Week 2:建模图像先验、变分自编码器(VAE)
- Week3:归一化流、自回归(AR)模型
- Week 4:自回归(AR)模型、AR 和分词器(tokenizer)
- Week 5:AR 和扩散、生成对抗网络(GAN)
- Week 6:扩散领域的 GAN
- Week 7:基于能量的模型、分数匹配和扩散模型
- Week 8:扩散模型、去噪后的扩散
- Week 9:离散扩散、流匹配 1
- Week 10:流匹配2、CMU 助理教授朱俊彦讲座《确保生成模型的数据所有权》(Ensuring Data Ownership in Generative Models)
课程要求
这门课程对学生的要求非常高,包括:
- 参加所有讲座和研讨会
- 每两周完成一次习题集
- 在研讨会上发表一篇论文:20 分钟演示 + 10 分钟讨论和 QA
- 完成最终项目和项目演示
课程资源
目前,课程前 5 期讲座的 PPT 已经放出来了,地址如下:
- https://mit-6s978.github.io/assets/pdfs/lec1_intro.pdf
- https://mit-6s978.github.io/assets/pdfs/lec2_vae.pdf
- https://mit-6s978.github.io/assets/pdfs/lec3_ar.pdf
- https://mit-6s978.github.io/assets/pdfs/lec4_gan.pdf
- https://mit-6s978.github.io/assets/pdfs/lec5_diffusion.pdf
课程展望
接下来的主题将包括:视频、3D、几何、机器人、材料科学、蛋白质和生物学等领域的应用。此外还有 OpenAI 战略探索团队负责人宋飏的讲座《一致性模型》(Consistency Models)。
课程地址:
总结
何恺明的这门《深度生成模型》课程无疑是深度学习领域的一场盛宴,对于想要深入学习深度生成模型的学者和研究人员来说,这是一个难得的机会。通过学习这门课程,我们可以深入了解深度生成模型的理论基础、最新研究成果和应用场景,并有机会与何恺明和其他顶尖学者进行交流学习。
附:
- 何恺明:计算机视觉领域知名学者,Facebook 人工智能研究院研究员,曾获得 2016 年 CVPR 最佳论文奖,2017 年 ICCV 最佳论文奖,2018 年 PAMI 最佳论文奖。
- ResNet:残差网络,由何恺明等人提出,在图像识别领域取得了突破性进展,被广泛应用于各种计算机视觉任务。
相关链接:
免责声明:
本文内容仅供参考,不构成任何投资建议。
Views: 0