Seminar #90

时间: 2026-05-17 14:00-16:00 地点: 清华学堂112 + 腾讯会议 seminar

本周日下午 14:00-16:00，我们将在学堂 112【线下】给大家带来陆伊炀的报告。报告内容与生成模型相关。

报告题目

Recent Progress in One-Step Generative Modeling
报告摘要

近年来，Flow Matching 成为生成模型中一种简洁、可扩展的建模框架。其核心思想是学习一个 velocity field，将噪声分布变换到数据分布。尽管当前的 diffusion models 和 flow-based models 已能生成高质量图像，但它们通常仍依赖多步采样，因此生成效率仍是重要瓶颈。如何在 one-step generation 中保持生成质量，是快速生成模型的关键问题。

本次报告将介绍一条围绕一步生成模型的研究脉络：从 Flow Matching 到 Mean Flow，再到 Improved Mean Flows 和 Pixel Mean Flows。报告将回顾 Flow Matching 的基本形式，解释 Mean Flow 如何通过学习 average velocity 将多步积分转化为一步生成，并介绍 Improved Mean Flows 对预测目标和训练稳定性的重新分析。最后，报告将介绍 Pixel Mean Flows：一个在像素空间中直接建模、无需 latent tokenizer 的一步图像生成框架。通过这一系列工作，本报告希望说明：像素空间建模和快速一步生成可以在一个简单、直接且有效的框架中统一起来，并为高质量、高效率的图像生成提供新的可能。

为帮助不同背景的同学快速进入主题，报告将尽量以直观方式讲解核心概念，并结合代表性结果讨论一步生成模型在“速度-质量”权衡中的实际意义。欢迎对生成模型、计算机视觉或高效推理感兴趣的同学参加交流，现场也将预留问答时间，讨论相关研究问题与未来方向。
讲者

陆伊炀是清华大学交叉信息研究院大二本科生，目前在 MIT CSAIL 实习，导师为何恺明教授。他的研究兴趣主要集中在计算机视觉和生成模型，尤其是简单而有效的生成模型。他希望在保持训练目标清晰的同时，实现高质量、高效率的图像生成。

欢迎全体同学参加~

【重复一遍时间地点】北京时间本周日 5 月 17 日下午 14:00 - 16:00 清华学堂112 点击此处进行时区转换腾讯会议 334-568-933
【查看往期】https://group.iiis.tsinghua.edu.cn/~stu/seminar/

Seminar #90

联系我们

清华大学姚班研讨会