本周日下午 14:00-16:00,我们将在学堂 112【线下】给大家带来陆伊炀的报告。报告内容与生成模型相关。
报告题目
Recent Progress in One-Step Generative Modeling
报告摘要
近年来,Flow Matching 成为生成模型中一种简洁、可扩展的建模框架。其核心思想是学习一个 velocity field,将噪声分布变换到数据分布。尽管当前的 diffusion models 和 flow-based models 已能生成高质量图像,但它们通常仍依赖多步采样,因此生成效率仍是重要瓶颈。如何在 one-step generation 中保持生成质量,是快速生成模型的关键问题。
本次报告将介绍一条围绕一步生成模型的研究脉络:从 Flow Matching 到 Mean Flow,再到 Improved Mean Flows 和 Pixel Mean Flows。报告将回顾 Flow Matching 的基本形式,解释 Mean Flow 如何通过学习 average velocity 将多步积分转化为一步生成,并介绍 Improved Mean Flows 对预测目标和训练稳定性的重新分析。最后,报告将介绍 Pixel Mean Flows:一个在像素空间中直接建模、无需 latent tokenizer 的一步图像生成框架。通过这一系列工作,本报告希望说明:像素空间建模和快速一步生成可以在一个简单、直接且有效的框架中统一起来,并为高质量、高效率的图像生成提供新的可能。
为帮助不同背景的同学快速进入主题,报告将尽量以直观方式讲解核心概念,并结合代表性结果讨论一步生成模型在“速度-质量”权衡中的实际意义。欢迎对生成模型、计算机视觉或高效推理感兴趣的同学参加交流,现场也将预留问答时间,讨论相关研究问题与未来方向。
讲者
陆伊炀是清华大学交叉信息研究院大二本科生,目前在 MIT CSAIL 实习,导师为何恺明教授。他的研究兴趣主要集中在计算机视觉和生成模型,尤其是简单而有效的生成模型。他希望在保持训练目标清晰的同时,实现高质量、高效率的图像生成。
欢迎全体同学参加~
【重复一遍时间地点】北京时间本周日 5 月 17 日下午 14:00 - 16:00 清华学堂112 点击此处进行时区转换 腾讯会议 334-568-933