Seminar #90

时间: 2026-05-17 14:00-16:00 地点: 清华学堂112 + 腾讯会议 seminar

本周日下午 14:00-16:00,我们将在学堂 112【线下】给大家带来陆伊炀的报告。报告内容与生成模型相关。

  • 报告题目

    Recent Progress in One-Step Generative Modeling

  • 报告摘要

    近年来,Flow Matching 成为生成模型中一种简洁、可扩展的建模框架。其核心思想是学习一个 velocity field,将噪声分布变换到数据分布。尽管当前的 diffusion models 和 flow-based models 已能生成高质量图像,但它们通常仍依赖多步采样,因此生成效率仍是重要瓶颈。如何在 one-step generation 中保持生成质量,是快速生成模型的关键问题。

    本次报告将介绍一条围绕一步生成模型的研究脉络:从 Flow Matching 到 Mean Flow,再到 Improved Mean Flows 和 Pixel Mean Flows。报告将回顾 Flow Matching 的基本形式,解释 Mean Flow 如何通过学习 average velocity 将多步积分转化为一步生成,并介绍 Improved Mean Flows 对预测目标和训练稳定性的重新分析。最后,报告将介绍 Pixel Mean Flows:一个在像素空间中直接建模、无需 latent tokenizer 的一步图像生成框架。通过这一系列工作,本报告希望说明:像素空间建模和快速一步生成可以在一个简单、直接且有效的框架中统一起来,并为高质量、高效率的图像生成提供新的可能。

    为帮助不同背景的同学快速进入主题,报告将尽量以直观方式讲解核心概念,并结合代表性结果讨论一步生成模型在“速度-质量”权衡中的实际意义。欢迎对生成模型、计算机视觉或高效推理感兴趣的同学参加交流,现场也将预留问答时间,讨论相关研究问题与未来方向。

  • 讲者

    陆伊炀是清华大学交叉信息研究院大二本科生,目前在 MIT CSAIL 实习,导师为何恺明教授。他的研究兴趣主要集中在计算机视觉和生成模型,尤其是简单而有效的生成模型。他希望在保持训练目标清晰的同时,实现高质量、高效率的图像生成。

欢迎全体同学参加~

联系我们

Make IIIS Great Again!

清华大学姚班研讨会