Seminar #38

时间: 2022-11-27 19:30-20:30 地点: C楼 二层 C220+腾讯会议 seminar

本周我们将在【C楼活动室C220】为大家带来计科91班王子轩同学关于机器学习理论的报告!

  • 王子轩

    王子轩同学是2019级(计科91)本科生。2022年春研期间,他在鬲融副教授指导下进行了机器学习理论与非凸优化方向的研究。本次Seminar,他将分享他在春研期间进行的Edge-of-Stability理论解释的工作。Edge of Stability (EoS) [Cohen et al. ICLR 2021] 是发生在神经网络使用梯度下降(gradient descent)进行训练的过程中发生的一种普遍现象:对于一个固定的学习率(step size),神经网络的Hessian矩阵的最大特征值从训练开始会逐渐增大, 随后保持在2/(step size)上下震荡。这虽然违反了传统学习理论中保证梯度下降能减小损失函数的L-smoothness条件,但事实上,损失函数仍然能够呈现非单调下降的趋势。什么样的函数能发生EoS现象?在EoS发生时,如何分析模型的收敛性与训练轨迹?在本次报告中,他将介绍其工作中提出的【能发生EoS现象的一个最简模型】与【其在训练过程中的收敛轨迹】,以及这个简单模型与【现实模型的联系】。

    欢迎全体姚班同学参加!

  • 【重复一遍时间地点】北京时间 11.27 周日 下午 19:30-20:30 C楼 二层 C220 点击此处进行时区转换
  • 【腾讯会议】 686-221-246

联系我们

Make IIIS Great Again!

清华大学姚班研讨会