Seminar #22

时间: 2021-10-23 13:00-14:00 地点: 学堂112 + 腾讯会议 seminar

本周六(10月23日)下午13:00,学堂112,黎天鸿、徐海珂同学会分享自己的工作,时长约为一到两小时。

  • 黎天鸿:From Wearables to Invisibles: Human Sensing with Radio Signals

    黎天鸿是姚班2014级(计科40)本科生,现为MIT四年级博士生,导师为Dina Katabi教授,目前的主要研究兴趣为机器学习在无线感知中的应用。传统的人体无线感知大多依靠启发式算法,以定位和测速为主,缺乏精细成像的能力。本次 seminar他将介绍基于无线雷达信号,应用机器学习进行精细成像和处理复杂任务的的困难以及解决方法。除此之外,他还会分享他对科研方向选择和海外博士申请上的一些想法。

  • 徐海珂:Fine-Grained Gap-Dependent Bounds for Tabular MDP

    徐海珂是姚班2018级(计科80)本科生。本次seminar他将介绍他在理论强化学习方面的研究。强化学习算法在实际训练中面临着很高的样本数量,近些年来gap-dependent bound的提出有助于利用特定问题的性质,对算法给出更强的理论保证,从而可能节省大量的数据。然而,Simchowitz and Jamieson (2019)提出,目前所有的强化学习算法都存在着“过度探索”问题,徐海珂同学将介绍他与合作者提出的新算法,他们的算法成功解决了“过度探索”问题,并且算法的regret在某种程度上达到了理论下界。

联系我们

Make IIIS Great Again!

清华大学姚班研讨会