本周日(6月6日)下午1:00,学堂112,王若松、卢睿同学会分享自己的工作,时长约为一到两小时。
王若松:Recent Progress on the Theoretical Understanding of Reinforcement Learning
王若松是姚班2013级(计科30)毕业生,现为CMU四年级博士生,导师为CMU机器学习系的Ruslan Salakhutdinov教授。目前研究方向为机器学习理论,特别是强化学习理论。本次seminar他将介绍近期强化学习理论领域的最新进展,还会分享他对机器学习方向博士申请和职业发展上的一些理解。
卢睿:On the Power of Multitask Representation Learning in Linear MDP
卢睿是姚班2016级(计科60)本科生,目前的主要研究兴趣为强化学习和神经网络架构设计分析。强化学习往往需要大量的样本,使用多任务的表征学习来减少训练所需的样本是实践中已经非常常用的方法,但理论研究还比较欠缺。本次seminar卢睿同学将介绍自己近期的工作。通过分析linear MDP的理论模型,他们证明了使用多任务学习得到的表征可以极大地减少样本复杂度,并在一个小例子中验证了该结果。