Seminar #24

时间: 2021-11-20 12:30-13:30 地点: 学堂112 + 腾讯会议 seminar

本周六(11月20日)中午12:30,学堂112,姚顺雨、罗雨屏学长会分享自己的工作,时长约为一到两小时。

  • 姚顺雨:基于语料迁移的涌现——自然语言连接(Linking Emergent and Natural Languages via Corpus Transfer)

    姚顺雨是姚班2015级(计科50)本科生,现在是普林斯顿大学的博士生,导师为Prof. Karthik Narasimhan。本次 seminar他将会介绍他在自然语言处理方面的工作。今天的自然语言处理(NLP)主要基于大量静态文本数据(如Wikipedia)上的训练,但是人类并非从这样复杂、被动的语料中习得(acquire)语言,而是基于对环境的感知(perceptual grounding)和他人(父母)的交互(communication)逐渐产生愈发复杂的语言能力。姚顺雨学长将介绍emergent communication,一类试图使机器涌现语言能力的研究,其进展和局限,以及他们最新的工作如何试图基于自然语言更好地利用、分析、衡量机器涌现语言。

  • 罗雨屏:Learning Barrier Certificates: Towards Safe Reinforcement Learning with Zero Training-time Violations

    罗雨屏是姚班2013级(计科30)本科生,现在是普林斯顿大学的博士生,导师为 Prof. Sanjeev Arora。本次 seminar 他将会介绍他在安全强化学习方面的工作。安全性一直是强化学习算法具体应用的一个痛点。给定一个不安全状态的集合,如何才能做到不去访问那些现在暂时安全,但是未来一定不安全的状态呢?这次罗雨屏学长将介绍他和合作者提出的新算法,可以在不用先验知识的情况下在一些状态空间连续的任务上做到训练时不访问任何不安全的状态。

联系我们

Make IIIS Great Again!

清华大学姚班研讨会