本周六下午 14:00 - 16:00,我们将在学堂 112【线下】给大家带来计科 01 班江昊哲、计科 03 班陈枫两位同学的报告。两位同学的报告分别与博弈论和机器人学相关。在两位同学报告之间,同学们可以吃零食 and/or 自由交流。
报告 1 摘要
江昊哲是姚班2020级本科生。本次Seminar他将介绍博弈论中的机器学习问题,并具体介绍在阻塞游戏(Congestion Game)中的离线学习问题。阻塞游戏常被用于建模多智能体问题中稀缺资源的分配问题。江昊哲同研究者一起研究了如何仅利用固定数据集而不借助在线交互高效地学习阻塞游戏的纳什均衡(Nash Equilibrium),研究了相应的数据集需求,并指出了在不同反馈模型下需求的不同。该项工作 Offline Congestion Games: How Feedback Type Affects Data Coverage Requirement 发表在 ICLR 2023。
报告 2 摘要
陈枫是姚班2020级本科生,研究方向主要在机器人学。本次seminar他将介绍他在麻省理工学院春研期间关于Scaling up Robotics Task的工作。近些年大模型在视觉、语言和多模态领域有了非常耀眼的突破,包括GPT-4等一系列大模型在科学研究和实际应用领域产生了卓越的突破,但是在机器人学领域,受限于数据、模型等多方面的因素,Robotics skill learning的能力依旧受限。所以在这两篇文章中,我们尝试通过引入非专家参与数据生成和自动生成两个角度进行探索,并且分别完成了一套非专家即可生成专业机器人轨迹数据的系统和自动生成轨迹数据的pipeline。第一项工作接收在Neurips 2023,第二项工作在投于ICLR 2024,同时在CoRL2023的workshop上会有相关工作的进一步讨论,https://generalist-robots.github.io/。
欢迎全体同学参加~
【重复一遍时间地点】北京时间本周六 10 月 14 日下午 14:00 - 16:00 学堂 112 点击此处进行时区转换 腾讯会议 254-732-622