本周六下午 14:00 - 16:00,我们将在学堂 112【线下】给大家带来袁樱同学和张焯扬同学的报告。两场报告分别与机器人学和计算机视觉相关。在两场报告之间,同学们可以吃零食 and/or 自由交流。
报告 1 摘要
袁樱是姚班2020级本科生,研究兴趣是机器人学习,将基于学习的方法用到机器人领域。本次Seminar她将介绍她在UCSD春研期间关于灵巧手操作(Dexterous Manipulation)的工作。早期的灵巧手操作方法基于传统控制理论,但这对于人为建立的动力学模型有很大程度上的依赖。该项工作围绕基于深度无模型强化学习的灵巧手操作展开,使用模仿学习、视触觉的多模态感知等方式,使得智能体习得更真实自然的操作行为,提高操作的准确性和效率。
报告 2 摘要
张焯扬是姚班2020级本科生,研究方向为Efficient Machine Learning和Computer Vision。本次Seminar他将主要介绍他在UC San Diego暑研期间关于3D Generation的工作One-2-3-45++。图像生成模型如Stable Diffusion, Midjourney的成功离不开海量数据的支持,而目前3D数据相比于2D数据体量十分有限,仅使用现有3D数据训练难以获得开放世界中的生成能力。在这项工作中我们介绍了如何利用图像生成模型中学习到的开放世界的先验知识来赋能3D生成。One-2-3-45++可以在一分钟内根据单张图片/文本提示生成高质量几何,高保真纹理的3D Mesh。此工作发表于CVPR2024,相关研究成果转化为3D startup SUDOAI,欢迎大家体验demo: https://www.sudo.ai/。与此同时,他还将简要介绍近期的新工作EfficientViT-SAM,在不损失零样本分割性能的情况下相对于Segment Anything Model加速48.9倍,推动了SAM在数据标注以及实时交互场景中的部署与应用,欢迎大家体验demo: https://evitsam.hanlab.ai/。
欢迎全体同学参加~
【重复一遍时间地点】北京时间本周六 3 月 23 日下午 14:00 - 16:00 学堂 112 点击此处进行时区转换 腾讯会议 626-330-313