T4:强化学习简介


讲者:秦涛(微软亚洲研究院)


摘要:近年来,强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功,成为人工智能研究的热点。 讲者将在报告中对强化学习做一个简要介绍,该报告分为3个部分:
1. 强化学习基础,包括马氏决策过程、Bellman方程、规划、最优控制、蒙特卡洛采样以及TD算法。
2. 强化学习新算法,包括基于值函数的算法,基于策略函数的算法,以及基于两者的混合算法。
3. 强化学习所面临的挑战,如鲁棒性、样本效率等。


个人简介: 秦涛 博士,微软亚洲研究院资深研究员/经理,中国科学技术大学博士生导师。主要研究领域包括机器学习和人工智能(深度学习和强化学习的算法设计、理论分析及在实际问题中的应用),互联网搜索与计算广告,博弈论和多智能体系统,在国际会议和期刊上发表学术论文100余篇。曾任SIGIR、ACML、AAMAS领域主席,担任多个国际学术大会程序委员会成员,包括ICML、NIPS、KDD、IJCAI、AAAI、WSDM、EC、SIGIR、AAMAS、WINE,曾任多个国际学术研讨会联合主席。获得《北京青年》2017年度年度“工匠精神·青年榜样”奖。