T1B: 深度学习与机器翻译
内容简介:近两年,深度学习在机器翻译领域的应用呈现突飞猛进之势,无论是将深度学习应用于统计机器翻译,还是端到端的神经机器翻译新范式,都显示出巨大的优势和潜力。在研究方面,新的深度学习模型不断涌现;在国际机器翻译评测中,基于深度学习的机器翻译已成为普遍采用的方法,并已在若干语言对(例如英语-法语、英语-德语、汉语-英语等)上证明其显著优于统计机器翻译;在产业界,谷歌、微软、百度等公司已逐渐采用深度学习方法构建在线翻译系统。在这样的趋势下,我们应该深入了解深度学习与机器翻译的关系,以及如何构建一个高效的基于深度学习的机器翻译系统。本次讲习班主要从基于深度学习的统计机器翻译与神经机器翻译两个方面做详细介绍:(1)基于深度学习的统计机器翻译。从语言模型的角度引入神经网络,然后介绍深度学习在统计机器翻译各个子模型(语言模型、翻译模型和调序模型等)中的应用。(2)神经机器翻译。编码器-解码器架构、注意力机制、最新进展(架构、训练、语言、多模态等)、未来展望。
讲者: 刘洋、张家俊
刘洋博士,清华大学计算机科学与技术系副研究员。研究方向是自然语言处理,在自然语言处理和人工智能领域重要国际刊物Computational Linguistics和会议ACL、IJCAI、AAAI、EMNLP和COLING上发表40余篇论文,获COLING/ACL 2006亚洲自然语言处理优秀论文奖。承担10余项国家自然科学基金、国家863计划、国家科技支撑计划和国际合作项目,2015年获国家自然科学基金优秀青年项目资助。获得2015年国家科技进步二等奖、2014年中国电子学会科学技术奖科技进步类一等奖、2009年北京市科学技术奖二等奖和2014年中国中文信息学会钱伟长中文信息处理科学技术奖汉王青年创新奖一等奖等多项科技奖励。担任国际计算语言学学会汉语特别兴趣小组Information Officer、中国中文信息学会青年工作委员会主任和计算语言学专业委员会秘书长、ACL 2014讲习班联合主席和ACL 2015本地组织联合主席。长期担任自然语言处理和人工智能领域重要国际刊物和会议的审稿人。
个人主页:http://nlp.csai.tsinghua.edu.cn/~ly/
张家俊博士,中科院自动化所模式识别国家重点实验室副研究员。研究方向为自然语言处理、机器翻译、跨语言文本信息处理、深度学习等。现任人工智能学会青年工作委员会常务委员、中文信息学会青年工作委员会委员。在国际著名期刊IEEE/ACM TASLP、IEEE Intelligent Systems、ACM TALLIP与国际重要会议AAAI、IJCAI、ACL、EMNLP、COLING等发表学术论文20余篇。2009年获亚太会议PACLIC最佳论文奖,2012年获NLPCC最佳论文奖,2014年获CWMT最佳论文奖。2014年获中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(排名第三)。2015年入选首届中国科协“青年人才托举工程”计划。
个人主页:http://www.nlpr.ia.ac.cn/cip/jjzhang.htm
日程安排:
14:30-15:00
统计机器翻译导论
介绍统计机器翻译的基本模型,历史发展与不足
15:00-15:50
基于深度学习的统计机器翻译
介绍深度学习方法如何应用于统计机器翻译中的各个子模型(例如,词、短语与句子级翻译建模,调序模型以及语言模型等)
15:50-16:00
休息
16:00-16:40
神经机器翻译简介
介绍神经机器翻译的基本模型,包括编码器-解码器架构、注意力机制等
16:40-17:30
神经机器翻译的最新进展与未来展望
介绍神经机器翻译的最新进展(架构、训练、语言与多模态等),以及神经机器翻译的未来展望