CCL 2019讲习班暨中国中文信息学会《前沿技术讲习班》(ATT)第19期


时间:2019年10月18日

地点:世纪金源大饭店一楼宴会厅

时间 讲者 题目
8:30-10:00 邱锡鹏 (复旦大学) 生成对抗网络
10:00—10:30   茶歇
10:30-12:00 崔鹏 (清华大学) Frontiers in Network Embedding and GCN
14:00-15:30 车万翔 (哈尔滨工业大学) 预训练模型--自然语言处理的新范式
15:30—16:00   茶歇
16:00-17:30 张家俊 (中科院自动化所) Text Generation: From the Perspective of Interactive Inference

报告具体信息:

时 间:8:30-10:00
报告题目:生成对抗网络
报告人:邱锡鹏 (复旦大学)
报告摘要:生成对抗网络(Generative Adversarial Network,GAN)是非监督式学习的一种生成模型,其由一个生成网络与一个判别网络组成,通过让两个神经网络相互博弈的方式进行学习。生成网络从潜在空间(latent space)中随机取样 作为输入,其输出结果需要尽量模仿训练集中的真实样本。判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。而生成网络则要尽可能地欺骗判别网络。两个网络相互对抗、不断调整参数,最终目的 是使判别网络无法判断生成网络的输出结果是否真实。虽然生成对抗网络原先是为了无监督学习提出的,它也被证明对半监督学习、监督学习、强化学习同样有用。本报告主要讲述生成对抗网络的基本原理和最新研究进展。

个人简介: 邱锡鹏 复旦大学计算机科学技术学院副教授,博士生导师。于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,在ACL、EMNLP、AAAI、IJCAI等计算机学会A/B类期刊、会议上发表50余篇学术论文,引用 1900余次。开源中文自然语言处理工具FudanNLP作者,FastNLP项目负责人。2015年入选首届中国科协人才托举工程,2017年ACL杰出论文奖,2018年获中国中文信息学会“钱伟长中文信息处理科学技术奖—汉王青年创新奖”。


时 间:10:30-12:00
报告题目:Frontiers in Network Embedding and GCN
报告人:崔鹏 (清华大学)
报告摘要:Nowadays, larger and larger, more and more sophisticated networks are used in more and more applications. It is well recognized that network data is sophisticated and challenging. To process graph data effectively, the first critical challenge is network data representation, that is, how to represent networks properly so that advanced analytic tasks, such as pattern discovery, analysis and prediction, can be conducted efficiently in both time and space. In this talk, I will introduce the recent trends and achievements on network embedding and GCN, including disentangled GCN, anti-attack GCN as well as auto machine learning for network embedding.

个人简介: 崔鹏 清华大学计算机系长聘副教授,博士生导师。研究兴趣聚焦于大规模网络表征学习以及大数据驱动的因果推理和稳定预测。近5年在数据挖掘及人工智能领域顶级会议发表论文100余篇,先后5次获得顶级国际会议或期刊论文奖,并先后两次入选 数据挖掘领域顶级国际会议KDD最佳论文专刊。担任IEEE TKDE、ACM TOMM、ACM TIST、IEEE TBD等国际期刊编委。曾获得国家自然科学二等奖、教育部自然科学一等奖、电子学会自然科学一等奖、CCF-IEEE CS青年科学家奖、ACM中国新星奖。入选中组部万人计划青年拔 尖人才,并当选中国科协全国委员会委员。


时 间:14:00-15:30
报告题目:预训练模型--自然语言处理的新范式
报告人:车万翔 (哈尔滨工业大学)
报告摘要:传统的有监督自然语言处理模型依赖大规模的人工标注训练数据,这些数据标注代价非常高,因此规模有限,这也限制了自然语言处理系统进一步提升精度。以Word2vec,GloVe等为代表的词向量技术可以视为一种早期的预训练模型, 从大规模未标注文本中预训练的词向量,在一定程度上提高了上层模型的精度。然而,这些模型假设“一个词由唯一的向量表示”,忽略了它们在不同上下文下的差异。以ELMo为代表的上下文相关词向量模型取消了以上的假设,在不同的上下文环境下,赋予相 同的词以不同的词向量,因此又被称为“动态”词向量。BERT等模型进一步使用更深层的网络进行预训练,并使用了语言模型之外的预训练目标,在应用模式上也从简单的特征提取转换为精调整个网络结构。这些新的预训练模型在众多自然语言处理任务上取得 了很好的效果,已成为自然语言处理的新范式。本报告首先介绍预训练模型的演化过程,接着介绍预训练模型在应用方面的最新研究进展,另外还列举了一些对预训练模型进行定性和定量分析的工作,最后对自然语言处理中预训练模型的发展趋势进行了展望。

个人简介: 车万翔 博士,哈尔滨工业大学计算机学院教授,博士生导师,斯坦福大学访问学者,合作导师Christopher Manning教授。现任中国中文信息学会计算语言学专业委员会委员、青年工作委员会副主任;中国计算机学会高级会员、曾任 YOCSEF哈尔滨主席(2016-2017年度)。在ACL、EMNLP、AAAI、IJCAI等国内外高水平期刊和会议上发表学术论文50余篇,其中AAAI 2013年的文章获得了最佳论文提名奖,论文累计被引用2,100余次(Google Scholar数据),H-index值为26。出版教材 2 部,译 著 2 部。承担国家自然科学基金、973等多项科研项目。负责研发的语言技术平台(LTP)已被600余家单位共享,提供的在线“语言云”服务已有用户1万余人,并授权给百度、腾讯、华为等公司使用。2018年,获CoNLL多语种句法分析国际评测第1名。2015-16年, 连续两年获Google Focused Research Award(谷歌专注研究奖);2016年,获黑龙江省科技进步一等奖(排名第2);2012年,获黑龙江省技术发明奖二等奖(排名第2);2010年获中国中文信息学会“钱伟长”中文信息处理科学技术奖一等奖(排名第2)、首届 汉王青年创新奖(个人)等多项奖励。2017年,所主讲的《高级语言程序设计(Python)》课程获国家精品在线开放课程。


时 间:16:00-17:30
报告题目:Text Generation: From the Perspective of Interactive Inference
报告人:张家俊 (中科院自动化所)
报告摘要:机器翻译、文本摘要和图片描述等文本生成任务近年来受到越来越多的关注。然而,在文本生成任务中,我们看到几乎所有方法仍采用自左往右的推断模式,缺乏与自右往左推断的交互,限制了其对未来信息的开发和利用;此外, 在多语言翻译或多语言图片描述生成中,将同一个文本或图片自动转换为不同语言的文本时,不同语言的生成过程是相互独立的,推断过程缺乏交互,限制了语言间信息的共享和利用。这个报告首先介绍文本生成的基本范式,然后着重介绍同步双向交互推 断的思想,并拓展泛化为通用的交互式推断方法,介绍在(多语言)机器翻译、文本摘要和图片描述生成等任务上的应用。最后,展望文本生成中交互式推断的难点和未来方向。

个人简介: 张家俊 博士,中科院自动化所模式识别国家重点实验室副研究员。研究方向为自然语言处理和机器翻译等。担任中国中文信息学会机器翻译专委会副主任等学术职务。在著名期刊与会议发表学术论文70余篇,曾四次获得自然语言处理学 术会议最佳论文奖。被ACL-IJCNLP-2015、NAACL-2018和IJCAI-2018评为杰出审稿人和杰出高级程序委员会委员。2014年和2018年分别获中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖(排名第三)和汉王青年创新奖一等奖。2015年入选首届中国 科协“青年人才托举工程”计划。担任COLING-2018和EMNLP-2019的领域主席和国际人工智能大会IJCAI (2017-2019)和AAAI (2019-2020)的高级程序委员会委员等。


CCL 2019讲习班暨中国中文信息学会《前沿技术讲习班》(ATT)第19期PPT下载列表

序号 报告题目 报告人 PPT下载
01
生成对抗网络 邱锡鹏 生成对抗网络.pdf
02
Frontiers in Network Embedding and GCN 崔鹏 Frontiers in Network Embedding and GCN.pdf
03
预训练模型--自然语言处理的新范式 车万翔 预训练模型--自然语言处理的新范式.pdf
04
Text Generation: From the Perspective of Interactive Inference 张家俊 Text Generation: From the Perspective of Interactive Inference.pdf