NLP前沿动态综述(CCL 2021)

1. 王少楠(认知+NLP)

讲者:王少楠
题目:语言认知与语言计算
摘要:语言理解是认知科学和计算机科学交叉领域共同关心的问题,但两个学科在选择具体研究问题时却十分不同。认知科学领域的研究侧重解析大脑的工作机制,更多地关注于描述大脑对语言的响应,缺乏对大脑语言功能整体化、系统化的研究,而计算机科学家在选择研究问题时重点关注实际应用效能,往往忽略了对语言最本质规律的研究。那么,如何实现两种思路的交叉融合,为智能语言计算模型的构建和语言认知机理的研究带来新的机遇和启发呢?
简介:王少楠,中科院自动化所模式识别国家重点实验室副研究员,中科院青促会会员。研究方向为自然语言理解和语言的神经认知基础等,参与国家自然科学重点基金项目“基于自然语言理解的语言认知和计算模型”,主持青年科学基金项目“语言表征机理及受脑启发的文本表示模型研究”。曾获中科院脑科学与智能技术卓越创新中心青年人才奖励基金、中国科学院院长奖学金特别奖、中国科学院优秀博士论文、中文信息学会优秀博士论文等。

2. 张鹏(量子+NLP)

讲者:张鹏
题目:量子自然语言处理:起源、发展与挑战
摘要:近年来,量子理论和人工智能的交叉研究越来越受人们的关注,由于量子力学所带来的量子优势,在人工智能领域衍生出量子机器学习、量子自然语言处理等新兴的研究方向。当前,量子力学与自然语言处理的结合主要存在两种方法:基于量子计算的自然语言处理量子算法与量子启发式自然语言处理算法。本次报告将回顾这两种方法的起源与发展,同时,针对已有的研究工作,讨论量子自然语言处理所面对的挑战。
简介:张鹏,天津大学智能与计算学部副教授,计算机学院副院长,入选天津大学北洋学者-青年骨干教师计划,微软亚洲研究院铸星计划,十余年来致力于量子信息检索和量子人工智能的研究工作,并积极推动研究成果的落地应用。发表论文包括中国计算机学会(CCF)推荐A/B类会议论文(NeurIPS, SIGIR,ICLR,ACL,IJCAI,AAAI,WWW,CIKM,EMNLP)和期刊论文(TNNLS,TKDE,TIST,IP&M)。获得顶级学术会议SIGIR 2017 Best Paper Award Honorable Mention,欧洲信息检索会议ECIR 2011 Best Poster Award。

3. 何中军(同声传译)

讲者:何中军
题目:机器同声传译:挑战与进展
摘要:同声传译是指在不打断讲话者的条件下,将讲话内容实时地翻译给听众的一种翻译方式,广泛应用于国际会议、商务会谈、新闻发布会等场景。利用机器进行自动同传,具有巨大的应用需求和重要的科学意义。机器同传涉及语音处理、机器翻译等多项技术,近年来成为人工智能领域的前沿方向。随着技术的持续进步,机器同传系统得到广泛应用。本报告将介绍机器同传面临的主要挑战、主流方法及当前进展,最后介绍机器同传的应用。
简介:何中军,百度人工智能技术委员会主席,CCF高级会员。从事机器翻译研究与开发近二十年,研发了全球首个互联网神经网络机器翻译系统及语义单元驱动的机器同传系统。曾获国家科技进步二等奖、中国电子学会科技进步一等奖、中国专利银奖等多项奖励。

4. 吴友政(跨模态NLP)

讲者:吴友政
题目:自然语言处理视角下的多模态技术
摘要:随着视觉、听觉、语言等单模态人工智能技术的突破和在限定场景的大规模产业应用,让计算机拥有更接近人类处理、理解多模态信息能力进而实现高鲁棒性的推理决策受到人工智能科学家们的广泛关注。另一方面,随着图文(Facebook、Twitter、微信、微博)、短视频(Youtube、抖音、快手)、音频(Clubhouse)、视频会议(Zoom、腾讯会议)、直播(抖音、京东、淘宝)和虚拟数字人应用的异军突起,也对多模态技术也提出了更高的要求,同时也给多模态技术提供了海量的数据和丰富的应用场景。本次演讲将从多模态应用、多模态融合和多模态预训练角度出发,介绍多模态技术的挑战、最新技术进展、以及在产业界的应用等。
简介:吴友政博士是京东科技语音语言算法部负责人、高级技术总监,京东AI研究院算法科学家。吴友政博士毕业于中国科学院自动化研究所,毕业后先后在日本情报通信研究机构(NICT)、英国爱丁堡大学、索尼中国研究院和爱奇艺负责自然语言处理、语音识别、机器翻译等技术研究和产品研发工作,在国际自然语言处理领域顶会和重要期刊上发表多篇论文(如ACL、EMNLP、AAAI、IJCAI、ICASSP、INTERSPEECH等)。曾获得语音识别(IWSLT2012、IWSLT2013)和对话式机器阅读理解(QuAC)比赛的冠军。主办了2019年和2020年京东人机对话挑战赛JDDC,吸引了上千支队伍参加。技术产品化上,先后打造了基于多轮对话技术的智能客服平台言犀、基于多模态内容生成技术的品创、以及基于知识图谱的采购大脑等产品。曾获得京东集团技术金牛奖等荣誉。

5. 崔磊(文档和图片智能)

讲者:崔磊
题目:文档智能前沿综述
摘要:文档智能是指通过计算机进行自动阅读、理解以及分析商业文档的过程,是自然语言处理和计算机视觉领域的重要研究方向。 近年来,深度学习技术的普及极大地推动了文档智能领域的发展,以文档布局分析、文档信息抽取、文档视觉问答以及文档分类等为代表的文档智能任务都有显著的性能提升。本文对于早期基于规则的文档分析技术、基于统计机器学习的算法、以及近年来基于深度学习和预训练的方法进行简要介绍,并展望了文档智能技术的未来发展方向。
简介:崔磊,微软亚洲研究院自然语言计算组高级研究员。他在人工智能和自然语言处理领域发表顶级论文30余篇,并持有15项美国专利。他的研究兴趣是自然语言处理,包括文档智能、信息抽取、文本生成、对话系统、机器翻译以及自动问答等,很多研究工作已经成功集成至Azure云平台、Office办公套件、必应搜索引擎(Bing)等微软公司重要产品中。

6. 冯岩松(NLP+司法)

讲者:冯岩松
题目:面向法律文书的自然语言理解
摘要:本次报告将简要介绍近年来国内外学术界围绕法律文书开展的信息抽取、文本生成、焦点分析以及辅助决策等方面的研究进展;最后将结合目前主流自然语言处理技术在法律智能应用方面遇到的挑战与大家分享对未来研究的一些看法。
简介:北京大学王选计算机研究所副教授。主要研究方向包括自然语言处理、信息抽取以及机器学习在自然语言处理中的应用;连续多年在面向结构化知识库的知识问答评测中获得第一名;相关工作发表在ACL、EMNLP、TPAMI、AIJ等自然语言处理领域顶级会议及期刊上。作为项目负责人或课题骨干已承担多项国家自然科学基金、科技部863计划和重点研发项目。

7. 黄振亚(NLP+教育)

讲者:黄振亚
题目:面向教学资源的数据分析方法与智能教育应用
摘要:对教学资源进行智能分析是智能教育的核心任务之一。例如,利用NLP技术对教育试题本文开展自动分析与评估,不仅可以提高学习资源管理效率,也为学习者提供智能学习服务奠定了重要的基础。本报告从真实的智能教育应用场景需求出发,重点介绍面向教育试题的信息抽取、知识表示、质量评估与智能应用服务等,总结当前教育NLP分析现状和面临的问题,并展望未来发展方向。
简介:黄振亚,博士。现任中国科学技术大学计算机科学与技术学院副研究员。主要研究方向为数据挖掘及知识发现、表征学习与应用、教育大数据分析等。获2020年吴文俊人工智能科技进步一等奖,2020年中国科学院院长优秀奖等,入选2021全球人工智能华人新星百强榜单。在相关领域高水平学术期刊(如TKDE、TOIS、计算机学报等)和国际重要学术会议(如:KDD、SIGIR、AAAI等)上发表论文30余篇,代表性论文入选ESI高被引论文。多次担任IEEE TKDE、ACM TIST等学术期刊审稿人,以及NeurIPS、ICML、AAAI、IJCAI等多个国际会议的(高级)程序委员会委员。

8. 汤步洲(NLP+医疗)

讲者:汤步洲
题目:医疗NLP前沿综述
摘要:医疗NLP是解锁临床医疗文本中关键医疗信息和知识的钥匙,是AI落地医疗领域的必要技术。近年来,随着医疗AI的发展,医疗NLP受到越来越多的关注,真实的医疗应用场景需求一方面为NLP技术提供了验证场所,另一方面也引申出一些具有特色的NLP问题。本文将从真实的医疗应用场景需求出发,对NLP问题和技术进行简要介绍,对医疗NLP当前遇到的问题和面临的挑战进行总结,并展望未来医疗NLP的发展方向。
简介:汤步洲,博士(后),哈尔滨工业大学(深圳),特聘研究员/副教授、博士生导师,鹏城实验室兼职研究员。OHDSI中国组核心成员,中文信息学会“医疗健康与生物信息处理”专业委员会副主任兼秘书长。主要研究方向包括机器学习、数据挖掘、自然语言处理、医学信息学、语音合成等。近年来,在国际知名期刊和会议上发表学术论文一百二十多篇,其中SCI检索论文60多篇;申请发明专利10多项,获发明专利3项;相关研究成果获省一等奖1项,市科技创新奖1项,市自然科学技术二等奖1项;组织参加相关研究领域国际评测,获得第一名10多次;2次获得最佳会议论文奖,论文Google scholar引用2400+次,H-index为26。天池中文医疗信息处理挑战榜CBLUE(Chinese Biomedical Language Understanding Evaluation)发起人之一。先后承担国家、省市、企业合作项目二十多项。

9. 丁效(NLP+金融)

讲者:丁效
题目:面向金融领域的自然语言处理技术综述
摘要:智能金融是人工智能技术与金融服务全面融合的产物,在自然语言处理技术的强力支撑下,全面赋能金融机构,提升金融机构的服务效率,及时准确地响应客户各类金融需求,拓展金融服务的广度和深度,以客户为中心,实现金融服务的智能化、个性化和定制化。本次报告将围绕构建智能金融体系所需要的自然语言处理技术以及相应的技术难点进行介绍,并开放式的讨论未来在该方向上可能的突破点以及发展方向。
简介:丁效,博士,哈尔滨工业大学副研究员。主要研究方向为人工智能、自然语言处理、文本推理和事理图谱。已在ACL、AAAI、IJCAI、EMNLP、TASLP等人工智能领域的著名国际期刊和会议上发表相关论文20余篇。承担多项国家自然科学基金等省部级以上项目,参与国家重大科技基础设施建设项目、“新一代人工智能”重大项目、国家自然科学基金重点项目等多个科研项目。荣获黑龙江省科技进步二等奖、SemEval 2020国际语义评测“检测反事实陈述”任务第一名。担任中国中文信息学会社会媒体处理专委会秘书、常务委员,语言与知识计算专委会委员,中国中文信息学会青年工作委员会委员。