第一届 Open HowNet前沿学术研讨会
First Workshop on Open HowNet


简介:HowNet是由董振东、董强先生父子毕三十年之功建立的一个以汉语和英语的词语所代表的概念为描述对象,以揭示概念与概念之间、以及概念所具有的属性之间的关系为基本内容的语言和常识知识库。 HowNet秉承还原论思想,认为词义概念可以用更小的语义单位来描述,这种语义单位被称为“义原”(Sememe),是最基本的、不易于再分割的意义的最小单位。在不断标注的过程中,HowNet逐渐构建出了一套精细的义原体系 (约2000个义原),并基于该义原体系累计标注了数十万词汇/词义的语义信息,自1999年正式发布以来引起了中文信息处理领域极大的研究热情,在词汇相似度计算、文本分类、信息检索等方面探索了HowNet的重要应用价值, 建立了广泛而深远的学术影响力。

2017年以来,清华大学自然语言处理实验室等研究团队开始探索HowNet在深度学习时代的应用价值,并在词汇语义表示、句子语义表示、词典扩展等任务上得到了验证。研究发现,HowNet通过统一的义原标注体系直接精准刻画 语义信息,一方面能够突破词汇屏障,深入了解词汇背后丰富语义信息;另一方面每个义原含义明确固定,可被直接作为语义标签融入机器学习模型,使自然语言处理深度学习模型具有更好的鲁棒可解释性。相关成果均发表在 AAAI、IJCAI、ACL、EMNLP等人工智能和自然语言处理领域顶级国际会议上。2019年初,清华大学人工智能研究院知识中心联合董氏父子共同开源HowNet知识库核心数据,研制了知识库的访问与计算工具包Open HowNet,并持续维 护更新和扩展。

为了让HowNet知识库及其学术思想得到更深入探索和更广泛应用,我们在第十八届中国计算语言学大会(CCL 2019)上组织第一届Open HowNet前沿学术研讨会(OpenHowNet 2019),希望邀请国内外自然语言处理学者,共同研讨HowNet的改进、扩展与应用问题,为研讨和传播HowNet最新学术成果提供交流平台。

组织者:清华大学人工智能研究院、中国中文信息学会计算语言学专委会

时 间:2019年10月18日

地 点:世纪金源大饭店三楼多功能厅


时间 日程
09:00-09:05 开幕式、领导致辞
09:05-09:15 董振东先生生平介绍 (10分钟)
09:15-09:30 Open HowNet义原知识库简介与愿景(15分钟)
09:30-09:40 基于义原计算的中文语义组合建模(10分钟)
09:40-09:50 融合义原知识的深度学习模型(10分钟)
09:50-10:00 利用义原知识进行对抗文本生成与防御(10分钟)
10:00-10:30 茶歇
10:30-10:40 基于义原知识的词典释义生成(10分钟)
10:40-10:50 面向多语言的义原知识自动构建技术(10分钟)
10:50-11:00 义原知识树结构的自动预测技术(10分钟)
11:00-12:00 开放讨论(60分钟)
12:00-12:05 闭幕式