中国中文信息学会(CIPS)计算语言学专委会2023年战略研讨会于5月13日至14日在江西上饶顺利召开。此次研讨会由CIPS计算语言学专委会(简称专委会)主办,江西师范大学、上饶市大数据发展管理局、上饶高铁经济试验区管委会承办。研讨会的主题是“大模型时代,NLPer何去何从?”。来自全国各地的专委40余位专委会委员参加了本次研讨会,通过特邀报告和论坛研讨的方式,深度探讨了大模型背景下自然语言处理研究所面临的挑战与机遇。
研讨会于5月13日上午8点45分正式开幕。开幕式由专委会副主任、哈尔滨工业大学的车万翔教授主持。江西师范大学数字产业学院[上饶]院长王明文教授致欢迎辞,对专委们的到来表示了诚挚的谢意和欢迎,介绍了江西师范大学和学院的发展历程,并预祝研讨会圆满成功。上饶高铁经济试验区党工委书记魏文攻发表讲话,代表上饶高铁经济试验区对与会专委表示热烈欢迎,并介绍了上饶高铁经济试验区的定位与规划。专委会主任、清华大学刘洋教授代表专委会对承办单位的办会工作表示由衷感谢,并热烈欢迎与会专委。同时,刘洋教授简要介绍了专委会的年度工作重点,并对研讨会的目的和目标提出期望。
江西师范大学数字产业学院[上饶]院长王明文教授致欢迎辞
上饶高铁经济试验区党工委书记魏文攻发表讲话
专委会主任、清华大学刘洋教授发言
本次研讨会设三组共十一个特邀报告。第一组特邀报告由专委会副主任、哈尔滨工业大学车万翔教授主持,主题为“大模型时代机遇与挑战”。专委会名誉主任、清华大学孙茂松教授作了题为《ChatGPT引发的思考与挑战》的报告,分享了对ChatGPT发展过程的观察与思考,并指出接下来需要在“正面战场”上发展优于ChatGPT/GPT-4的技术、解决大模型评测等关键问题,同时也应在“敌后战场”以大模型为基础拓展新的研究问题与应用场景。报告还探讨了新形势下高校育人工作所面临的若干问题与挑战。
专委会名誉主任、清华大学孙茂松教授作报告
北京语言大学宋柔教授作了题为《语言认知和大语言模型》的报告,指出ChatGPT/GPT-4目前在处理复杂语言现象、逻辑、正误判断、深度抽象等问题方面仍然存在不足,并特别讨论了小句复合体在解决模型轻量化问题中的重要潜力。针对大模型时代语言学和计算语言学的教学问题,宋柔教授认为语言知识仅是外壳,应该借助语言知识来讲授如何在复杂对象中提取概念、设计处理方法,培养学生处理各种对象所需的联想、类比、归纳、抽象、演绎的逻辑思维能力。
北京语言大学宋柔教授作报告
哈尔滨工业大学秦兵教授作了题为《知识计算与大模型相关能力》的报告,对当前大模型在知识计算方面的优势与局限性进行了分析,并探讨了知识图谱在预训练、推理等不同阶段对于大模型的潜在作用。指出知识计算在大模型时代“危”与“机”并存,一方面大模型可能改变甚至替代传统知识图谱的作用与应用方式,另一方面大模型也为知识图谱构建以及知识图谱的应用提供了新的发展空间。
哈尔滨工业大学秦兵教授作报告
西湖大学张岳教授作了题为《大模型能力分析》的报告,指出当前大模型面临着一些公认的挑战,包括提示工程、事实性问题、逻辑性问题、伦理问题、能耗问题等。他重点报告了关于大模型逻辑推理能力的评测与分析工作,展现了大模型在逻辑推理方面仍然存在很多问题,特别是在分布外范化方面存在诸多问题与挑战。
西湖大学张岳教授作报告
中国科学院计算技术研究所冯洋研究员主持第二组特邀报告,主题为“大模型任务能力与分析”。大连理工大学黄德根教授作了题为《多语言机器翻译与大模型技术》的报告,指出目前多语言机器翻译仍然面临模型表达瓶颈、语言特有知识建模能力不足、语种增量学习等问题。他回顾了课题组及合作单位在解决上述问题的工作与经验,特别展示了大规模多语言翻译模型在解决上述问题中的重要作用,并探讨了大模型背景下机器翻译范式演变、如何应对低资源语言等重大挑战。
大连理工大学黄德根教授作报告
天津大学熊德意教授作了题为《大模型对齐:挑战与NLP机遇》的报告,强调应为大模型及AGI加装安全护栏、使其与人类价值对齐。他深入讨论了大模型对齐的必要性、问题定义、社会挑战、技术挑战、技术路线等问题,认为对齐评估、对齐与规模(scaling)效应之间的关系、以及与中文文化价值对齐等是中文自然语言处理的重要机遇。
天津大学熊德意教授作报告
东北大学肖桐教授作了题为《大语言模型的机器翻译能力:分析与实践》的报告,报告围绕 “大语言模型处理中文的能力真的完全是从中文数据中学习到的吗?”的问题进行了深入分析,探讨了大语言模型在机器翻译方面的能力。他展示了大语言模型利用翻译记忆(translation memory)等外部知识的能力,并对大语言模型翻译能力的涌现进行了探讨。这些讨论引发了对于大模型背景下机器翻译技术未来发展方向的思考。
东北大学肖桐教授作报告
专委会副主任、中国科学院自动化研究所刘康研究员主持第三组特邀报告,主题为“大模型时代应用创新”。北京语言大学荀恩东教授作了题为《NLP人才培养一些思考》的报告。报告讨论了大模型的发展对NLP人才培养提出的新挑战,并结合北京语言大学在NLP人才培养方面的实践,探讨了当前NLP人才培养所面临的问题、需求和课程设置等一系列议题。荀恩东教授的报告激发了与会者对于如何与时俱进地进行NLP人才培养的思考。
北京语言大学荀恩东教授作报告
清华大学刘知远副教授作了题为《大模型值得关注的重要特性》的报告,报告指出大模型具有一些重要的特性,包括增量微调、稀疏模块、工具学习、群体智能和通用性等,这些特性亟待进一步挖掘。他认为大模型通过充分利用大数据具有很好的通用性,并为研究和应用领域带来了全新的可能性。
清华大学刘知远副教授作报告
北京信息科技大学张仰森教授作了题为《预训练模型与智能文本校对》的报告,全面介绍了课题组在智能文本校对方面的研究成果和思考,阐述了中文文本错误的“非多字词错误”与“真多字词错误”的分类思想,探讨了典型预训练模型在文本校对方面的优点与不足之处,认为文本校对模型的未来发展趋势是预训练模型与规则模型的结合。
北京信息科技大学张仰森教授作报告
哈尔滨工业大学(深圳)王晓龙教授作了题为《智能证券投资——ChatGPT之后更高的挑战》的报告,介绍了智能证券投资的问题定义与意义,阐述了智能证券投资理论构建中的关键问题与解决思路,并讨论了智能证券投资实践验证的经验与心得。他的报告为拓展大模型应用领域提供了宝贵的思路。
哈尔滨工业大学(深圳)王晓龙教授作报告
专委会主任、清华大学刘洋教授主持了论坛研讨环节。与会专委们就大模型在理解大脑神经结构方面的潜在作用、大模型可信度的提升、大模型生成内容的检测方法、知识图谱在大模型中的应用、小课题组如何应用大模型等一系列问题展开了讨论。他们普遍认为大模型对传统计算语言学的发展带来了重大的影响和挑战,但同时也开启了全新的发展空间,为计算语言学的进一步发展提供了历史性的机遇。
与会专委积极发言
本次研讨会的召开为国内计算语言学领域的学者们提供了一个充分交流研讨的平台。与会的专委们积极分享了他们的研究成果和经验,紧密围绕大模型时代计算语言学的发展展开了深入而富有洞见的讨论。这些讨论不仅为与会者提供了启发,还为未来的发展方向提供了合作的机会。这次研讨会的成功举办将促进国内计算语言学领域的进一步交流与合作,并为该领域的发展做出贡献。
与会专委合影