中国中文信息学会(CIPS)计算语言学专委会于2024年10月20日在山东济南成功举办计算语言学前沿论坛活动。此次论坛由CIPS计算语言学专委会(简称专委会)主办,齐鲁工业大学(山东省科学院)国家超级计算济南中心承办。参加本次论坛的专委会委员包括哈尔滨工业大学车万翔教授、西湖大学张岳教授、复旦大学邱锡鹏教授、复旦大学桂韬副研究员;围绕计算语言学领域的前沿热点问题,包括模型推理加速的投机解码技术、模型生成文本的自动检测、大模型到世界模型的转变、大模型智能体基座的构建等领域,展开了深入研讨。来自山东省内多所高校和相关企业的100余名师生和专家,共同参加了本次论坛。
赵大伟研究员
齐鲁工业大学(山东省科学院)计算学部
论坛于10月20日上午8点40分正式开幕。齐鲁工业大学(山东省科学院)国家超级计算济南中心副主任赵大伟研究员致欢迎辞,向与会专委们表示热烈欢迎。他在致辞中介绍了齐鲁工业大学(山东省科学院)计算机科学与技术学部的整体情况,并回顾了国家超级计算济南中心的发展历程。赵大伟副主任对各位专家的到来表示衷心感谢,并预祝此次论坛取得圆满成功。
车万翔教授
哈尔滨工业大学计算学部
专委会副主任、哈尔滨工业大学车万翔教授代表专委会对承办单位表示由衷感谢,并对出席论坛的专家和师生表示热烈欢迎。随后,车万翔教授介绍了第二十四届全国计算语言学大会(CCL 2025)会议的筹备进展,对齐鲁工业大学(山东省科学院)积极承办CCL 2025会议表示感谢,并对后续承办事宜做了展望。
车万翔教授作了题为《基于草稿自拟的投机解码技术》的报告,首先探讨了大语言模型(LLM)在计算和内存需求方面的挑战,强调投机解码技术作为一种系统级推理加速方法,能够有效解决这一问题;重点介绍了团队所提出的基于草稿自拟的投机解码技术,仅需利用目标模型的信息,无需额外的草稿模型及训练即可实现高效解码;围绕草稿自拟技术中的两个关键方法:利用模型自身生成草稿、利用模型历史信息生成草稿,展开了详细介绍;最后,从草稿生成层面和并行验证层面提出了总结和展望,为在资源受限的场景中提升大语言模型的性能提供了新的思路和解决方案。
张岳教授
西湖大学工学院
专委会副主任、西湖大学张岳教授作了题为《模型生成文本的自动检测》的报告,首先通过展示人类文本与模型生成文本的实际案例,引出模型生成文本自动检测的概念,探讨了人工智能生成文本的自动检测任务的难度;围绕自动检测任务中的两种主要方法:监督检测和零样本检测,分析现有方法的局限性,重点介绍了团队提出的MAGE框架和Fast-DetectGPT模型;随后,分享了团队在细粒度检测的最新进展,展示了对机器润色文本进行检测识别的效果;最后,展望了模型生成文本自动检测任务在多语言、多领域环境下的未来发展方向,并指出了优化检测算法的潜在技术路径。
邱锡鹏教授
复旦大学计算机学院
专委会执委、复旦大学邱锡鹏教授作了题为《从大语言模型到世界模型》的报告,首先介绍了“世界模型”以及“具身智能”的概念,并通过Sora、JEPA等一系列大模型实例,说明“世界模型”以及“具身智能”所存在的问题,并对大模型下一阶段目标进行展望,即两者相结合的超级智能;而后,介绍了大语言模型MOSS2的最新研究进展,讨论了实现世界模型所面临的技术挑战与未来研究方向,包括高效架构、数据治理、高级推理、跨模态融合、智能体、工具增强等方面;最后,展望了“打造强交互世界模型、探索强推理具身场景”的研究前景。
桂韬副研究员
复旦大学自然语言处理实验室
专委会委员、复旦大学桂韬副研究员作了题为《大模型智能体基座构建》的报告,首先介绍了智能体与大语言模型的基本概念,并通过经典哲学中的智能体定义,引出关于智能体与大语言模型的本质思考;而后,从智能体RLHF对齐、智能体环境反馈等多个方面对大模型对齐技术展开介绍;最后,展望了大语言模型的技术发展方向,并指出了多智能体竞争与环境反馈训练在未来研究中的重要前景。
鹿文鹏教授
齐鲁工业大学(山东省科学院)计算学部
论坛最后,齐鲁工业大学(山东省科学院)鹿文鹏教授对本次计算语言学前沿论坛进行了闭幕总结,对专委会能够走进校(院)举办前沿论坛表示衷心感谢,鼓励与会师生积极投身自然语言处理领域,共同办好CCL 2025会议。
在前沿论坛举办期间,与会专家参观了国家超级计算济南中心,详细了解了国家超级计算济南中心的发展历程、主要业务及科研成果。
本次前沿论坛的成功举办,为相关领域的学者们提供了很好的交流平台,加强了CIPS计算语言学专委会与国家超级计算济南中心、山东省内高校和企业的联系。专委们积极分享最新的研究成果,为与会者提供了启发,为山东自然语言处理相关研究和产业的发展注入了新的动力。本次前沿论坛的举办有助于促进大模型的技术创新,加强计算语言学与相关领域的融合发展。