CIPS计算语言学专委会 2025年03月25日 19:58
大模型前沿技术报告系列直播课是由中国中文信息学会计算语言学专业委员会主办,并行科技承办的系列公益直播课,旨在分享大模型技术前沿学术成果和普及大模型算力应用,面向相关领域的科研工作者和高校师生展开。
大模型前沿技术报告系列直播课固定播出档期为每月第三周周四19:00。每期邀请一位大模型领域的知名专家学者,进行约一小时的学术报告分享。直播课的播出平台为:视频号【并行科技】、B站【并行科技】、B站【CIPS计算语言学专委会】。欢迎观看与交流。

特邀讲者
车万翔,哈尔滨工业大学计算学部长聘教授/博士生导师,人工智能研究院副院长,国家级青年人才,斯坦福大学访问学者。主要研究领域为自然语言处理、大语言模型。现任中国中文信息学会理事、计算语言学专业委员会副主任兼秘书长;国际计算语言学学会亚太分会(AACL)执委兼秘书长;国际顶级会议ACL 2025程序委员会共同主席。承担国家自然科学基金重点项目和专项项目、2030“新一代人工智能”重大项目课题等多项科研项目。著有《自然语言处理:基于预训练模型的方法》一书。曾获AAAI 2013最佳论文提名奖。负责研发的语言技术平台(LTP)已授权给百度、腾讯、华为等公司付费使用。2024年获中国人工智能学会吴文俊人工智能科技进步一等奖(排名第1),2020年获黑龙江省青年科技奖,2016年获黑龙江省科技进步一等奖(排名第2)。入选斯坦福大学和爱思唯尔发布的2024年度“全球前2%顶尖科学家”榜单。
直播摘要
在人工智能迅猛发展的当下,推理能力已经成为评估并提升模型智能水平的核心指标和重要途径。长思维链(Long Chain-of-Thought, Long CoT)作为推理大模型(RLLMs)处理复杂任务时的关键技术,能够显著增强模型的推理深度与广度。通过实现深度的逻辑推理、积极的探索行为和有效的反思机制,长思维链赋予模型解决更加复杂、多样化问题的能力。本报告将深入解析长思维链的基本原理及应用实践。具体内容包括系统地阐述长思维链的核心技术与机制,重点涵盖深度推理的逻辑形式与学习框架、反思能力的反馈与纠错机制、探索能力的扩展机制,以及内部与外部探索框架等关键内容。此外,报告还将详细分析长思维链中产生思维链边界与测试时扩展(Test Time Scaling)现象的根本原因。最后,报告将展望长思维链的未来发展趋势,特别关注多模态长思维链等前沿方向,以期为人工智能领域的研究者与实践者提供一定的参考与启示。
B站观看直播请移步搜索“CIPS计算语言学专委会” B站官方号。
