
中国中文信息学会计算语言学专业委员会在面向全体委员公开征集的基础上,组织独立评审委员会进行严格评议,现正式发布自然语言处理领域2025年度五大亮点进展。
中国开源大模型推动全球AI普惠发展
中国开源大模型以技术突破、生态完善与全球认可,实现了从“并跑”到“领跑”的关键跨越。中国开源模型在Hugging Face的下载量首超美国,全球使用率达近30%。中国大模型主打低成本、轻量化路线,兼具高效推理与多模态融合特性,大幅降低全球 AI 技术使用门槛,提供了高性价比的技术选择。以开源共享为核心的生态模式,正推动全球 AI 技术朝着普惠、多元的方向发展,惠及更多国家与群体。
大模型在数理推理与编程领域实现突破
在 2025 年国际数学奥林匹克竞赛(IMO) 中,配备“深度思考”能力的 Google Gemini 与 OpenAI GPT 以出色表现夺得金牌,标志着大语言模型在复杂数理推理领域取得了具有里程碑意义的突破。“深度思考”机制通过对推理链路进行显式结构化建模,结合动态评估与自我反思,实现对推理过程的动态修正与迭代优化,助力大模型推理能力实现关键跃升。ICPC 2025 编程比赛中,OpenAI 推理系统凭借思维链与双模型协同任务规划获满分,Gemini 也依托多智能体并行生成 – 验证闭环以及代码检索增强技术达到金牌水平。大模型通过分步推理复刻人类解题逻辑,结合自主优化机制提出独特方案,标志其正从单纯信息处理工具,转变为协助解决复杂问题的关键力量。
可验证的奖励强化学习提升大模型推理能力
基于可验证奖励的强化学习(RLVR)是推动大模型深度推理能力发展的关键技术范式。它通过结果验证、单元测试等自动化方式,为模型的推理过程提供高效的结果监督信号,引导模型自主拓展思维链,进而构建起系统化的深度推理模式。这一方法显著提升了大模型在数理科学、代码生成等可验证任务上的性能。
深度研究系统推动信息获取范式向高阶知识精炼跨越
深度研究(Deep Research)系统通过融合大语言模型与结构化分析执行流程,实现了研究范式的关键演进——从“简单内容生成”迈向“高阶知识精炼”。该系统能够自动构建“分析-执行-整合”的闭环研究流程:在分析信息需求后,可按需调用多种工具进行动态检索与数据处理,最终生成附有证据支撑的深度分析报告。该技术范式在复杂问题分析、交叉学科研究等领域展现出显著优势,推动研究效率与系统性提升。
“视觉-语言-动作”技术加速具身智能标准化进程
OpenVLA 作为开源视觉-语言-动作(VLA)标杆,凭借强泛化性、完善生态与低使用门槛,成为学术研究与工业落地的首选基线,显著推动领域标准化。π 系列VLA模型以流匹配架构与人类视频直接迁移技术破局,在精细操作与开放世界泛化上表现突出,开辟了新技术路径。两者分别引领通用基线与创新架构方向,共同加速具身智能开源生态发展。





