前沿动态综述

1. 李 北

讲者:李 北
讲者单位:美团
题目:大模型结构研究综述
报告简介:本报告将从四个维度对近期大模型结构进行综述。在归一化方法上,本文探讨了其如何提升训练稳定性,并分析了主流Pre-Norm与Post-Norm结构的局限性与改进方向。在结构改进方面,重点关注以Mamba、RWKV为代表的非注意力架构的探索。对于高效长文本建模,报告梳理了滑动窗口及稀疏注意力等变体如何有效降低计算复杂度,减少显存开销。最后,将简述近期备受关注的扩散大模型在文本生成领域的应用与研究进展。
讲者简介:李北,博士,师从东北大学肖桐教授,研究方向涉及机器翻译,基座模型优化,大语言模型后训练技术等,目前在美团大语言模型组从事基座与后训练相关研究,在ACL、EMNLP、ICML、NeurIPS、ICLR、AAAI、COLING等领域内高水平会议上发表30余篇论文,Google Scholar被引2000余次。参与多项开源系统的研发,并多次参与WMT、CCMT、CWMT等机器翻译评测任务,取得多项翻译赛道第一名成绩。长期担任ACL、EMNLP、ICLR、ICML、NeurIPS等顶会程序委员会委员,获评EMNLP 2021杰出审稿人。博士在读期间曾多次获得国家奖学金,并荣获百度奖学金提名,中文信息学会优博等荣誉。

2. 张林峰

讲者:张林峰
讲者单位:上海交通大学
题目:数据中心的人工智能模型压缩加速
报告简介:大模型的计算成本严重制约了其落地应用。一般来说,模型的计算成本由其参数量与数据量共同决定。已有压缩研究主要关注如何减少模型的参数量而忽视了数据维度的压缩。随着强推理模型和视频生成模型的出现,数据规模(Token数量)已经成为了人工智能计算成本居高不下的首要因素。在本报告中,我们将介绍数据中心的模型压缩加速在大模型、多模态大模型、图像视频生成模型上的几个典型案例。
讲者简介:张林峰,担任上海交通大学人工智能学院助理教授,领导 EPIC (Efficient and Precision Intelligent Computing) 实验室,有硕士与博士学生指导资格。2024年6月于清华大学交叉信息学院获得博士学位,读博期间,获得了微软学者荣誉称号(亚太地区年度共十二名),北京市优秀毕业生,清华大学优秀博士论文,清华大学启航奖金奖(清华大学共二十八名),清华大学蒋南翔奖学金(清华大学共二十名)。博士期间,发表高水平学术论文二十余篇,其中第一作者十三篇,论文总计被引用超过1900次(截至2024年7月)。2019年首次提出了自蒸馏算法,是知识蒸馏领域的代表性工作之一。研究成果已在北极雄芯、华为、交叉信息核心技术研究院等公司中得到使用。自2020年起,常年担任NeurIPS,ICML,ICLR,CVPR,ECCV,ICCV,AAAI,IJCAI,IEEE TPAMI,IEEE TCSVT,IEEE TIP等众多学术会议与期刊的审稿人。在2024年7月后,以助理教授的身份加入上海交通大学人工智能学院。

3. 许 晨

讲者:许 晨
讲者单位:哈尔滨工程大学
题目:大语言模型时代的语音处理综述
报告简介:大语言模型的快速发展正在深刻变革语音处理的技术范式,推动着从传统级联架构向端到端统一建模的革命性转型。本报告将系统梳理语音大语言模型所面临的核心挑战,聚焦建模范式、模型架构与训练策略等维度进行前沿进展介绍,并展望未来研究方向,旨在为相关领域的研究者提供参考。
讲者简介:许晨,哈尔滨工程大学副教授,硕士生导师,博士毕业于东北大学自然语言处理实验室。主要研究方向为多模态处理与人工智能安全,在ACL、EMNLP、ICLR、TASLP、UAI等高水平会议与期刊发表论文30余篇。出版战略性新兴领域教材一部,主持国家自然科学基金等多项课题。

4. 刘学博

讲者:刘学博
讲者单位:哈尔滨工业大学(深圳)
题目:大模型时代的机器翻译与多语言处理前沿探索
报告简介:大语言模型作为新一代统一建模框架,突破了传统任务的边界,极大增强了多语言处理与跨语言翻译的能力。另一方面,机器翻译作为核心的生成任务,持续推动大模型在数据合成、评测方法和智能体协作等关键技术上的发展。本报告将聚焦于大模型与机器翻译之间的双向驱动关系,并讨论一些极具潜力、可快速形成顶会成果的研究方向与创新思路。
讲者简介:刘学博,哈尔滨工业大学(深圳)计算机科学与技术学院/计算与智能研究院副教授、博士生导师,入选第十届中国科协青年人才托举工程(科协资助)、鹏城孔雀计划特聘岗位、校青年拔尖人才计划。2021年于澳门大学科技学院取得博士学位。主要研究方向为自然语言处理、大语言模型、机器翻译。在ACL、EMNLP等自然语言处理顶会和ICLR、NeurIPS等机器学习顶会发表论文40余篇,其中一作或通讯论文30余篇。第一发明人授权发明专利6项。担任自然语言处理三大会ACL 2022&2024-2025、EMNLP 2022-2025、NAACL 2024-2025会议(高级)领域主席,国内自然语言处理旗舰会议NLPCC 2024、CCL 2023-2025会议领域主席,及多个国际顶级会议和期刊的审稿人。主持国家自然科学基金青年项目、广东省重点研发计划课题、广东省基金面上项目、深圳市优秀科技创新人才培养项目、深圳市基金面上项目、CCF-腾讯犀牛鸟项目、腾讯微信犀牛鸟专项、华为长期科研合作项目等,参与国家自然科学基金重点项目、深圳市孔雀团队项目、深圳市科技重大专项、大型企业横向项目等。获中国中文信息学会科学技术奖科技进步类一等奖、澳门科学技术奖技术发明类二等奖、澳门研究生科技研发奖、中国中文信息学会优博提名奖等。

5. 覃立波

讲者:覃立波
讲者单位:中南大学
题目:大模型推理思维链研究进展综述
报告简介:近年来,以OpenAI o1,DeepSeek R1为代表的推理大模型取得了极大的关注。在本报告中,讲者将对推理大模型的核心技术思维链推理的研究进展进行概述介绍。同时,讲者对介绍跨语言思维链、跨模态思维链以及长思维链等前沿方向。
讲者简介:覃立波,中南大学特聘教授,博士生导师,现任中国中文信息学会青工委秘书长。主要研究兴趣为自然语言处理、大模型推理等。研究成果曾入选世界人工智能大会青年优秀论文提名、Paper Digest高影响力论文以及EMNLP2022 MMNLU Workshop最佳论文。担任ACL Rolling Review执行编委,ACL、EMNLP、NAACL等国际会议(资深)领域主席。

6. 冯夏冲

讲者:冯夏冲
讲者单位:香港大学
题目:基于大语言模型的社会模拟:进展与挑战
报告简介:大语言模型为社会模拟注入了新的活力,使智能体在复杂社会情境中的互动具备语言理解、策略推理与情境适应等高级智能特征,推动了从传统基于规则的建模向更复杂、更人性化的智能体模拟的范式转变。本报告将系统梳理大语言模型在社会模拟领域的最新进展,包括角色扮演、策略博弈、协同决策等关键应用场景,探讨其在建模社会行为、生成多样情境和评估政策效果方面的潜力。同时,报告也指出当前面临的关键挑战,如多智能体一致性维护、长期交互的稳定性、以及模拟结果的可验证性与可重复性问题。最后,报告提出未来研究方向,强调算法机制设计与理论框架构建对于推动该领域科学化发展的重要意义。
讲者简介:冯夏冲,香港大学博士后研究员,哈尔滨工业大学社会计算与交互机器人研究中心博士,新加坡国立大学访问学生,导师为秦兵教授和冯骁骋教授。研究兴趣为大语言模型,社交智能体。在ACL、TASLP、TMLR等顶级会议期刊发表论文多篇。曾获三次国家奖学金、CCL 2021最佳英文长文奖、TMLR综述奖、ICASSP 2023 MUG竞赛冠军等奖励。担任ICML、ICLR、ACL Rolling Review等相关会议的程序委员会委员和领域主席。

7. 李丕绩

讲者:李丕绩
讲者单位:南京航空航天大学
题目:大模型时代的脑编解码技术综述
报告简介:脑科学与大模型的关系已从单向灵感汲取走向双向协同创新,脑科学为大模型提供生物智能的底层逻辑,大模型为脑科学提供解析复杂系统的超级工具。脑编码(Brain Encoding)是指通过分析外部刺激(如图像、语言等)与大脑活动之间的关系,建立从刺激到神经信号的映射模型。脑解码(Brain Decoding)旨在从神经信号中还原语言、图像等信息。本报告从脑编码分析与脑解码生成两个维度综述大模型与脑科学交叉研究中的探索及成果,并分析当前存在的挑战与未来发展方向。
讲者简介:李丕绩,南京航空航天大学计算机科学与技术学院/人工智能学院教授,博士生导师。他本科和硕士就读于山东大学,2018 年博士毕业于香港中文大学,曾任腾讯 AI Lab 自然语言处理中心高级研究员。他的研究方向主要为自然语言处理,包括预训练模型、信息检索、文本挖掘、文本生成和对话系统。他曾在相关领域顶级会议如 ACL、EMNLP、SIGIR、WWW等发表学术论文 50 余篇。他受邀担任ACL、NeurIPS 等相关会议的程序委员会委员和审稿人,EMNLP2020 和 IJCAI2021 的领域主席,期刊 Neurocomputing 的编委 Associate Editor。他在工业界工作期间负责了多个语言理解、文本生成和智能对话相关重要项目的算法研发和产品发布。他曾获 2021 年度南京航空航天大学"长空学者"、ACM 南京分会 2021 年度新星奖。主持和参与多个项目,如国家重点研发计划、国家自然基金项目、CCF-腾讯犀牛鸟基金、CCF-智谱大模型基金、CCF-百度松果基金等。

8. 李 鹏

讲者:李 鹏
讲者单位:清华大学
题目:基于智能体的自主科学发现研究综述
报告简介:近期的研究表明,大模型智能体在科学研究的各个关键环节中能够为人类提供有效支持。然而,大模型智能体是否具备自主产生科学发现的能力,仍是一个尚未解决的开放性问题。本文将系统回顾大模型智能体在文献调研、提案提出、实验执行与系统性证伪等科研核心环节中的研究进展与应用实践,介绍若干具有代表性的端到端自主科学发现系统的设计思路,并进一步探讨人工智能实现全自主科学发现所面临的主要挑战与发展前景。
讲者简介:李鹏,清华大学智能产业研究院副研究员,主要研究兴趣包括大模型、智能体、AI4Math等,在人工智能重要国际会议与期刊发表论文90余篇,曾获ACL 2023杰出论文奖,曾在多个国际上深具影响力的榜单上超过Google Research、OpenAI等团队获得第一名,主持科技创新2030重大项目课题、国家自然科学基金面上项目等科技项目,曾任ACL、EMNLP、NAACL等重要国际会议领域主席等。研究成果在百度、腾讯微信等千万级日活产品中获得应用并取得显著成效,获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖。

9. 陈玉博

讲者:陈玉博
讲者单位:中国科学院自动化研究所
题目:大语言模型知识增强研究综述
报告简介:近年来,大语言模型在知识密集型的自然语言处理任务上取得了令人瞩目的进步。这似乎表明,大语言模型能够自发地从语料中学习大量知识,并隐式地保存在参数之中。然而,这一现象的背后机理仍然萦绕着许多谜团。大语言模型如何存储和运用知识?如何按需修改大语言模型中的知识?如何弥补大语言模型的知识不足?这些问题都亟待进一步探索。该报告将重点介绍大语言模型的知识机理分析、知识编辑与知识增强方面的基础知识和近期研究进展。
讲者简介:陈玉博,中国科学院自动化研究所副研究员,入选第五届中国科协青年人才托举工程、中国科学院青年创新促进会会员、全球华人AI青年学者、北京市科技新星,2023、2024年连续入选美国斯坦福大学发布的全球前2%顶尖科学家榜单。研究方向为自然语言处理、知识图谱和大模型,在ACL、NeurIPS、ICLR 等国际重要会议和期刊发表学术论文80余篇,Google Scholar引用量7200余次,其中一篇论文入选ESI高被引论文,两篇论文入选ACL、EMNLP高影响力论文(Paper Digest评选),获得国际语义网大会ISWC 2023(CCF B类会议)最佳张贴论文奖,并五次获得全国大会最佳论文奖。出版学术专著两部《知识图谱》、《知识图谱:算法与实践》,入选十三五国家重点图书出版规划教材。主持国家自然科学基金面上项目、青年基金项目,参与国家自然科学基金重点项目、2030新一代人工智能重大项目等。任中国中文信息学会青年工作委员会副主任,曾获中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖,北京市科学技术进步奖一等奖。

10. 朱庆福

讲者:朱庆福
讲者单位:哈尔滨工业大学
题目:大模型具身规划研究综述
报告简介:具身规划关注智能体如何理解复杂目标、解析任务意图,并生成结构化、可执行的动作。本报告聚焦于大模型在具身场景下的层级任务分解、计划表示与调度执行等关键问题,系统回顾了思维链、程序辅助规划与工具增强执行等关键技术路径,总结其面临的数据稀缺、反馈延迟与可验证性等挑战,为推动通用具身智能体的高效规划能力提供参考。
讲者简介:朱庆福,哈尔滨工业大学计算学部副教授,美国加州大学圣塔芭芭拉分校联合培养博士,中国中文信息学会社会媒体处理专业委员会委员。主要研究方向为代码大模型、预训练。在自然语言处理领域发表论文20余篇,包括国际顶级会议ACL、AAAI、EMNLP等。主持国家自然科学基金青年项目,参与国家重点研发计划、科技创新2030-“新一代人工智能”重大项目等多项。主持研发了哈工大珠算代码大模型。获2024年中国人工智能学会吴文俊人工智能科技进步一等奖等奖项。