大模型预训练前沿技术报告 ③ | 端侧大模型的高效构建与应用

大模型预训练前沿技术报告系列直播课是由中国中文信息学会计算语言学专业委员会主办，并行科技承办的以大语言模型预训练技术为内容方向的系列公益直播课，旨在分享大模型预训练技术前沿学术成果和普及大模型预训练中的超算应用，面向大模型领域的科研工作者和高校师生展开。

大模型预训练前沿技术报告系列直播课计划共举办四场，固定播出档期为每月第三周周四19:00。每期邀请一位大模型领域的知名专家学者，进行约一小时的学术报告分享。直播课的播出平台为：B站【CIPS计算语言学专委会】、视频号【并行科技】、B站【并行科技】。欢迎观看与交流。

特邀讲者

韩旭，清华大学计算机系博士后，主要研究方向为自然语言处理、大模型、知识计算。在人工智能及自然语言处理领域会议及期刊发表数十篇，Google Scholar他引8000余次。参与创建大模型开源社区OpenBMB，相关开源项目在全球最大开源社区Github累计获得5万余星标。相关成果曾获得教育部自然科学一等奖(排名第三)，世界互联网大会领先科技奖（排名第三）。曾入选中国计算机学会（CCF）优博激励计划、博士后创新人才支持计划、清华大学水木学者计划等人才计划。

直播摘要

基础大模型是当前人工智能领域里程碑式的技术突破，也是支撑人工智能应用的重要基础设施。当前主流基础大模型主要在云侧部署，存在计算资源消耗过大的局限性，阻碍其在实际应用中的推广与普及，也对基础大模型自身的持续演进带来了挑战。本报告从架构改进、算法改进、软硬件协同优化等多个维度出发，介绍如何构建可在端侧部署的高质量大模型，实现对端侧设备的广泛赋能，缓解纯云侧部署大模型存在的问题。

B站观看直播请移步搜索“CIPS计算语言学专委会” B站官方号。