公告新闻

学术报告通知：大模型与大计算

来源: 时间:2025-10-29

报告时间：2025年10月30日（星期四）15:00–17:00

报告地点：翡翠湖校区翡翠科技楼D501室

报告人：楼建光博士

工作单位：算苗科技（北京）有限公司

举办单位：计算机与信息学院

报告简介：

2022年底ChatGPT的发布石破天惊，让大众第一次看到了通用人工智能的希望。但是，为什么基于Transformer这样一种生成式人工神经网络，用一个非常简单的训练目标训练得到的语言模型，能够点燃通用人工智能的曙光？在这个报告中，我们一起来探讨智能的本质，并从智能本质出发来理解近几年来大模型在通用智能上面的进展，展望大模型的下一步发展方向和研究热点。同时，大模型发展带来了巨大的计算需求，对基础硬件到软件栈提出了新的挑战。本报告将从大模型的计算模式出发，探讨软硬件协同设计的机遇。

报告人简介：

楼建光，博士，现任算苗科技（北京）有限公司（SUNMMIO Technology Ltd）的首席AI科学家，负责领导公司的AI软件生态团队，为先进的AI芯片提供支持。在2025年9月加入算苗科技公司之前，他曾担任微软研究院的首席研究员（Sr. Principal Research Manager），领导一支由研究员和工程师组成的团队，专注于AI相关前沿研究项目，包括交互式数据分析机器人、自动数据理解、程序自动生成、大规模在线系统智能诊断与运维等方面的研究，并将研究成果应用于微软的各大产品之中。他在机器学习、自然语言处理、人工智能以及面向软件系统的AI等领域拥有约20年的研究与应用经验，并在顶级学术会议上发表研究论文超过150篇。