报告时间:2025年10月30日(星期四)15:00–17:00
报告地点:翡翠湖校区翡翠科技楼D501室
报 告 人:楼建光 博士
工作单位:算苗科技(北京)有限公司
举办单位:计算机与信息学院
报告简介:
2022年底ChatGPT的发布石破天惊,让大众第一次看到了通用人工智能的希望。但是,为什么基于Transformer这样一种生成式人工神经网络,用一个非常简单的训练目标训练得到的语言模型,能够点燃通用人工智能的曙光?在这个报告中,我们一起来探讨智能的本质,并从智能本质出发来理解近几年来大模型在通用智能上面的进展,展望大模型的下一步发展方向和研究热点。同时,大模型发展带来了巨大的计算需求,对基础硬件到软件栈提出了新的挑战。本报告将从大模型的计算模式出发,探讨软硬件协同设计的机遇。
报告人简介:
楼建光,博士,现任算苗科技(北京)有限公司(SUNMMIO Technology Ltd)的首席AI科学家,负责领导公司的AI软件生态团队,为先进的AI芯片提供支持。在2025年9月加入算苗科技公司之前,他曾担任微软研究院的首席研究员(Sr. Principal Research Manager),领导一支由研究员和工程师组成的团队,专注于AI相关前沿研究项目,包括交互式数据分析机器人、自动数据理解、程序自动生成、大规模在线系统智能诊断与运维等方面的研究,并将研究成果应用于微软的各大产品之中。他在机器学习、自然语言处理、人工智能以及面向软件系统的AI等领域拥有约20年的研究与应用经验,并在顶级学术会议上发表研究论文超过150篇。