刘方辉 [English version]

刘方辉,上海交通大学自然科学研究院与数学科学学院长聘教轨副教授。研究方向为机器学习数学理论与大模型机理分析。其主要研究工作包括函数空间视角下的机器学习理论、尺度扩展下的泛化理论,并进一步推动其在大模型微调与参数高效训练中的应用以及面向研究级别的大模型推理系统。
2014年本科毕业于哈尔滨工业大学自动化系,2019 年博士毕业于上海交通大学,曾在 KU Leuven、EPFL 从事博士后研究,之后在英国 University of Warwick担任助理教授,兼任离散数学与应用中心成员及理论计算机组客座研究员。2023年入选国家高层次人才青年项目(海外),2024年AAAI新教师奖,2025年TUM 全球访问教授计划,2026年美国美国数学与统计创新研究所(IMSI)长期访问学者资助项目。主办 NeurIPS 2024“大模型微调:从理论到应用”研讨会,在 ICASSP’23、CVPR’23、ISIT’24 等国际顶级会议上主讲tutorial。担任NeurIPS、ICLR、AISTATS等会议领域主席。
邮箱: x@y with x=fanghui.liu, y=sjtu.edu.cn or warwick.ac.uk or epfl.ch
我们正在组织IJCV专刊: IJCV Special Issue on Post-Training in Large Language Models for Computer Vision
研究兴趣
我的研究方向为机器学习数学理论、有理论保证的高效算法设计、大模型机理分析。核心视角在于学习效率,并同时关注其理论层面与实证层面。我的研究始终致力于回答两个紧密相关的问题:一是如何在理论层面刻画与处理非线性,二是如何在严格理论指导下,在实践中对非线性进行精确且高效的近似。这一问题长期以来贯穿于科学、技术与工程等多个领域,也是其中的核心挑战之一。

我目前的研究工作(包括既往、正在进行以及未来的研究)主要聚焦于以下两个方向:
机器学习数学理论: 1)高维机器学习的逼近与泛化,函数空间理论,计算-统计效率鸿沟(computational-statistical gaps);2)机器学习的尺度泛化理论(模型性能随数据规模、 模型规模尺度扩张的规律),包括模型有效容量的分析与刻画,进而指导模型设计与训练等;如何精确刻画机器学习模型泛化性质,从确定性等价(deterministic equivalence)以及动态平均场理论(dynamical mean field theory)。
相关文章参考[JMLR’24], [NeurIPS’25], [NeurIPS’22]
大语言模型的机理分析: 从经验与理论两个层面拓展我们对大模型机制的认知,例如1)探讨在何时、何处进行微调是必要且有效的,以及微调在精度、效率与鲁棒性方面所能达到的极限;2)推理的定义、评估以及机器学习的Lean语言实现,构建面向研究级别的大模型推理系统,推动ai4math的发展。
相关文章参考[SLT-Lean], [ICLR’26], [ICML’25 Oral], [TPAMI’21]
论文发表与学术报告
我的研究工作具体见英文主页(论文列表)。近五年内相关成果发表在 SIAM、JMLR、NeurIPS、ICML、ICLR、TPAMI共二十余篇。
以上工作得到了国家自然科学基金委(NSFC)、英国皇家学会(Royal Society)、英国艾伦·图灵研究所(Alan Turing Institute)、德国学术交流中心(DAAD)以及谷歌(Google)的资助。与Alberta、Amazon、ENS Paris、EPFL、INRIA、IST Austria、LSE、LMU、Madison、Northwestern、Oxford、Stuttgart、TUM、UBC、UC Berkeley、UCL、UCLA等研究机构/企业(Google DeepMind,字节、阿里、华为)建立交流合作。 如果你对我的研究感兴趣,可进一步参考我的学术报告内容。
招生信息
招收2026/2027年9月入学的硕士生、博士生。“自然科学研究院成立的目的是为了在以工科著称的交大打造一个高端的理科研究和交叉研究的学术平台,通过聚集一批优秀的应用数学、统计、物理、生物、计算机等学科优秀人才,催生新的交叉学科的学术增长点和学术前沿方向,产生一批有国际影响和对国家经济与社会发展有重要推动作用的学术成果,并培养一批杰出的人才。”上海交通大学前任校长张杰担任首任院长。
感兴趣的学生请通过电子邮件向我发送你的简历(CV)和成绩单,并附上一段简要说明,介绍你的研究兴趣以及你为什么希望与我工作。由于申请咨询数量较多,恕不能回复所有相关邮件;但如果你的研究兴趣与我的研究方向相符,我会与你联系。如果你是本科生,具有较强的自我驱动力、较好的数学基础或编程能力或思维活跃,也欢迎联系。 Feel free to write the email in English if you prefer.
此外,若你对前往英国华威大学攻读博士学位感兴趣,我也非常乐意提供进一步的介绍与推荐。华威大学在数学、统计学及理论计算机科学等方向具备显著的学术实力。例如,Martin Hairer教授在华威大学工作期间获得了2014年菲尔兹奖;华威大学理论计算机科学研究组在该领域的顶级会议(例如FOCS、STOC与SODA等)屡获最佳论文奖。
学生
我在上海交通大学的学生包括
我在华威大学的学生包括
Yuanhe Zhang (2024.10入学,ICML’25 Oral, ICLR’26)
Joao Felipe Lobo Pevidor (2025.10入学)
Yichen Wang (访问学生,目前UW-Madison博士在读,NeurIPS’25)
我在EPFL、KU Leuven作为日常导师带过以下学生的本科生毕设、硕士论文、博士项目
Yihang Chen (ICLR’24 Spotlight, ICML’24, 目前UCLA博士在读)
Elias Abad Rocamora (NeurIPS’22, ICLR’24, ICML’24, 即将入职谷歌DeepMind)
Yongtao Wu (NeurIPS’22, NeurIPS’23, ICLR’24, 目前EPFL博士在读)
Zhenyu Zhu (NeurIPS’22, ICML’23, ICLR’25 目前EPFL博士在读)
Edmund Hofflin (目前牛津大学博士在读)
教学
我已获得英国Advance HE Fellow(FHEA)资格认证,该认证基于英国高等教育教学与学习支持专业标准框架(Professional Standards Framework, PSF),以表彰在高等教育教学与学习支持方面达到的专业标准。 我在华威大学承担以下课程的教学工作:
CS416 Optimisation methods
CS147 Discrete Mathematics and Its Applications 2
