预聘研究员 硕士生导师 中国科学院信息工程研究所

地址:北京市海淀区树村路19号,100085

邮箱:lijian9026 [at] iie.ac.cn, superlj666 [at] gmail.com

研究方向

本人研究方向为大规模机器学习,针对传统机器学习模型、大语言模型设计进行泛化理论分析并设计高效、可扩展的算法。主要研究内容包括:

  • 大规模机器学习:为大规模机器学习方法(包括联邦学习、分布式学习、Nyström 采样、随机特征、随机投影等大规模算法),提供更紧致的泛化理论分析并设计高效算法。
  • 高效大语言模型:包括高效 Transformer、大模型压缩方法、参数高效微调方法。
  • 深度学习及大模型理论:为深度学习中良好过拟合、测试误差双下降等现象提供理论分析,并尝试理论探索大模型的独有能力(如涌现、顿悟等现象)。

具体研究方法为通过理论分析设计改进大规模机器学习算法,从而弥合机器学习理论、算法与大规模应用之间的巨大差距。

部分论文 [完整列表] [谷歌学术]

* 通讯作者

  • Optimal Convergence Rates for Distributed Nyström Approximation. [Paper] [Code]
    Jian Li, Yong Liu, Weiping Wang.
    Journal of Machine Learning Research (JMLR), 2023. CCF-A 期刊.

  • Optimal Convergence Rates for Agnostic Nyström Kernel Learning. [Paper]
    Jian Li, Yong Liu, Weiping Wang.
    International Conference on Machine Learning (ICML), 2023. CCF-A 会议.

  • Towards Sharp Analysis for Distributed Learning with Random Features.
    Jian Li, Yong Liu.
    International Joint Conference on Artificial Intelligence (IJCAI), 2023. CCF-A 会议.

  • Semi-supervised vector-valued learning: Improved bounds and algorithms. [Paper]
    Jian Li, Yong Liu, Weiping Wang.
    Pattern Recognition (PR), 2023. CCF-B 期刊 / 中科院一区.

  • Non-IID Federated Learning with Sharper Risk Bound. [Paper]
    Bojian Wei, Jian Li*, Yong Liu, Weiping Wang.
    IEEE Transactions on Neural Networks and Learning Systems (TNNLS), 2022. CCF-B 期刊 / 中科院一区.

  • Convolutional Spectral Kernel Learning with Generalization Guarantees. [Paper] [Code]
    Jian Li, Yong Liu, Weiping Wang.
    Artificial Intelligence (AI), 2022. CCF-A 期刊 / 中科院一区.

  • Non-IID Distributed Learning with Optimal Mixture Weights. [Paper]
    Jian Li, Bojian Wei, Yong Liu, Weiping Wang.
    European Conference on Machine Learning and Principles and Practice of Knowledge Discovery in Databases (ECML-PKDD), 2022. CCF-B 会议.

  • Ridgeless Regression with Random Features. [Paper] [Code]
    Jian Li, Yong Liu, Yingying Zhang.
    International Joint Conference on Artificial Intelligence (IJCAI), 2022. CCF-A 会议.

  • Federated learning for non-iid data: From theory to algorithm. [Paper] [Presentation] [最佳学生论文奖]
    Bojian Wei, Jian Li*, Yong Liu, Weiping Wang.
    Pacific Rim International Conference on Artificial Intelligence (PRICAI), 2021. CCF-C 会议.

  • Automated Spectral Kernel Learning. [Paper] [Poster] [Code]
    Jian Li, Yong Liu, Weiping Wang.
    AAAI Conference on Artificial Intelligence (AAAI), 2020. CCF-A 会议.

  • Multi-Class Learning: From Theory to Algorithm. [Paper] [Poster] [Sildes] [3-minute video] [Code]
    Jian Li, Yong Liu, Rong Yin, Hua Zhang, Lizhong Ding, Weiping Wang.
    Advances in Neural Information Processing Systems 31 (NeurIPS), 2018. CCF-A 会议.

主持项目

  • 国家自然科学基金青年基金 (No. 62106257),30万元。
    面向大规模结构化预测的自动谱核学习研究。

  • 国家重点研发项目子课题 (2022YFB3105302.2),120万元。
    跨平台异质性数据聚合与协同技术。

  • 中国科学院特别研究助理资助,80万元。
    大规模小样本自动化机器学习。

  • 中国科学院信息工程研究所优才计划B类, 预聘(正高)研究员。

指导学生

  • 博士研究生
    • 🎓康艺霖(2018-2023),差分隐私。 发表论文:Computers & Security、CIKM 2022、ICCS 2023。毕业去向:紫金山实验室。
    • 朱勋宇(2020-至今),神经网络结构搜索。发表论文:ICDM 2021。
    • 车博轩(2020-至今),高效图神经网络。
  • 硕士研究生
    • 🎓韦博舰(2019-2022),联邦学习。发表论文:PRICAI 2021 (最佳学生论文奖)、ECML-PKDD 2022、TNNLS、IJCNN 2023。毕业去向:中国银行总行管培生。
    • 张旭宁(2023-至今),联邦学习。武汉大学优秀学士论文奖

荣誉称号

  • PRICAI 2021 最佳学生论文奖。
  • 2020年北京市优秀毕业生。
  • 2020年中国科学院大学(国科大)优秀毕业生。
  • 2020年中国科学院信息工程研究所优秀毕业生。
  • 2019年博士研究生国家奖学金。
  • 2019年朱李月华优秀博士生奖。
  • 2019年中科院院长优秀奖。
  • 2018年博士研究生国家奖学金。
  • 2018年中科院信工所所长优秀奖。

教育背景

  • 2015.09 - 2020.07,中国科学院大学网络空间安全专业,工学博士,导师:王伟平。博士学位论文:大规模半监督的核方法模型选择研究
  • 2011.09 - 2015.07,东北大学软件工程专业(英语国际班),工学学士。

学术服务

  • 程序委员或审稿人
    • 会议:ICML、NeurIPS、ICLR、AAAI、IJCAI、ECAI
    • 期刊:TPAMI、JMLR