刘钰

博士、副教授

基本信息

办公电话:18701517219 电子邮件: yul@bjtu.edu.cn
通讯地址:北京市海淀区上园村3号北京交通大学知行大厦411 邮编:100044

个人简介

刘钰博士,现任副教授、硕士生导师。研究方向为大规模图计算与学习关键技术,包括图算法优化与分析、神经网络化的图算法(Neural Graph Algorithms)、子图类(Subgraph-level)任务的图学习理论、时序图学习算法、Graph4AI等。在上述方向发表国际顶级会议和期刊论文(CCF A类)多篇,包括VLDB、SIGMOD、TKDE、ICDE、VLDB Journal等。主持国家自然科学青年基金、CCF-腾讯犀牛鸟科研基金、腾讯犀牛鸟专项研究计划、北京大学医信交叉种子基金等高水平研究项目,作为课题骨干参与多项国家自然科学重点基金和北京通用人工智能研究院、华为2012、MSRA Research Grant等多个重要研究项目。参与的华为合作研究获2023年(第3届)中国工业与应用数学学会(CSIAM)应用数学成果落地认证,主持的CCF-腾讯犀牛鸟科研基金获评优秀专利奖。

刘钰于2011年毕业于山东大学计算机科学与技术学院,获工学学士学位;2014年毕业于中国人民大学信息学院,获工学硕士学位,师从Jiaheng Lu(陆嘉恒)教授;2018年毕业于中国人民大学信息学院,获工学博士学位,师从魏哲巍教授和陆嘉恒教授。2018年至2021年,受聘博雅博士后(讲师职称),在北京大学王选计算机研究所数据管理实验室(PKUMOD)从事研究工作,合作导师为邹磊教授。自2021年7月起,任北京交通大学计算机与信息技术学院讲师,自2024年12月起任副教授。于2021年至2022年兼聘为北京大学重庆大数据研究院研究员。

研究兴趣和研究生培养

研究兴趣

1. 大规模图上的算法优化与分析

面向现实世界应用产生的真实图(real-world graphs)所具备的性质,针对节点相似度计算(node similarity computation)、子图匹配和相似度搜索(subgraph matching/similarity search)、可达性(reachability)、关联子图查询(s-t SubGraph Query)等经典图计算问题,研究图算法优化和理论分析方法,降低理论计算复杂度,提升实际计算效率,并拓展新的图算法设计和分析思路。

2. 神经网络化的图算法(Neural Graph Algorithms)

探索结合图表示学习(如图神经网络,graph neural network)与传统图算法设计分析的神经网络化图算法;探索引入图学习模型后算法的表达能力(expressive power)等。

3. 子图类(Subgraph-level)任务的图学习理论

探索除经典的节点分类、链接预测和图分类等学习任务外,问题输出规模较大的子图类任务的图学习理论,主要包括:

(1)图挖掘算法,例如子图匹配和计数(subgraph matching/counting)、图编辑距离(graph edit distance, GED)计算、图对齐(graph alignment)、图社区发现(community detection)等;

(2)面向该类任务的图迁移学习与小样本学习方法(graph transfer learning and few-shot learning),研究少样本甚至是零样本条件下上述问题的有效学习;

(3)组合优化(combinatorial optimization)等计算难问题的近似求解,以及其在行业领域的应用;

(4)面向特定领域应用,如面向化学领域的分子和蛋白质结构、性质预测的核磁谱图同构快速指认等。

4. 时序图学习(Temporal Graph Learning)算法

探索面向动态(dynamic)和时序(temporal)图的深度学习模型,实现时序链接预测(temporal link prediction)等经典任务,和时序图上的子图类学习任务。

5. Graph4AI

探索图在深度神经网络和大模型设计优化中的作用,主要包括多模态图学习(multi-modal learning with graphs)、利用网络科学和图相关理论对大模型进行剪枝和轻量化等;探索图在数据分析挖掘中的应用,例如关系深度学习(relational deep learning)等。


研究生培养

每年招收2-3名研究生(包含专业硕士),其中侧重科研学术方向1-2名,侧重工程技术方向1

侧重科研学术方向的学术/专业硕士研究生科研导向的本科实习生要求
  • 经过一段时间的培养建立图算法、图机器学习某个研究方向较为扎实的知识基础,熟悉具体研究方向的相关技术、代表性方法和前沿趋势;
  • 针对某一具体研究问题进行深入探索,在导师的合作和指导下参与完成高水平研究,以第一作者身份发表国际顶级会议期刊论文(CCF-A类),并要求逐步从参与到主导研究;
  • 与北京大学王选计算机研究所、中国人民大学高瓴人工智能学院部分团队在科研层面紧密合作,共同进行学生培养
  • 与腾讯、华为、阿里等企业的研发部门开展具体研究和技术落地层面的紧密合作;
  • 在研究生期间,支持进行2次为期3个月左右的企业实习(如互联网大厂或领域内头部初创公司)
  • 为有意进一步深造(本科实习生攻读硕士或博士、硕士生攻读博士)且研究水平优秀者提供交流机会和申请支持

侧重工程技术方向的专业硕士研究生,要求

  • 深度参与国产数据库系统、图学习系统、各类国家级项目的研发、落地和应用,并结合关键技术问题进行部分创新;
  • 非全日制硕士研究生要求全脱产,参与gStore等系统或重大工程任务的研发工作;
  • 在导师的合作和指导下参与部分高水平研究;
  • 在研究生期间,支持进行2次为期3个月左右的企业实习(如互联网大厂或领域内头部初创公司)。

研究方向

  • 数据与知识工程
  • 人工智能
  • 机器学习与认知计算
  • 计算机技术
  • 大数据技术与工程
  • 软件工程
  • 新一代电子信息技术

指导学生

欢迎2023/2024级本科生同学进组实习~

欢迎有意2025/2026年攻读博士研究生的同学与我联系~

———————————————————————————————————————————————————————

研究生

2025级:

胡恩 研究方向:图基础模型(graph foundation model)

2024级:

郭宗申 研究方向:动态和时序图学习(temporal graph learning)

欧阳煜威 研究方向:大规模图对齐(scalable graph alignment),子图类(subgraph-level)学习任务

王驰 研究方向:多模态图学习(multi-modal learning with graphs),Graph+LLM

刘奇 研究方向:动态和时序图学习(temporal graph learning),Graph+LLM

2023级: 

孙越天 研究方向:大规模动态图上的增量式单源SimRank查询算法研究

王泽璇 研究方向:基于图对齐的核磁谱图同构快速指认算法研究

2022级: 

陈嵩阳(工程博士,联合指导) 研究方向:图对齐(graph alignment)


本科实习生

马嘉璐(2022级) 研究方向:Temporal Graph Transformer

张伟超(2022级) 研究方向:Neural Graph Edit Distance (GED) Computation

已毕业学生

2022级: 

薛梦阳 硕士论文:基于图建模与表示学习的地铁基站定位研究(腾讯合作) 去向:农行数据中心

曾子源 硕士论文:融合图表示与最优传输的无监督图对齐方法 去向:华为(上海)

2021级: 

王海旭 硕士论文:基于图建模与标签关联性学习的地图匹配技术研究(腾讯合作) 去向:字节跳动

宋宇超 硕士论文:基于图表示学习的货运空车调度算法研究 去向:地方公务员

赵英豪 硕士论文:大规模图上的SimRank节点相似度计算 去向:国家部委公务员

罗威 硕士论文:面向大规模路网的稀疏轨迹地图匹配模型(腾讯合作) 去向:成方金融科技

2020级:

刘睿 硕士论文:基于标签传播的流行度预测高效计算研究 去向:中科院某所(青岛)

2019级:

雷李想 硕士论文:基于域内特征相似性的点击率预估数据增强 去向:阿里巴巴

学术讲座

1. 郑卫国,彭鹏,刘钰,邹磊等人整理. 大规模图计算与智能系统——第十四期CCF秀湖会议报告. 2024

2. Yu Liu, Qingsong Guo, Jiaheng Lu. Fusion of Relational and Graph Database Techniques: An Emerging Trend. DASFAA 2023 Tutorial.  

论文/期刊

  1. Songyang Chen, Youfang Lin, Yu Liu*, Yuwei Ouyang, Zongshen Guo, Lei Zou. Enhancing Robust Semi-supervised Graph Alignment via Adaptive Optimal Transport. World Wide Web(WWW Journal) (CCF-B类期刊,第一作者为本人指导的博士研究生)
  2. Fei Wang, Yu Liu, Lei Zou. Neuralizing Graph Edit Distance Computation with Fine-Grained Matching Cost Prediction. WISE 2024 (CCF-C类会议,第一作者为本人协助指导的硕士研究生)
  3. 罗威,刘钰*,黄强,武志昊. 融合图结构学习和轻量级循环建模的地图匹配方法. 北京大学学报自然科学版 (2024).
  4. Qian Ge+, Yu Liu+*, Yinghao Zhao, Yuetian Sun, Lei Zou, Yuxing Chen, and Anqun Pan. Efficient and Accurate SimRank-based Similarity Joins: Experiments, Analysis, and Improvement. VLDB 2024. (CCF-A类会议,数据管理领域国际顶级会议, 第一作者为本人协助指导的硕士研究生)
  5. Yu Liu+, Qian Ge+, Wei Luo, Qiang Huang*, Lei Zou, Haixu Wang, Xin Li, and Chang Liu. GraphMM: Graph-based Vehicular Map Matching by Leveraging Trajectory and Road Correlations. TKDE 2024. CCF-A类期刊,数据管理领域国际顶级期刊
  6. Yue Pang, Lei Zou*, and Yu LiuIFCA: Index-Free Community-Aware Reachability Processing Over Large Dynamic Graphs. ICDE 2023. CCF-A类会议,数据管理领域国际顶级会议第一作者为本人协助指导的博士研究生
  7. Yao Shi, Yu Liu, and Lei Zou*. ForGen: Autoregressive Generation of Sparse Graphs with Preferential Forest. Accepted by APWeb-WAIM2022 (CCF-C类会议,第一作者为本人协助指导的硕士研究生)
  8. Yu Liu, Lei Zou*, and Zhewei Wei. Building Graphs at Scale via Sequence of Edges: Model and Generation Algorithms. ICDE 2022 (Poster). (CCF-A类会议,数据管理领域国际顶级会议
  9. Yu Liu, Lei Zou*, and Zhewei Wei. Building Graphs at Scale via Sequence of Edges: Model and Generation Algorithms. TKDE 2021. (CCF-A类期刊,数据管理领域国际顶级期刊
  10. Hanzhi Wang, Zhewei Wei*, Yu Liu, Ye Yuan, Xiaoyong Du, and Ji-Rong Wen. ExactSim: Bechmarking Single-Source SimRank Algorithms with High-Precision Ground Truths. VLDB Journal 2021. (CCF-A类期刊,数据管理领域国际顶级期刊
  11. Lin Hu, Lei Zou*, and Yu Liu. Accelerating Triangle Counting on GPU. SIGMOD 2021. (CCF-A 类论文,数据管理领域国际顶级会议,第一作者为本人协助指导的博士研究生)
  12. Yu Liu, Qian Ge, Yue Pang, and Lei Zou*. Hop-constrained Subgraph Query and Summarization on Large Graphs. Database Systems for Advanced Applications (DASFAA 2021), International Workshop on Graph Data Management and Analysis (GDMA).
  13. Jing Li, Yu Liu, and Lei Zou*. DynGCN: A Dynamic Graph Convolutional Network Based on Spatial-Temporal Modeling. 21st International Conference on Web Information Systems Engineering (WISE 2020). (CCF-C 类论文,第一作者为本人协助指导的硕士研究生)
  14. 李荆,刘钰,邹磊*. 基于时空建模的动态图神经网络模型. 北京大学学报自然科学版 (2020).
  15. Yu Liu, Lei Zou, Qian Ge, and Zhewei Wei*. SimTab: Accuracy-Guaranteed SimRank Queries through Tighter Confidence Bounds and Multi-Armed Bandits. International Conference on Very Large Databases (VLDB), volume 13, issue 11, pages 2202-2214, 2020. (CCF-A类论文,数据管理领域国际顶级会议
  16. Zhewei Wei, Xiaodong He, Xiaokui Xiao, Sibo Wang, Yu Liu, Xiaoyong Du, and Ji-Rong Wen*. PRSim: Sublinear Time SimRank Computation on Large Power-Law Graphs. ACM SIGMOD International Conference on Management of Data (SIGMOD2019), pages 1042-1059. (CCF-A类论文,数据管理领域国际顶级会议
  17. Yu Liu, Bolong Zheng, Xiaodong He, Zhewei Wei*, Xiaokui Xiao, Kai Zheng, and Jiaheng Lu. ProbeSim: Scalable Single Source and Top-$k$ SimRank Computations on Dynamic Graphs. International Conference on Very Large Databases (VLDB), volume 11, issue 1, pages 14-26, 2018. (CCF-A类论文,数据管理领域国际顶级会议
  18. Yu Liu*, Jiaheng Lu, Hua Yang, Xiaokui Xiao, and Zhewei Wei. Towards Maximum Independent Sets on Massive Graphs. International Conference on Very Large Databases (VLDB), volume 8, issue 13, pages 2122-2133, 2016. (CCF-A类论文,数据管理领域国际顶级会议

科研项目

  1. 国家级科技委:面向场景的数据仿真生成与模型评测验证,2024-2025,主持(140万元)
  2. 科技委外协:动态和时空图学习新型算法数据采集与测试服务,2024-2025,主持(36万元)
  3. 能源研究所外协:车辆用油行为分析模型研究与开发测试,2024,主持(15万元)
  4. 国家自然科学基金面上基金:模型感知的数据质量管理技术研究,2024-2027,参与
  5. 科技委外协:面向领域的多模态数据采集与知识库构建,2022-2023,主持(30万元)
  6. 国家自然科学基金青年基金:大规模动态图数据的高效相似性计算,2023-2025,主持(30万元)
  7. CCF-腾讯犀牛鸟科研基金:面向图视角的多模数据库高效查询与计算技术研究,2022,主持(15万元)
  8. 腾讯犀牛鸟大出行专项研究计划:面向地图定位的大规模图神经网络模型与高效算法,2022,主持(30万元)
  9. 人大金仓:多模数据库技术演进及趋势洞察分析,2022,主持(10万元)
  10. 校人才基金(基本科研业务费):大规模图上的相似度计算技术研究,2022-2024,主持(20万元)
  11. 系统部:调度管理软件, 2022, 主持(26.5万元)
  12. 北京通用人工智能研究院:时空域多模态知识库构建及应用,2021-2023,参与
  13. 华为:图流上的高效规则路径查询算法研究技术,2021,参与
  14. 国家自然科学基金区域联合基金(重点):安全高效的大规模图数据管理关键技术研究,参与
  15. 华为2012:基于真实图性质的图高效计算,2020,主要参与人
  16. 国家自然科学基金重点基金:大规模图的复杂性分析与高效计算,2020-2024,主要参与人(协作经费20万元)
  17. 科技委:图数据管理系统,2019-2020,主要参与人
  18. 北京大学医信交叉种子基金:借助移动医疗提高儿童慢性肾脏病依从性的探索研究,2019,联合主持(20万元)
  19. MSRA:Scalable and Inductive Graph Representation Learning on Large Knowledge Graphs,2019,主要参与人
  20. 科技委:图数据管理系统,2018-2019,主要参与人
  21. 国家自然科学基金重点基金:跨模态大数据实时交互式分析,2019-2023,参与(学生身份)

教学工作

数据库系统原理(本科生)

大数据技术(本研跨学科课程群)

数据仓库与大数据工程(研究生

获奖与荣誉

1. 2022年度CCF-腾讯犀牛鸟科研基金,优秀专利奖

2. 嵌入式低资源环境下图模式匹配方法及应用,2023年(第三届)CSIAM应用数学落地成果认证(第3完成人)

社会兼职

CCF数据库专业委员会执行委员

Program Committee Member: KDD 2025, WWW 2025, ICDE 2025, VLDB 2024 Demo, WAIM-APWeb 2024, DASFAA 2022/2023/2024 GDMA Workshop, WISE 2021 Demo

Reviewer: IEEE TKDE (2019-), VLDB 2021, WWW Journal (2021-), Big Data Research (2021-), KDD 2022, ICML 2022, NeurIPS 2022, 计算机学报 (2021-)