刘钰

博士、讲师

基本信息

办公电话:18701517219 电子邮件: yul@bjtu.edu.cn
通讯地址:北京市海淀区上园村3号北京交通大学九号教学楼西203 邮编:100044

个人简介

刘钰博士,现任讲师、硕士生导师。主要研究方向为大规模图上计算与学习关键技术具体包括传统图算法优化与分析、融合图表示学习的图算法设计(neuralized graph algorithms)、面向复杂图学习任务的机器学习理论、高效的图深度学习算法、Graphs4DeepLearning。在上述方向发表国际顶级会议和期刊论文(CCF A类)多篇,包括VLDB、SIGMOD、TKDE、ICDE、VLDB Journal等。主持国家自然科学青年基金CCF-腾讯犀牛鸟科研基金腾讯犀牛鸟专项研究计划北京大学医信交叉种子基金等高水平研究项目,作为课题骨干参与多项国家自然科学重点基金北京通用人工智能研究院、华为2012、MSRA Research Grant等多个重要研究项目。参与的华为合作研究获2023年(第3届)中国工业与应用数学学会(CSIAM)应用数学成果落地认证主持的CCF-腾讯犀牛鸟科研基金获评优秀专利奖现为中国计算机学会(CCF)数据库专委会执行委员,国家级数据库课程虚拟教研室成员,并参与图数据库国标、团标制定工作

刘钰于2011年毕业于山东大学计算机科学与技术学院,获工学学士学位;2014年毕业于中国人民大学信息学院,获工学硕士学位,师从Jiaheng Lu(陆嘉恒)教授;2018年毕业于中国人民大学信息学院,获工学博士学位,师从魏哲巍教授和陆嘉恒教授。2018年至2021年,受聘博雅博士后(讲师职称),在北京大学王选计算机研究所数据管理实验室从事研究工作,合作导师为邹磊教授。自2021年7月起,受聘北京交通大学计算机与信息技术学院讲师。于2021年至2022年兼聘为北京大学重庆大数据研究院研究员。

研究兴趣和研究生培养

研究兴趣

1. 大规模图上重要图计算问题的算法优化和分析

(1)传统图算法优化与分析

面向现实世界应用产生的真实图(real-world graphs)所具备的性质,针对节点相似度计算(node similarity computation)、子图匹配和相似度搜索(subgraph matching/similarity search)、可达性(reachability)、关联子图查询(s-t SubGraph Query)等经典图计算问题,研究图算法优化和理论分析方法,从而降低理论计算复杂度,提升实际计算效率,并拓展新的图算法设计和分析思路。

(2)融合图表示学习的图算法设计(neuralized graph algorithms)

针对子图匹配和计数(subgraph matching/counting)、图编辑距离(graph edit distance, GED)计算、图对齐(graph alignment)等图计算问题,结合图深度学习(如图神经网络)和传统图算法设计思想,利用图表示学习改进传统启发式图算法设计,利用传统思路保证算法关键性质和计算效率。重点关注启发式算法已经难以优化的、高计算复杂度甚至是NP难图问题的精确和近似算法。


2. 图机器学习理论及其领域应用

(1)面向复杂图学习任务的机器学习理论

针对无法建模为节点分类(node classification)、链接预测(link prediction)和(子)图分类((子)graph classification)的、特别是问题输出规模较大的图学习问题,设计图学习模型和算法。具体包括:

①图挖掘算法,例如子图匹配和计数(subgraph matching/counting)、图编辑距离(graph edit distance, GED)计算、图对齐(graph alignment)、图社区发现(community detection)等;
②图迁移学习与小样本学习方法(graph transfer learning and few-shot learning),研究少样本甚至是零样本条件下上述问题的有效学习;
③组合优化(combinatorial optimization)问题求解,例如最大独立集(maximum independent set)问题等。

(2)高效的图深度学习算法

主要面向动态和时序图(dynamic/temporal graphs)、时序异质图(temporal heterogeneous graphs)研究高效的图神经网络(graph neural network, GNN)和graph Transformer模型。
此外,研究(1)和(4)中图学习模型的训练预测效率和可扩展性(scalability)。

(3)Graphs4DL

探究图在深度神经网络优化领域的前沿研究方向。主要包括
①融合图学习的多模态学习模型(multi-modal learning with graphs):利用图学习建模复杂关联关系,有效融合多模态表示学习;
利用网络科学和图相关理论对大模型进行剪枝和轻量化

(4)领域应用

①地图定位和匹配(Map Matching)、地铁基站定位等基于位置的服务(Location-based Service, LBS)中的关键问题
②面向化学领域的分子和蛋白质结构、性质预测,例如核磁谱图同构快速指认(与北京大学化学院合作)



研究生培养

每年招收2-3名研究生(包含专业硕士),其中侧重科研学术方向1-2名,侧重工程技术方向1

侧重科研学术方向的学术/专业硕士研究生科研导向的本科实习生要求
  • 经过一段时间的培养建立图算法、图机器学习某个研究方向较为扎实的知识基础,熟悉具体研究方向的相关技术、代表性方法和前沿趋势;
  • 针对某一具体研究问题进行深入探索,在导师的合作和指导下参与完成高水平研究,以第一作者身份发表国际顶级会议期刊论文(CCF-A类),并要求逐步从参与到主导研究;
  • 与北京大学王选计算机研究所、中国人民大学高瓴人工智能学院、信息学院的部分团队在科研层面紧密合作,进行研究导向的外派实习,共同进行学生培养
  • 与腾讯、华为、阿里等企业的研发部门开展具体研究和技术落地层面的紧密合作;
  • 在研究生期间,支持进行2次为期3个月左右的企业实习(如互联网大厂或领域内头部初创公司)
  • 为有意进一步深造(本科实习生攻读硕士或博士、硕士生攻读博士)且研究水平优秀者提供交流机会和申请支持

侧重工程技术方向的专业硕士研究生(主要为非全日制硕士研究生),要求

  • 深度参与国产数据库系统、图学习系统、各类国家级项目的研发、落地和应用,并结合关键技术问题进行部分创新;
  • 非全日制硕士研究生要求全脱产,参与gStore相关系统或重大工程任务的研发工作;
  • 在导师的合作和指导下参与部分高水平研究;
  • 在研究生期间,支持进行2次为期3个月左右的企业实习(如互联网大厂或领域内头部初创公司)。


研究方向

  • 数据与知识工程
  • 人工智能
  • 计算机技术
  • 软件工程
  • 大数据技术与工程
  • 机器学习与认知计算
  • 新一代电子信息技术

指导学生

欢迎对Graph Algorithms/Learning/Systems相关方向感兴趣的2021级本科生同学报名暑期夏令营~ ⊙ω⊙

附:2024年北京交通大学计算机科学与技术学院全国优秀大学生暑期夏令营通知
https://cs.bjtu.edu.cn/zsjy/yjszs3/yjszs_sszs/202312182.htm

—————————————————————————————————————————————

研究生

在读

2024级:

郭宗申(学术硕士) 研究方向:动态和时序图学习(temporal graph learning algorithms),节点相似度计算(node similarity computation)

欧阳煜威(学术硕士) 研究方向:图对齐(graph alignment),多模态图学习(multi-modal learning with graphs)    

王驰(专业硕士) 研究方向:地图匹配(map matching),多模态图学习(multi-modal learning with graphs   

刘奇(非全日制硕士) 研究方向:多模态图学习(multi-modal learning with graphs

2023级: 

孙越天(学术硕士) 研究方向:节点相似度计算(node similarity computation),地图匹配(map matching)

王泽璇(学术硕士) 研究方向:基于图对齐的核磁谱图同构快速指认(北大化学院合作),子图匹配与计数(neural subgraph matching/counting),多模态图学习(multi-modal learning with graphs)

2022级: 

陈嵩阳(工程博士,联合指导) 研究方向:图对齐(graph alignment)


毕业

2022级: 

薛梦阳(专业硕士) 去向:农行数据中心 研究方向:地铁基站定位(腾讯合作) 硕士论文:基于图建模与表示学习的地铁基站定位研究

曾子源(专业硕士,联合指导)去向:华为(上海) 研究方向:无监督图对齐 硕士论文:融合图表示与最优传输的无监督图对齐方法

2021级: 

王海旭(专业硕士,联合指导) 去向:字节跳动 研究方向:地图匹配(腾讯合作) 硕士论文:基于图建模与标签关联性学习的地图匹配技术研究

宋宇超(专业硕士,联合指导) 去向:地方公务员 研究方向:调度问题 硕士论文:基于图表示学习的货运空车调度算法研究

赵英豪(学术硕士,联合指导) 去向:某部公务员 研究方向:SimRank节点相似度计算 硕士论文:大规模图上的SimRank节点相似度计算

罗威(学术硕士,联合指导) 去向:成方金融科技 研究方向:地图匹配(腾讯合作) 硕士论文:面向大规模路网的稀疏轨迹地图匹配模型

2020级: 

刘睿(非全日制硕士,联合指导) 去向:中科院某所(青岛)研究方向:流行度预测(popularity prediction) 硕士论文:基于标签传播的流行度预测高效计算研究

2019级: 

雷李想(学术硕士,联合指导) 去向:阿里巴巴 研究方向:点击率预估 硕士论文:基于域内特征相似性的点击率预估数据增强

—————————————————————————————————————————————

本科生(进组实习生及毕业设计)

进组实习

马嘉璐(2022级) 研究方向:temporal Graph Transformer

张伟超(2022级) 研究方向:neural Graph Edit Distance (GED) computation


毕业

2020级:

郭宗申 去向:本校保研 毕设论文:增量式单源SimRank图节点相似度查询算法设计与实现

欧阳煜威 去向:本校保研 毕设论文:融合图结构性质的无监督图对齐模型设计与实现(校级优秀毕设)

余彦可 毕设论文:基于大模型和小模型协作的实体匹配算法设计与实现

2019级:

孙越天 去向:本校保研 毕设论文:大规模图上的top-k SimRank相似度查询算法研究(校级优秀毕设)

2018级:

吴洪飞 去向:香港理工大学硕士 毕设论文:大规模图上的GNN高效算法

学术讲座

1. Yu Liu, Qingsong Guo, Jiaheng Lu. Fusion of Relational and Graph Database Techniques: An Emerging Trend. DASFAA 2023 Tutorial.  

论文/期刊

  1. Qian Ge+, Yu Liu+*, Yinghao Zhao, Yuetian Sun, Lei Zou, Yuxing Chen, and Anqun Pan. Efficient and Accurate SimRank-based Similarity Joins: Experiments, Analysis, and Improvement. Accepted by VLDB 2024. (CCF-A类会议,数据管理领域国际顶级会议, 第一作者为本人协助指导的硕士研究生)
  2. Yu Liu+, Qian Ge+, Wei Luo, Qiang Huang*, Lei Zou, Haixu Wang, Xin Li, and Chang Liu. GraphMM: Graph-based Vehicular Map Matching by Leveraging Trajectory and Road Correlations. Accepted by TKDE (2023). CCF-A类期刊,数据管理领域国际顶级期刊
  3. Yue Pang, Lei Zou*, and Yu LiuIFCA: Index-Free Community-Aware Reachability Processing Over Large Dynamic Graphs. Accepted by ICDE 2023. CCF-A类会议,数据管理领域国际顶级会议第一作者为本人协助指导的博士研究生
  4. Yao Shi, Yu Liu, and Lei Zou*. ForGen: Autoregressive Generation of Sparse Graphs with Preferential Forest. Accepted by APWeb-WAIM2022 (CCF-C类会议,第一作者为本人协助指导的硕士研究生)
  5. Yu Liu, Lei Zou*, and Zhewei Wei. Building Graphs at Scale via Sequence of Edges: Model and Generation Algorithms. ICDE 2022 (Poster). (CCF-A类会议,数据管理领域国际顶级会议
  6. Yu Liu, Lei Zou*, and Zhewei Wei. Building Graphs at Scale via Sequence of Edges: Model and Generation Algorithms. TKDE 2021. (CCF-A类期刊,数据管理领域国际顶级期刊
  7. Hanzhi Wang, Zhewei Wei*, Yu Liu, Ye Yuan, Xiaoyong Du, and Ji-Rong Wen. ExactSim: Bechmarking Single-Source SimRank Algorithms with High-Precision Ground Truths. VLDB Journal 2021. (CCF-A类期刊,数据管理领域国际顶级期刊
  8. Lin Hu, Lei Zou*, and Yu Liu. Accelerating Triangle Counting on GPU. Accepted by SIGMOD 2021. (CCF-A 类论文,数据管理领域国际顶级会议,第一作者为本人协助指导的博士研究生)
  9. Yu Liu, Qian Ge, Yue Pang, and Lei Zou*. Hop-constrained Subgraph Query and Summarization on Large Graphs. Database Systems for Advanced Applications (DASFAA 2021), International Workshop on Graph Data Management and Analysis (GDMA).
  10. Jing Li, Yu Liu, and Lei Zou*. DynGCN: A Dynamic Graph Convolutional Network Based on Spatial-Temporal Modeling. 21st International Conference on Web Information Systems Engineering (WISE 2020). (CCF-C 类论文,第一作者为本人协助指导的硕士研究生)
  11. 李荆,刘钰,邹磊*. 基于时空建模的动态图神经网络模型. 北京大学学报自然科学版 (2020).
  12. Yu Liu, Lei Zou, Qian Ge, and Zhewei Wei*. SimTab: Accuracy-Guaranteed SimRank Queries through Tighter Confidence Bounds and Multi-Armed Bandits. International Conference on Very Large Databases (VLDB), volume 13, issue 11, pages 2202-2214, 2020. (CCF-A类论文,数据管理领域国际顶级会议
  13. Zhewei Wei, Xiaodong He, Xiaokui Xiao, Sibo Wang, Yu Liu, Xiaoyong Du, and Ji-Rong Wen*. PRSim: Sublinear Time SimRank Computation on Large Power-Law Graphs. ACM SIGMOD International Conference on Management of Data (SIGMOD2019), pages 1042-1059. (CCF-A类论文,数据管理领域国际顶级会议
  14. Yu Liu, Bolong Zheng, Xiaodong He, Zhewei Wei*, Xiaokui Xiao, Kai Zheng, and Jiaheng Lu. ProbeSim: Scalable Single Source and Top-$k$ SimRank Computations on Dynamic Graphs. International Conference on Very Large Databases (VLDB), volume 11, issue 1, pages 14-26, 2018. (CCF-A类论文,数据管理领域国际顶级会议
  15. Yu Liu*, Jiaheng Lu, Hua Yang, Xiaokui Xiao, and Zhewei Wei. Towards Maximum Independent Sets on Massive Graphs. International Conference on Very Large Databases (VLDB), volume 8, issue 13, pages 2122-2133, 2016. (CCF-A类论文,数据管理领域国际顶级会议

科研项目

  1. 红果园横向(JWKJW外协项目):动态和时空图学习新型算法数据采集与测试服务,2024-2025,主持,36万元
  2. 红果园横向(某外协项目):车辆用油行为分析模型研究与开发测试,2024,主持,15万元
  3. 国家自然科学基金面上基金:模型感知的数据质量管理技术研究,2024-2027,参与
  4. JWKJW外协项目:面向领域的多模态数据采集与知识库构建,2022-2023,主持,30万元
  5. 国家自然科学基金青年基金:大规模动态图数据的高效相似性计算,2023-2025,主持,30万元
  6. CCF-腾讯犀牛鸟科研基金:面向图视角的多模数据库高效查询与计算技术研究,2022,主持,15万元
  7. 腾讯犀牛鸟大出行专项研究计划:面向地图定位的大规模图神经网络模型与高效算法,2022,主持,30万元
  8. 人大金仓:多模数据库技术演进及趋势洞察分析,2022,主持,10万元
  9. 校人才基金(基本科研业务费):大规模图上的相似度计算技术研究,2022-2024,主持,20万元
  10. XTB: JZJ起飞调度管理软件, 2022, 主持,26.5万元
  11. 北京通用人工智能研究院/北京大学人工智能研究院:时空域多模态知识库构建及应用,2021-2023,参与
  12. 华为:图流上的高效规则路径查询算法研究技术,2021,参与
  13. 国家自然科学基金区域联合基金(重点):安全高效的大规模图数据管理关键技术研究,参与
  14. 华为2012:基于真实图性质的图高效计算,2020,主要参与人
  15. 国家自然科学基金重点基金:大规模图的复杂性分析与高效计算,2020-2024,主要参与人(协作经费20万元)
  16. JWKJW项目:***的图数据管理系统,2019-2020,主要参与人
  17. 北京大学医信交叉种子基金:借助移动医疗提高儿童慢性肾脏病依从性的探索研究,2019,主持(联合),20万元
  18. MSRA:Scalable and Inductive Graph Representation Learning on Large Knowledge Graphs,2019,主要参与人
  19. JWKJW项目:***的图数据管理系统,2018-2019,主要参与人
  20. 国家自然科学基金重点基金:跨模态大数据实时交互式分析,2019-2023,参与(学生身份)

教学工作

数据库系统原理(本科生)

大数据技术(本研跨学科课程群)

数据仓库与大数据工程(研究生

获奖与荣誉

1. 2022年度CCF-腾讯犀牛鸟科研基金,优秀专利奖

2. 嵌入式低资源环境下图模式匹配方法及应用,2023年(第三届)CSIAM应用数学落地成果认证(第3完成人)

社会兼职

CCF数据库专业委员会执行委员

Program Committee Member

VLDB 2024 Demo, WAIM-APWeb 2024, DASFAA 2024/2022 GDMA Workshop, WISE 2021 Demo

Reviewer: 

IEEE TKDE (2019-), PVLDB 2021, WWW Journal (2021-), Big Data Research (2021-), KDD 2022, ICML 2022, NeurIPS 2022, 计算机学报 (2021-)