刘钰

博士、讲师

基本信息

办公电话:18701517219 电子邮件: yul@bjtu.edu.cn
通讯地址:北京市海淀区上园村3号北京交通大学九号教学楼西203 邮编:100044

个人简介

刘钰博士,现任讲师、硕士生导师。主要研究方向为大规模图上的计算与学习,以及图数据库关键技术具体包括大规模图数据上的高效图算法图神经网络模型及应用、融合图学习的图算法图数据库等新型数据库关键技术。在上述方向发表国际顶级会议和期刊论文(CCF A类)多篇,包括VLDB、SIGMOD、TKDE、ICDE、VLDB Journal等。主持国家自然科学青年基金CCF-腾讯犀牛鸟科研基金腾讯犀牛鸟专项研究计划北京大学医信交叉种子基金等高水平研究项目,作为课题骨干参与多项国家自然科学重点基金北京通用人工智能研究院、华为2012、MSRA Research Grant等多个重要研究项目。参与的华为合作研究获2023年(第3届)中国工业与应用数学学会(CSIAM)应用数学成果落地认证主持的CCF-腾讯犀牛鸟科研基金获评优秀专利奖现为中国计算机学会(CCF)数据库专委会执行委员,国家级数据库课程虚拟教研室成员,并参与图数据库国标、团标制定工作

刘钰于2011年毕业于山东大学计算机科学与技术学院,获工学学士学位;2014年毕业于中国人民大学信息学院,获工学硕士学位,师从Jiaheng Lu(陆嘉恒)教授;2018年毕业于中国人民大学信息学院,获工学博士学位,师从魏哲巍教授和陆嘉恒教授。2018年至2021年,受聘博雅博士后(讲师职称),在北京大学王选计算机研究所数据管理实验室从事研究工作,合作导师为邹磊教授。自2021年7月起,受聘北京交通大学计算机与信息技术学院讲师。于2021年至2022年兼聘为北京大学重庆大数据研究院特聘研究员。

研究兴趣和研究生培养

研究兴趣

(1)大规模图上重要图计算问题的算法优化和分析

理论层面:研究节点相似度计算(Node Similarity Computation)(子)图匹配((Sub)Graph Matching and Counting)可达性(Reachability)三角形计数(Triangle Counting)关联子图查询(s-t SubGraph Query)等经典图计算问题的高效图算法,尤其是面向现实世界的真实图(Real-World Graphs)性质的算法优化和理论分析方法,从而降低理论计算复杂度,提升实际计算效率,并拓展新的图算法设计和分析思路。相应的,研究真实图的关键性质、生成机制与模型,和大规模仿真图的高效生成算法。

应用层面:上述图计算问题在金融领域、公共安全等方面存在重要应用。面向独立自主的国产图数据库系统(如gStore)和特定应用场景,实现上述算法的适配和落地

(2)图神经网络(Graph Neural Network, GNN)模型及应用

理论层面:研究①大规模图上的图神经网络模型(Scalable GNN)②动态和时序图神经网络(GNN on Dynamic Graphs)③有监督和无监督图对齐(Supervised/Unsupervised Graph Alignment,提升模型的预测精度和可扩展性;

融合图学习模型的图算法,如子图计数(Subgraph Counting)等图数据库关键问题和最大独立集等经典的组合优化(Combinatorial Optimization)问题,通过扩展GNN面向图问题的表达能力,实现较传统启发式算法和近似算法的提升。

应用层面:①地图定位和匹配(Map Matching)地铁基站定位等基于位置的服务(Location-based Service, LBS)中的关键问题;②面向化学领域的分子和蛋白质结构、性质预测(与北京大学化学院合作);③面向国产图数据库系统构建图学习模块

以图算法和图学习模型的上述研究为基础,研究图数据库(Graph Database)、多模数据库(Multi-Model Database)的关键操作和算子的高效实现技术,从图数据结构的视角加速分析型和事务型查询的执行效率,并与系统原型和技术落地紧密结合。


研究生培养

每年招收2-3名研究生(包含专业硕士),其中侧重科研学术方向1-2名,侧重工程技术方向1

侧重科研学术方向的学术/专业硕士研究生科研导向的本科实习生要求
  • 经过一段时间的培养建立图算法、图机器学习某个研究方向较为扎实的知识基础,熟悉具体研究方向的相关技术、代表性方法和前沿趋势;
  • 针对某一具体研究问题进行深入探索,在导师的合作和指导下参与完成高水平研究,参与发表国际顶级会议期刊论文(CCF-A类),并要求逐步从参与到主导研究;
  • 与北京大学王选计算机研究所、中国人民大学高瓴人工智能学院、信息学院的部分团队在科研层面紧密合作,进行研究导向的外派实习,共同进行学生培养
  • 与腾讯、华为、阿里等企业的研发部门开展具体研究和技术落地层面的紧密合作;
  • 在研究生期间,支持进行2次为期3个月左右的企业实习(如互联网大厂或领域内头部初创公司)
  • 为有意进一步深造(本科实习生攻读硕士或博士、硕士生攻读博士)且研究水平优秀者提供交流机会和申请支持

侧重工程技术方向的专业硕士研究生(主要为非全日制硕士研究生),要求

  • 深度参与国产数据库系统、图学习系统、各类国家级项目的研发、落地和应用,并结合关键技术问题进行部分创新;
  • 非全日制硕士研究生要求全脱产,参与gStore相关系统或重大国家项目的研发工作;
  • 在导师的合作和指导下参与部分高水平研究;
  • 在研究生期间,支持进行2次为期3个月左右的企业实习(如互联网大厂或领域内头部初创公司)。


研究方向

  • 数据与知识工程
  • 人工智能
  • 计算机技术
  • 软件工程
  • 网络与信息安全
  • 人工智能及应用
  • 大数据技术与工程

指导学生

招收计划本校保研且对Graph相关方向感兴趣的2021级实习生~ ⊙ω⊙

—————————————————————————————————————————————

研究生:

2024级(准研一):郭宗申,欧阳煜威,王驰

2023级: 孙越天(学术硕士),王泽璇(学术硕士)

2022级: 薛梦阳(专业硕士),曾子源(专业硕士,联合指导),陈嵩阳(工程博士,联合指导)

2021级: 赵英豪(学术硕士,联合指导),罗威(学术硕士,联合指导


已毕业:

2021级: 王海旭(专业硕士,联合指导),去向:字节跳动

                宋宇超(专业硕士,联合指导),去向:地方公务员

2020级: 刘睿(非全日制专业硕士,联合指导),去向:中科院某所(青岛)

2019级: 雷李想(学术硕士,联合指导),去向:阿里巴巴

—————————————————————————————————————————————

本科生(实习生及毕业设计):

科研导向:马嘉璐(2022级),曲凤泽(2022级),张伟超(2022级)


已毕业:

2019级:孙越天,去向:本校保研(校级优秀毕设)

2018级:吴洪飞,去向:香港理工大学硕士

学术讲座

1. Yu Liu, Qingsong Guo, Jiaheng Lu. Fusion of Relational and Graph Database Techniques: An Emerging Trend. DASFAA 2023 Tutorial.  

论文/期刊

  1. Qian Ge+, Yu Liu+*, Yinghao Zhao, Yuetian Sun, Lei Zou, Yuxing Chen, and Anqun Pan. Efficient and Accurate SimRank-based Similarity Joins: Experiments, Analysis, and Improvement. Accepted by VLDB 2024. (CCF-A类会议,数据管理领域国际顶级会议, 第一作者为本人协助指导的硕士研究生)
  2. Yu Liu+, Qian Ge+, Wei Luo, Qiang Huang*, Lei Zou, Haixu Wang, Xin Li, and Chang Liu. GraphMM: Graph-based Vehicular Map Matching by Leveraging Trajectory and Road Correlations. Accepted by TKDE (2023). CCF-A类期刊,数据管理领域国际顶级期刊
  3. Yue Pang, Lei Zou*, and Yu LiuIFCA: Index-Free Community-Aware Reachability Processing Over Large Dynamic Graphs. Accepted by ICDE 2023. CCF-A类会议,数据管理领域国际顶级会议第一作者为本人协助指导的博士研究生
  4. Yao Shi, Yu Liu, and Lei Zou*. ForGen: Autoregressive Generation of Sparse Graphs with Preferential Forest. Accepted by APWeb-WAIM2022 (CCF-C类会议,第一作者为本人协助指导的硕士研究生)
  5. Yu Liu, Lei Zou*, and Zhewei Wei. Building Graphs at Scale via Sequence of Edges: Model and Generation Algorithms. ICDE 2022 (Poster). (CCF-A类会议,数据管理领域国际顶级会议
  6. Yu Liu, Lei Zou*, and Zhewei Wei. Building Graphs at Scale via Sequence of Edges: Model and Generation Algorithms. TKDE 2021. (CCF-A类期刊,数据管理领域国际顶级期刊
  7. Hanzhi Wang, Zhewei Wei*, Yu Liu, Ye Yuan, Xiaoyong Du, and Ji-Rong Wen. ExactSim: Bechmarking Single-Source SimRank Algorithms with High-Precision Ground Truths. VLDB Journal 2021. (CCF-A类期刊,数据管理领域国际顶级期刊
  8. Lin Hu, Lei Zou*, and Yu Liu. Accelerating Triangle Counting on GPU. Accepted by SIGMOD 2021. (CCF-A 类论文,数据管理领域国际顶级会议,第一作者为本人协助指导的博士研究生)
  9. Yu Liu, Qian Ge, Yue Pang, and Lei Zou*. Hop-constrained Subgraph Query and Summarization on Large Graphs. Database Systems for Advanced Applications (DASFAA 2021), International Workshop on Graph Data Management and Analysis (GDMA).
  10. Jing Li, Yu Liu, and Lei Zou*. DynGCN: A Dynamic Graph Convolutional Network Based on Spatial-Temporal Modeling. 21st International Conference on Web Information Systems Engineering (WISE 2020). (CCF-C 类论文,第一作者为本人协助指导的硕士研究生)
  11. 李荆,刘钰,邹磊*. 基于时空建模的动态图神经网络模型. 北京大学学报自然科学版 (2020).
  12. Yu Liu, Lei Zou, Qian Ge, and Zhewei Wei*. SimTab: Accuracy-Guaranteed SimRank Queries through Tighter Confidence Bounds and Multi-Armed Bandits. International Conference on Very Large Databases (VLDB), volume 13, issue 11, pages 2202-2214, 2020. (CCF-A类论文,数据管理领域国际顶级会议
  13. Zhewei Wei, Xiaodong He, Xiaokui Xiao, Sibo Wang, Yu Liu, Xiaoyong Du, and Ji-Rong Wen*. PRSim: Sublinear Time SimRank Computation on Large Power-Law Graphs. ACM SIGMOD International Conference on Management of Data (SIGMOD2019), pages 1042-1059. (CCF-A类论文,数据管理领域国际顶级会议
  14. Yu Liu, Bolong Zheng, Xiaodong He, Zhewei Wei*, Xiaokui Xiao, Kai Zheng, and Jiaheng Lu. ProbeSim: Scalable Single Source and Top-$k$ SimRank Computations on Dynamic Graphs. International Conference on Very Large Databases (VLDB), volume 11, issue 1, pages 14-26, 2018. (CCF-A类论文,数据管理领域国际顶级会议
  15. Yu Liu*, Jiaheng Lu, Hua Yang, Xiaokui Xiao, and Zhewei Wei. Towards Maximum Independent Sets on Massive Graphs. International Conference on Very Large Databases (VLDB), volume 8, issue 13, pages 2122-2133, 2016. (CCF-A类论文,数据管理领域国际顶级会议

科研项目

  1. 红果园横向(JWKJW外协项目):动态和时空图学习新型算法数据采集与测试服务,2024-2025,主持,36万元
  2. 红果园横向(某外协项目):车辆用油行为分析模型研究与开发测试,2024,主持,15万元
  3. 国家自然科学基金面上基金:模型感知的数据质量管理技术研究,2024-2027,参与
  4. JWKJW外协项目:面向领域的多模态数据采集与知识库构建,2022-2023,主持,30万元
  5. 国家自然科学基金青年基金:大规模动态图数据的高效相似性计算,2023-2025,主持,30万元
  6. CCF-腾讯犀牛鸟科研基金:面向图视角的多模数据库高效查询与计算技术研究,2022,主持,15万元
  7. 腾讯犀牛鸟大出行专项研究计划:面向地图定位的大规模图神经网络模型与高效算法,2022,主持,30万元
  8. 人大金仓:多模数据库技术演进及趋势洞察分析,2022,主持,10万元
  9. 校人才基金(基本科研业务费):大规模图上的相似度计算技术研究,2022-2024,主持,20万元
  10. XTB: JZJ起飞调度管理软件, 2022, 主持,26.5万元
  11. 北京通用人工智能研究院/北京大学人工智能研究院:时空域多模态知识库构建及应用,2021-2023,参与
  12. 华为:图流上的高效规则路径查询算法研究技术,2021,参与
  13. 国家自然科学基金区域联合基金(重点):安全高效的大规模图数据管理关键技术研究,参与
  14. 华为2012:基于真实图性质的图高效计算,2020,主要参与人
  15. 国家自然科学基金重点基金:大规模图的复杂性分析与高效计算,2020-2024,主要参与人(协作经费20万元)
  16. JWKJW项目:***的图数据管理系统,2019-2020,主要参与人
  17. 北京大学医信交叉种子基金:借助移动医疗提高儿童慢性肾脏病依从性的探索研究,2019,主持(联合),20万元
  18. MSRA:Scalable and Inductive Graph Representation Learning on Large Knowledge Graphs,2019,主要参与人
  19. JWKJW项目:***的图数据管理系统,2018-2019,主要参与人
  20. 国家自然科学基金重点基金:跨模态大数据实时交互式分析,2019-2023,参与(学生身份)

教学工作

数据库系统原理(本科生)

数据仓库与大数据工程(非全日制专业硕士)

大数据技术(本研跨学科课程群)

获奖与荣誉

1. 2022年度CCF-腾讯犀牛鸟科研基金,优秀专利奖

2. 嵌入式低资源环境下图模式匹配方法及应用,2023年(第三届)CSIAM应用数学落地成果认证(第3完成人)

社会兼职

CCF数据库专业委员会执行委员

Program Committee MemberDASFAA 2022 GDMA Workshop, WISE 2021 Demo

Reviewer: IEEE TKDE (2019-), PVLDB 2021, WWW Journal (2021-), Big Data Research (2021-), KDD 2022, ICML 2022, NeurIPS 2022, 计算机学报 (2021-)