王宁

博士、教授

基本信息

办公电话:010-51688243 电子邮件: nwang@bjtu.edu.cn
通讯地址: 邮编:

教育背景

 


1995/09 – 1998/06,东南大学,计算机科学与工程系,博士

1988/09 – 1991/03东南大学,计算机科学与工程系,硕士

1984/09 – 1988/07东南大学,计算机科学与工程系,学士


研究兴趣

(1)   (1)数据管理&人工智能

大数据时代,面对海量信息以及复杂多样的应用场景,传统数据库技术难以满足需求,机器学习技术因其较强的学习能力,通过对查询负载、数据分布、历史查询性能表现等进行特征抽取和建模,为数据库优化带来新的机遇。课题组主要研究基于学习的数据库基数估计、代价估计、连接顺序选择、索引推荐、SQL语句自动生成等,以实现数据库的自动管理和调优。

(2)   (2)数据准备&数据质量

机器学习需要高质量的训练数据,数据准备是提升机器学习模型性能的关键。课题组围绕实体及属性类型标注、关联关系挖掘、实体对齐和扩充、噪声数据的检测和清洗展开研究,实现自动化的数据准备管道,帮助提升机器学习模型的性能。

(3)   (3)大数据群智计算

群体智能是新一代人工智能的重要研究方向,通过整合互联网大量用户(人群)和计算资源(机群)来处理现有计算技术难以完成的复杂任务。课题组研究人机协作的知识图谱错误检测和修复、众包任务分配和质量控制。

 

学生就业情况:

毕业生就职于华为、腾讯、百度、字节、京东、小米等头部企业,工商银行、农业银行、中国银行、建设银行等大型金融机构以及中国移动、中国电信、中航工业集团有限公司、南瑞集团等大型国企。




招收博士和硕士研究生,欢迎对以上研究方向感兴趣的同学与我联系!



工作经历


2006/05至今北京交通大学,计算机与信息技术学院,教授

2012/03 – 2012/09,美国亚利桑那州立大学,计算机科学系,访问学者

1998/09 – 2006/04, 国家电力公司电力自动化研究院, 高级工程师

1991/03 – 1995/08南京邮电大学,计算机系,讲师

研究方向

  • 数据与知识工程
  • 计算机技术
  • 软件工程
  • 人工智能
  • 大数据技术与工程
  • 计算机软件与理论
  • 新一代电子信息技术

招生专业

  • 计算机科学与技术硕士
  • 计算机技术硕士
  • 软件工程硕士
  • 人工智能硕士
  • 大数据技术与工程硕士
  • 计算机科学与技术博士
  • 新一代电子信息技术(含量子技术等)硕士

科研项目

  • 国家自然科学基金“面上”: 面向机器学习的数据清洗关键技术研究, 2024-2027
  • 自然科学横向项目: 面向多人对话翻译与同传的前沿研究与应用, 2021-2022
  • 自然科学横向项目: 风格迁移神经机器翻译方法研究, 2021-2025
  • 国家重点研发计划-任务: 社区基础数据采集、处理、应用、共享技术, 2018-2021
  • 国家自然科学基金“面上”: 纵向预研基金-国家自然科学基金“面上”-KKA313011533, 2018-2020
  • 基本科研业务费研究生创新项目: 基于众包的网络表格数据清洗和语义恢复, 2017-2018
  • 国家自然科学基金“面上”: 基于多模态超图的社群图像检索研究, 2017-2020
  • 国家自然科学基金“面上”: 基于群智的开放式数据集成与分析技术研究, 2014-2017
  • 北京市教委: 基于语义相似度的领域数字资源即时集成技术研究, 2011-2013
  • 自然科学横向项目: 神朔铁路行车固定设备生产管理信息系统生产调度子系统, 2011-2011
  • 国家自然科学基金“面上”: 基于视觉感知的中国书画图像语义自动分类研究, 2010-2012
  • 教育部: 广东省教育部产学研结合示范基础阳东五金刀剪科技产业化基地五金刀剪企业ERP系统的研究与开发, 2008-2009
  • 自然科学横向项目: 公安部警务合作处援外培训管理系统, 2007-2007
  • 校科技基金: 多媒体数据的XML存储格式及优化技术, 2006-2008

教学工作

主讲课程:

1. 本科必修课程《数据库系统原理》

2. 硕士生专业基础课《高级数据库系统》

3. 博士生课程《数据科学前沿理论与技术》

 

获得荣誉:

1. 2020.12 北京交通大学线下一流课程《数据库系统原理》负责人

2. 2009.12 北京交通大学优秀研究性教学方案

3. 2009.3 北京交通大学“优秀主讲教师”

4. 2008.10 北京交通大学教学成果二等奖

 

 

论文/期刊

2024

[1] Yihai Xi, Ning Wang, Yiyi Zhang, Xinyu Chen. CrowdDA: Difficulty-aware crowdsourcing task optimization for cleaning web tables. Expert Systems with Applications, 238(2024). (SCI, 中科院1区)

[2] 王府鑫,王宁,曾奇雄. 基于工人长短期时空偏好的众包任务分配, 软件学报,2024, 35(10): 4710-4728.

[3] Zhihong Xu, Ning Wang. Low-Resource Entity Resolution with Domain Generalization and Active Learning, Neurocomputing, 2024. (SCI)



2023

[1] Zilong Wang, Qixiong Zeng, Ning Wang, Haowen Lu, Yue Zhang. CEDA: Learned Cardinality Estimation with Domain Adaptation. VLDB 2023. (CCF-A)

[2] Yihai Xi, Ning Wang, Shuang Hao, Yiyi Zhang, Xinyu Chen. Popularity sensitive and domain-aware summarization for web tables. Information Sciences, 621(2023):729-748. (SCI, 中科院1区)

[3] Shuang Hao, Chengliang Chai, Guoliang Li, Nan Tang, Ning Wang, Xiang Yu. HOFD: an outdated fact detector for knowledge bases. TKDE 2023. (CCF-A)

[4] Junyuan Quan, Ning Wang. An optimized task assignment framework based on crowdsourcing knowledge graph and prediction. Knowledge-Based Systems, 260 (2023):110096. (SCI, 中科院1区)

[5] Yihai Xi, Ning Wang. Identifying notable tuples in multi-concept web tables. International Journal of Software Engineering and Knowledge Engineering, 33(4):575-602, 2023. (SCI)

[6] Xin Xing, NIng Wang. Entity Matching based on Attribute-aware and Multi-Perspective Similarity Measurement, Journal of Information Science and Engineering, 39(2):423-438, 2023.

[7] Xiaohan Yang, Ning Wang. A Confidence-aware and Path-enhanced Convolutional Neural Network Embedding Framework on Noisy Knowledge Graph, Neurocomputing, 2023. (SCI)


Before 2023

[1] Yihai Xi, Ning Wang, Xinyu Chen, Yiyi Zhang, Zilong Wang, Zhihong Xu, Yue Wang. EasyDR: A Human-in-the-loop Error Detection&Repair Platform for Holistic Table Cleaning. VLDB 2022 (CCF-A)

[2] Jianlin Gao, Nan Zhao, Ning Wang, Shuang Hao, Haoyan Wu. Automatic Index Selection with Learned Cost Estimator. Information Sciences, 2022, 612(2022):706-723.(SCI, An1)

[3] Jianlin Gao, Nan Zhao, Ning Wang, Shuang Hao. SmartIndex: An Index Advisor with Learned Cost Estimator, CIKM 2022(CCF-B)

[4] Xiaoyu Wu, Ning Wang. Detecting Errors with Zero-Shot Learning, Entropy, 2022, 24(7),936 (SCI)

[5] Siyu Chen, NIng Wang. Discovering Entity Columns of Web Tables Effectively and Efficiently, Journal of Information Science and Engineering, 2022, 38(3) (SCI)

[6] Guangyuan Zhang, Ning Wang. Multi-factor Influencing Truth Influence in Crowdsourcing. Journal of Information Science and Engineering,2021, 37(5) (SCI)

[7] Shuang Hao, Nan Tang, Guoliang Li, Jianhua Feng, Ning Wang. Mis-categorized entities detection. The VLDB Journal 2021 (CCF-A)

[8] Yihai Xi, Ning Wang, Shuang Hao, Wenyang Yang, Li Li, PocketView: A Concise and Informative Data Summarizer, ICDE 2020 (CCF-A)

[9] Shuang Hao, Chengliang Chai, Guoliang Li, Nan Tang, Ning Wang, Xiang Yu. Outdated Fact Detection in Knowledge Bases, ICDE 2020 (CCF-A)

[10] 张光园,王宁. 基于小样本置信区间的众包答案决策方法, 计算机科学,2020, 47(10):26-31. 

[11] Weijuan Sun, Ning Wang. Gathering Information on the Web by Consistent Entity Augmentation, 2019, 38(5) (SCI)

[12]Xiaoyu Wu, Ning Wang, Huaxi Liu. Discovering Foreign Keys on Web Tables with the Crowd, 2019, 38(3) (SCI)

[13] Siyu Chen, Ning Wang, Mengmeng Zhang. Mining Approximate Primary Functional Dependency on Web Tables, IEICE Transactions on Informations and Systems, E102.D, 2019 (SCI)

[14] 王佳敏,王宁. 基于冲突依赖消除的网络表格外键检测算法, 计算机科学,2019, 46(10):195-201

[15] 孙伟娟,王宁. 基于一致性支持度的实体TOP-K扩展算法, 计算机工程,2019, 45(4):181-188

[16] 郝爽,李国良,冯建华,王宁. 结构化数据清洗技术综述, 清华大学学报, 2018, 58(12)  (EI)

[17] Ning Wang, Xiangran Ren. Identifying Multiple Entity Columns in Web tables.International Journal of Software Engineering and Knowledge Engineering,2018,3(28) (SCI)

[18] Ning Wang, Huaxi Liu.Annotating web tables with the crowd.Computing and Informatics,2018,37(4)  (SCI)

[19] Fei Qi, Xiaoyu Wu, Ning Wang.Building Top-k Consistent Results for Web Table Augmentation.WISA 2017,2017 (EI)

[20] Yihai Xi, Ning Wang, Xiaoyu Wu, Yuqin Bao, Wutong Zhou.CrowdIQ:A Declarative Crowdsourcing Platform for Improving the Quality of Web Tables.APWeb-WAIM: Asia-Pacific Web (APWeb) and Web-Age Information Management (WAIM) Joint Conference on Web and Big Data,2017  (EI)

[21] 齐飞,王宁,张丽方,孙伟娟.基于列重合度的网络表格一致性扩展.计算机科学,2017,9(44)

[22] 张丽方,王宁,齐飞.Web表格的实体列发现算法.计算机工程,2017,12(43)

[23] Ning Wang, Tian Tian.Summarizing Personal Dataspace Based on User Interests.International Journal of Software Engineering and Knowledge Engineering,2016,5(26)  (SCI)

[24] 王宁,任红伟.网络表格间的快照关系发现.计算机科学,2015,7(42)

[25] 王宁,黄敏.基于MapReduce与两层相关性聚类的实体解析方法.计算机工程,2015,9(41)

[26] Huaxi Liu, Ning Wang, and Xiangran Ren , CrowdSR: A Crowd Enabled System for Semantic Recovering of Web Tables, Lecture Notes in Computer Science, LNCS 9098, pp.581-583, 2015. (WAIM 2015 BEST DEMO AWARD) (EI)

[27] Ning Wang, Hongfang Du, Baomin Xu, Compact Indexes Based on Core Content in Personal Dataspace Management System, Computing and Informatics, Vol.33, No.2, pp.281-302, 2014. (SCI)

[28] Nathalie Cindy Kuicheu, Ning Wang, et.al, An Iterative Approach to Managing Uncertain Mappings in Dataspace Support Platforms, International Journal of Software Engineering and Knowledge Engineering, Vol.24, No.4,pp.635-652, 2014. (SCI)

[29] 王宁,李杰,大数据环境下用于实体解析的两层相关性聚类算法,计算机研究与发展,Vol.51, No.9, pp.2018-2116, 2014. (EI)

[30] 宋玉玲,王宁,利用实体语义信息的关键字查询结果多样化,计算机科学与探索,Vol.8, No. 3, pp.266-274, 2014.

[31] Xudong Lin, Ning Wang, XML Normalization Based On Entity Segments, Information Sciences, Vol.239,pp.85-95, 2013.8 (SCI)

[32] Nathalie Cindy Kuicheu, Ning Wang, Managing Uncertain Mediated Schema and Semantic Mappings Automatically in Dataspace Support Platforms, Computing and Informatics, Vol.32, No.1, pp.175-202,2013.1. (SCI)

[33] Ning Wang, Jie Li, Restoring: A Greedy Heuristic Approach Based on Neighborhood for Correlation, Lecture Notes in Artificial Intelligence, 2013.  (EI)

[34] Yuling Song, Ning Wang, Results Diversification for XML Keyword search Based on the Semantic Category of Central Entity, The 10th Web Information System and Application Conference, Nov. 1-3, Yangzhou, China, 2013. (EI)


更多文章:

[1] Description Logic Based Icons Semantics: an Ontology for Icons, Proceedings of 2012 IEEE 11th International Conference on Signal Processing, Oct. 21-25, Beijing, China, pp.1260-1263, 2012. (EI)

[2] 2PROM: a Two Phase Image Retrieval Optimization on Dataspace Using Predictive Modelling, Proceedings of 2012 IEEE 11th International Conference on Signal Processing, Oct. 21-25, Beijing, China, pp.1176-1179, 2012. (EI)

[3] A Novel XML Keyword Query Approach Using Entity Subtree,Journal of Systems and Software, Vol.83, No.6, 2010, pp. 990-1003. (SCI)

[4] A Novel Two-Phase XML Keyword Query Algorithm, Chinese of Journal Electronics, Vol.19, No.4, 2010, pp.613-617. (SCI)

[5] Predicting Dataspace Retrieval using Probabilistic Hidden Information, IEICE TRANSACTIONS on Information and System, Vol.E93-D, No.7, 2010, pp.1991-1994. (SCI)

[6] Collaborative Integration and Management of Community Information in the Cloud, Proceedings of International Conference on E-Business and E-Government, Guangzhou, China, May 7-9,2010, pp.1406-1409. (EI)

[7] A Complete Data Dependency Model, Proceedings of the 7th International Conference on Fuzzy Systems and Knowledge Discovery, Aug. 10-12, 2010, Yantai, China, pp.1927-1931.( ISTP)

[8] SMX/R: Efficient Way of Storing and Managing XML Documents Using RDBMSs Based on Paths, Proceedings of 2010 2nd International Conference on Computer Engineering and Technology, April 16-18, 2010, Chengdu, China, pp.143-147. (ISTP)

[9] Building Semantic Relationships Incrementally in Dataspace, Proceedings of the 1st International Conference on Information Science and Engineering, Dec. 18-20, 2009, Nanjing China. (EI)

[10] Resource Summary for Pay-as-you-go Dataspace Systems, Proceedings of the 9th International Conference on Signal Processing, October 26-29, 2008, Beijing, China.(ISTP)

[11] Rank-aware XML Data Model and Algebra: Towards Unifying Exact Match and Similar Match in XML,Proceedings of the 7th WSEAS International Conference on Multimedia, Internet & Video Technologies, September 15-17,2007,Beijing, China (ISTP)

[12] NNQM: a novel non-navigating XML Query Model, Proceedings of the 7th WSEAS International Conference on Multimedia, Internet & Video Technologies, September 15-17,2007,Beijing, China(ISTP)

[13] XIRS: an XML-based Image Retrieval System, Proceedings of the 7th WSEAS International Conference on Multimedia, Internet & Video Technologies, September 15-17,2007,Beijing, China

[14] 支持CIM的实时对象数据库管理系统,《电力系统自动化》,Vol.30,No.16,2006年8月

[15] A CIM-oriented Real-time Database Management System: Design and Implementation, Proceedings of the 2006 International Conference on Electrical Engineering, July 9-13,2006,YongPyong Resort, Korea

[16] IEC 61970与新一代EMS数据库管理系统,《电力系统自动化》,Vol.24,No.24,2000年12月

[17] 异构数据源集成系统查询分解和优化的实现,《软件学报》,Vol.11,No.2,2000年2月

[18] 数据源集成系统中全局模板的增量维护策略,《软件学报》,Vol.10,No.4,1999年4月

[19] 数据源集成系统中动态字典构造方法研究,《计算机学报》,Vol.22,No.1,1999年1月

[20] 异构数据源集成系统中基于数据源能力的查询分解和优化策略,《计算机学报》,Vol.22,No.1,1999年1月

[21] 基于带根连通有向图的对象集成模型及代数,《软件学报》,Vol.9,No.12,1998年12月

[22] 异构数据源集成系统查询处理的实现,《计算机科学》, 1998年10月

[23] 异构数据源系统中半结构化数据的存取与表示服务,《计算机科学》, 1998年10月

[24] 同构OIM对象及其存储策略,《计算机科学》, 1998年10月

[25] 一个基于CORBA的异构数据源集成系统的设计,《软件学报》,Vol.9,No.5,1998年5月

[26] 数据树—一种用于异构数据源集成的公共数据模型,《计算机研究与发展》,Vol.35,No.7,1998年7月

[27] 面向对象数据库中的数据依赖和规范化,《东南大学学报》,Vol.27,No.5,1997年9月

[28] Versatile: A Scaleable CORBA-based System for Integrating Distributed Data,Proceedings of the 1997 IEEE International Conference on Intelligent Processing Systems, October 28-31,1997,Beijing,China

[29] 面向对象的工程数据库中若干问题的探讨,《计算机研究与发展》,Vol.29,No.6,1992年6月

 





专著/译著

1. 铁路信息系统工程与实践,中国铁道出版社,2014.10

2.高等学校计算机科学与技术专业核心课程教学实施方案,高等教育出版社,2009.7

专利


 


1. 王宁,王凯梅 ,基于时间窗的众包任务的动态分配方法(专利号:201910348569.X

2. 王宁,张光园,多影响因素的众包答案决策方法(专利号:201910672137.4

3. 王宁,暴雨晴,一种基于贝叶斯的开放性答案决策方法,专利号:201810329661.7

4. 王宁,王佳敏,基于分布拟合的网络表格间的外键关系检测方法(专利号:201811250624.3)

5. 王宁,孙伟娟,网络表的实体扩展方法(专利号:201711090437.X)

6. 王宁,张丽方,基于属性间依赖关系的网络表格的实体列的检测方法(专利号:201710002389.7)

7. 王宁,刘华西,网络表格语义恢复方法 (专利号:201510211926X)

8. 王宁,任红伟,选择具有快照关系的网络表格的方法及装置(专利号:201410441120.5

9. 王宁,李杰,一种适合大数据环境具有抗噪声能力的实体解析方法(专利号:201410030391.1



软件著作权

 


1. 黄雨桐,王宁,Android端网格员版数据核查软件, 登记号:2021SRBJ0006.

2. 黄雨桐,王宁,Android端社区人员版数据核查软件, 登记号:2021SRBJ0007.

3. 张光园,王宁,多影响因素的众包答案决策软件,登记号:2020SRBJ0607.

4. 全俊源,王宁,iOS端网格员版数据核查软件, 登记号:2020SRBJ0608.

5 全俊源,王宁,.iOS端社区人员版数据核查软件, 登记号:2020SRBJ0606.

6. 陈思宇,王宁,网络表格的主函数依赖关系检测软件,登记号:2018SRBJ1169

7. 王佳敏,王宁,网络表格的外键检测软件,登记号:2018SRBJ0805

8. 孙伟娟,王宁,一致性实体扩展软件,登记号:2018SRBJ0572

9. 暴雨晴,王宁,开放性答案决策软件,登记号:2018SRBJ0573

10. 刘华西,王宁,基于众包的网络表格语义恢复软件,登记号:2015SRBJ0561

11. 王宁,任红伟,网络表格的快照检测软件,登记号:2014SRBJ0618

12. 王宁,任向冉,网络表格的语义标注软件,登记号:2014SRBJ0617

13. 王宁,刘华西,徐保民,支持扩展检索的数据合并软件,登记号:2014SRBJ0286













获奖与荣誉

 

1. 王宁. 指导的参赛队在2023全国大学生计算机系统能力大赛数据库管理系统设计赛全国总决赛中获得优异成绩, 优秀指导教师奖,2023年8月  

2. 刘华西,王宁,任向冉.CrowdSR:A Crowd Enabled Syatem for Semantic Recovering of Web tables, WAIM 2015 Best Demo Award, 2015.6

2.王宁, 王能斌. 异构数据源集成系统查询分解和优化的实现,南京市第四届自然科学优秀学术论文奖,2001年12月.

3.王宁, 徐宏炳, 王能斌. 基于带根连通有向图的对象集成模型及代数, 南京市第三届自然科学优秀学术论文奖, 199911.

4.王宁. 异构数据源集成系统查询处理的实现, 第十五届全国数据库学术会议优秀论文奖, 199810.

5.王宁, 陈滢, 俞本权. Galaxy:一个可扩展的异构数据源集成系统, 第十四届全国数据库学术会议优秀论文奖, 199710.

6.王宁, 王能斌. 面向对象的分布式实时数据库管理系统的设计与实现, 国家电力公司电力自动化研究院优秀学术论文一等奖, 20061.

7.王宁, 徐宏炳, 王能斌. 数据源集成系统中全局模板的增量维护策略, 国家电力公司电力自动化研究院优秀学术论文二等奖,20001.

社会兼职

 
1. 中国计算机学会数据库专委会委员,全国数据库学术会议程序委员会委员
2. 数据库与数据挖掘领域著名国际会议VLDB、SIGKDD、SIGIR 、CIKM、DASFFA的程序委员会委员
3. 担任《软件学报》、《计算机科学》、《Transactions on Knowledge and Data Engineering》、《Distributed and Parallel Databases》、《International Journal of Software Engineering and Knowledge Engineering》审稿人