赵宏智
博士 、副教授 、博士生导师
博士 、副教授 、博士生导师
| 办公电话: | 电子邮件: hzzhao@bjtu.edu.cn |
| 通讯地址:北京交通大学计算机科学与技术学院 | 邮编:100044 |
1997.09-2001.07 北京科技大学信息工程学院计算机系 获工学学士学位
2001.09-2007.07 北京科技大学信息工程学院计算机系 获工学博士学位
2007-至今 北京交通大学计算机学院就职讲师、副教授岗位
2015.06-2016.06 美国加州大学尔湾分校访问学者
科研获奖与受邀学术报告:
1. 2025年度 中国人工智能学会-昇腾CANN基金优秀项目奖;获奖理由: 刻画了数据连续性对昇腾处理器上卷积计算性能的影响,给出了最优切片尺寸搜索策略,极大提升了卷积运算的性能;
2. 2022年度 华为鲲鹏众智星光奖 & 金质量奖;获奖理由:极大提升了time函数在鲲鹏处理器上的执行性能,满足了延时敏感网络任务的实时性处理需求;
2025年6月杭州召开的2025全球人工智能技术大会(GAITC 2025)上,本人作为北京交通大学方面的唯一受邀嘉宾,做了主题为“基于CANN的卷积计算优化实践:输入特征图切分策略探索”的专题报告(https://gaitc.caai.cn/)。 课题组的博士生刘恂应华为专家邀请,在2025北京的鲲鹏昇腾开发者大会2025上做关于卷积算子性能优化研究的主题报告。
2023年4月受华为鲲鹏部门邀请,在北京的鲲鹏开发者大会上做特邀报告。
课题组研究的本质,并非绑定某一款芯片,而是探寻计算效率的终极规律。我们聚焦于AI模型在任何现代处理器(CPU/GPU/NPU)上的性能调优,深入指令集、缓存层级与并行模型。你在这里习得的内存访问优化、计算图重写、算子融合策略。其底层逻辑在NVIDIA CUDA、AMD ROCm、Intel oneAPI及华为昇腾CANN生态中完全相通。
我们将华为昇腾CANN作为核心验证平台,是因为它代表了国产算力最前沿的挑战,并提供了与业界顶级工程师直接协作的珍贵机会。但我们的目标远不止于此——我们培养的是能快速驾驭任何新生硬件的“计算架构师”,能够解决大厂真难题,将其解决方案沉淀为顶级论文与开源代码,而不是从论文到论文。
近年来硕士博士毕设题目均来源于课题组与工业界大厂合作的项目,与华为、字节跳动AI Lab、腾讯云、蚂蚁等团队的基础软件岗位高度对口。以下开源链接均为课题组研究生独立或合作开发的、严格遵循华为昇腾算子标准的部分成果已经合入华为的开源ops-nn代码仓(主线贡献,精度对齐,性能更优),同学们都有自己的开源署名(是永久可查的履历),与华为编译器/CANN/密码...等部门专家高频交流,可以写入简历,经得起任何技术面试官的追问与查验,是简历中唯一无法造假、无需背调的技术证明:
https://gitcode.com/Foriver2/ops-nn/tree/master/experimental/activation/elu_v2
https://gitcode.com/hqnzw/ops-nn_7534/tree/master/experimental/loss/kl_div_loss_grad
https://gitcode.com/m0_66484415/ops-nn/tree/master/experimental/activation/silu_grad
https://gitcode.com/hanchuang101/ops-nn/tree/master/experimental/activation/prelu
https://gitcode.com/hyy_bjtu/ops-nn/tree/master/experimental/activation/elu_grad_v2
https://gitee.com/ascend/cann-ops/pulls?assignee_id=&author_id=&label_ids=&label_text=&milestone_id=&priority=&project_id=ascend%2Fcann-ops&project_type=&scope=&search=%E3%80%90%E5%8C%97%E4%BA%AC%E4%BA%A4%E9%80%9A%E5%A4%A7%E5%AD%A6-%E8%B5%B5%E5%AE%8F%E6%99%BA%E8%80%81%E5%B8%88%E5%9B%A2%E9%98%9F%E3%80%91&single_label_id=&single_label_text=&sort=closed_at+desc&status=merged&target_project=&tester_id=
我不保证你毕业后一定去哪里,但我保证你在课题中写的每一行代码,都能成为你面试时最硬的那张牌。(去实习的公司,大概率不会让你碰核心代码,因为实习生签不了NDA、上不了生产环境) 想拿高薪,靠的不是热门赛道,而是稀缺能力--我们做的就是稀缺能力。
华为主线开源贡献比实习证明更硬,AI基础设施开发能力和训/推性能调优能力比AI算法炼丹能力更稀缺!!!
研究生待遇:基本补贴+课题酬劳(占大头,多劳多得)
目前团队中的研究生: 2位博士生、10+位硕士生。 团队氛围好,同门之间很团结,友爱互助,项目风险共担,利益共享,项目实施过程中额外的贡献都会计入工作量。
拟27年秋季入学的申请考核的硕士/博士生可以向我申请, hzzhao@bjtu.edu.cn !!! 硕士生名额剩余3名,博士生名额剩余2名。
所主持的科研项目有:
某横向项目:基于昇腾310P边端盒子的算子性能优化攻关项目.2025-2026.
中国人工智能学会-昇腾CANN学术基金项目: 基于CANN的高性能对称加密算法XXX的实现研究. 2025-2026.
多项华为昇腾众智项目:基于Ascend C的****算子开发.2025/2026.
中国人工智能学会-昇腾CANN学术基金项目:基于CANN平台的****算法研究.2024-2025.
中国计算机学会-某汽车大厂合作项目:***任务性能提升的关键技术研究. 2023-2025.
基本科研业务费研究生创新项目(指导教师): 基于CPU的深度神经网络推断任务加速技术研究. 2023-2025.
人工智能教育部重点实验室项目:深度神经网络推断处理器的访存延时优化与缓冲区管理研究. 2021-2023.
浙江省交通运输研究院开放课题:卷积神经网络推断任务的性能提升关键技术. 2022-2023.
华为鲲鹏合作项目: ***精度库开发. 2023
华为鲲鹏合作项目:***SVE. 2022.
华为鲲鹏合作项目: AI领域****开发. 2022.
华为鲲鹏合作项目: glibc库time函数性能优化, 2021.
华为合作协同育人项目(鲲鹏): 基于泰山服务器的汇编语言研究型实验建设. 2019-2020
专利许可项目: 《片上网络限流系数的精确量化方法》专利实施许可项目, 2020-2025
基本科研业务费研究生创新项目(指导教师): DNN训练处理器的片上传输加速策略, 2020-2022
北京交通大学: 处理器测试及其配套算法库研发及优化服务, 2019-2020
基本科研业务费: 片上网络的高效容错路由方法研究, 2017-2018
国家自然科学基金"青年基金": 片上网络的高效拥塞感知及协同拥塞控制方法研究, 2015-2017
基本科研业务费: 基于高清晰度拥塞信息的片上网络拥塞控制方法, 2014-2016
基本科研业务费: 片上网络的多层次负载均衡策略研究, 2011-2013
校科技基金: 片上网络技术的基础问题研究, 2007-2009
以下为研究生毕业去向
23级 国家电网、国家电网、海康威视、奇瑞汽车;
22级 中国商飞上海航空工业集团、中国工商银行天津分行; 19级(博) 参军;
21级 北京银行;
20级 美团、华为、美团、新华三(SP offer);
19级 吉林省公务员、蔚来汽车(SP offer)、航天科工2院;
18级 紫光展锐、中科院自动化所
17级 吉利汽车
15级 中国电科第41所
需要说明的是:
1.去向集中反映了研究生本人的职业志趣,而非课题组的研究方向限制;
2.课题组研究内容偏底层计算与性能优化,该能力在电网、金融科技、AI基础设施以及国企信息化部分等方向具有很强的迁移性;
近几年已毕业研究生找工作的经验花絮与毕业感想:
1. 课题方向偏底层,但是导师支持我备考电网,没有因为项目进度卡我;
2. 所做的昇腾算子开发,与华为工程师高频交流,技术成长比我想象中更快!
3. 虽然所做的课题与项目很受大厂认可,拿到过大厂的offer,但是不想35岁被优化,还是利用好应届生身份直接去比较稳定的央国企比较好。央国企也很认可我在华为开源代码仓中的贡献。
指导研究生和本科生荣获的华为鲲鹏众智项目证书情况:
1) Libm数学精度库项目有19位同学;
2) AVX 2 SVE项目有10位同学;
3) AI workload项目有4位同学;
4) Glibc time项目有6位同学;
指导本科生竞赛获奖情况:
1) 2025年 昇腾AI原生创新算子挑战赛S3赛季三等奖;
2) 2025年 昇腾AI原生创新算子挑战赛S4赛季获得3个一等奖和2个优秀奖;
3) 2025年 昇腾AI原生创新算子挑战赛冠军赛获得银奖;
同时,本人作为指导老师获优秀指导教师奖。
4) 2024年 昇腾AI原生创新算子挑战赛S1赛季铜奖(Yang L.;
Liu X.; Wu T. )(140多个参赛队伍中,金银铜奖共6个)
5) 2024年 昇腾AI原生创新算子挑战赛S2赛季金奖(Xiao X.
P.) (决赛第2名)和最佳性能奖;同时,本人作为指导老师获优秀指导教师奖。
申明:未在我指导的大创、竞赛、科研项目、论文等过程中表现良好的,也没有加入本研究团队意愿的本科同学,请不要找我要保研推荐信。
1, 赵宏智,片上路由器拥塞感知范围的扩大方法,中国,发明专利号:ZL 2013 1 0322950.1;
2, 赵宏智,一种针对路由方向单调变化网络的容错曼哈顿路由方法,中国,发明专利号:ZL 2016 1 0124541.4;
3, 赵宏智,王强, 片上网络限流系数的精确量化方法,中国,发明专利号:ZL 2017 1 0023536.9;(成果已转化)
4, 赵宏智,甄辛, 刘恂. 一种基于视频检测的卷积神经网络推断优化方法,中国,发明专利,授权号:ZL 2022 1 0932532.3;
5, 赵宏智,何景静,刘恂. 一种在多核CPU服务器上的卷积神经网络推断任务调度优化方法,中国,发明专利,申请号:202210801018.6;
6, 赵宏智 , 张芳. 一种深度神经网络推断处理器的访存性能提升方法,中国,发明专利,申请号:202210394533.7
讲授过的课程:
《汇编与接口技术》(课程负责人)、《VHDL及设计实践》、《算法设计与分析》(硕)、《移动互联网络前沿理论与技术》(博)、《计算机工程前沿》(博)、《Windows CE嵌入式系统》、《大学计算机基础》
中国中医药信息研究会中医药健康大数据分会理事;
中医药与健康信息学专业委员会委员;
中国计算机学会(CCF)高级会员;
教育部学位中心学位论文评审专家;
国家科技专家库的在库专家;
唐山市人民政府特聘专家;
1,基于昇腾910B处理器的AES算法加速:
720k明文长度下,
2. 华为公司:泰山服务器上glibc time函数性能优化
被华为公司评选为首批鲲鹏众智优秀开发团队,荣获“鲲鹏众智星光奖”(100多个项目开发团队中只有9个团队获此奖项),研究生Wang Y. C., Zhang F., Zhao J. Y., He J. J., Tang C., Zhou M.等均被华为技术有限公司授予“鲲鹏众智开发者”荣誉称号,其中研究生Zhao J. Y.荣获“鲲鹏众智金质量奖”。