计算机硬件技术论文_基于“嵩山”超级计算机系
文章目录
1 引言
2 “嵩山”超级计算机系统
2.1 海光一号DCU加速器架构
2.2 CPU+DCU异构编程
3 量子傅里叶变换
4 模拟实现
4.1 量子傅里叶变换模拟程序分析
4.2 CPU+DCU版本量子傅里叶变换模拟的实现
4.3 CPU+DCU版本量子傅里叶变换模拟的优化
4.3.1 多进程控制DCU并发
4.3.2 计算通信隐藏
5 实验验证
5.1 实验环境
5.2 功能性测试
结束语
文章摘要:"嵩山"超级计算机系统是中国自主研发的新一代异构超级计算机集群,其搭载的CPU和DCU加速器均为我国自主研发。为扩充该平台的科学计算生态,验证量子计算研究在该平台上开展的可行性,文中使用异构编程模型实现了量子傅里叶变换模拟在"嵩山"超级计算机系统上的异构版本,将程序的计算热点部分分配至DCU上运行;然后使用MPI在单计算节点上开启多进程,实现DCU加速器数据传输和计算的并发;最后,通过计算与通信的隐藏避免了DCU在数据传输时处于较长时间的空闲状态。实验首次在超算系统上实现了44 Qubits规模的量子傅里叶变换模拟,结果显示,异构版本的量子傅里叶变换模拟充分利用了DCU加速器计算资源,相较于传统CPU版本,其取得了11.594的加速比,且在集群上具有良好的可拓展性,该方法为其他量子算法在"嵩山"超级计算机系统上的模拟实现以及优化提供了参考。
文章关键词:
论文分类号:TP338.4