8月26日,首届中科院先导杯并行计算应用大奖赛决赛圆满落幕,中国科学技术大学杨金龙院士课题组派出的PWDFT和LRTDDFT战队在胡伟研究员的指导下,在开放应用赛道分别获得一等奖和优胜奖。
图1. 参赛队员合影
为了加快我国先进计算产业中应用软件、应用算法和计算人才等短板领域的发展步伐,中国科学院于3月25日启动了首届“先导杯”并行计算应用大奖赛。这一并行计算应用领域的高水平赛事,吸引了全国200多所重点高校、科研机构、知名企业的601名选手、近500支战队积极参赛,主要在基础算法、人工智能和开放应用3大赛道围绕6类问题展开角逐。经过激烈地比拼,共有来自北京大学、清华大学、中国科学技术大学等46支科研单位和企业进入决赛。决赛每个赛道设特等奖、一等奖和优胜奖三个奖项,采取线上成绩+线下答辩的综合评分来排名。
PWDFT和LRTDDFT团队来自于中国科学技术大学杨金龙院士课题组,由合肥微尺度物质科学国家研究中心胡伟研究员带队。这两个团队基于大赛提供的世界领先的国产先进计算平台和CPU-GPU异构编程环境,提供了通用的第一性原理材料模拟软件,通过出色的并行架构设计和最新加速算法,在全新的加速卡硬件上取得了很好的效果。最终在应用赛道分别获得一等奖和优胜奖。本次参赛旨在让自主研发的第一性原理软件在国产超算架构上实现移植和优化,未来该系列软件也会在全国各地的相关超级计算中心实现部署。
图2. PWDFT自洽场迭代求解KS方程流程和PWDFT扩展性能
PWDFT(Plane Wave Density Functional Theory)是一款基于平面波基组求解KS(Kohn-Sham)方程的第一性原理计算软件,对于材料、能源、环境、生物等科学应用具有重要意义。目前,第一性原理计算软件在超级计算机的使用率上占主导地位。我国的国产超算硬件发展在国际上处于领先地位。然而在第一性原理计算领域,使用最多的依然是国外的商用软件,使得兼容国产超算硬件的特殊架构并针对国产硬件进行深度优化成为了难题。因此,我们急需自主可控的行业应用软件。本次比赛中,PWDFT队伍使用适合GPU异构并行的PPCG本征值求解算法,并且针对国产超算的特点进行了针对性优化,与优化之前相比,取得了十几倍的加速效果。另外,PWDFT在先进计算平台上也取得了2000核/卡的优异扩展性能,最终在比赛中获得一等奖。
图3. Casida方程和LR-TDDFT扩展性能
基于线性响应的含时密度泛函理论(LR-TDDFT)方法被广泛地用来计算各种激发态性质,例如激发能、激发态原子力、非绝热耦合以及激发态Hessian等,从而能够用来有效地模拟吸收谱、发射谱、激发态红外谱或者共振拉曼谱等。LR-TDDFT的计算复杂度为N的5次方,故而其难以应用于大体系。本队伍利用MPI,OPENMP等并行技术,设计相应算法,在PWDFT中实现了LR-TDDFT的并行模块,使其能用于大规模并行计算,从而可以应用在大体系情形中。在本次比赛中,本队伍将LR-TDDFT程序成功并行到上千核,最终在比赛中获得优胜奖。