河北新闻>>本网原创

新知|迈向E级,攀登超算“新巅峰”

2018-07-12 05:34:35 来源:河北新闻网
进入移动版,省流量,体验好

新知|迈向E级,攀登超算“新巅峰”

5月17日在天津梅江会展中心展出的“天河三号”原型机。  新华社记者李然摄

当前,全球超算领域你追我赶,正加紧竞跑步伐。而超算PK的指标已经不再只限于绝对计算能力,而是更侧重于能效比、应用等“实用性指标”。

最新统计显示,中国的超算系统总数以206套位居世界第一。中国超算专家钱德沛最近在接受媒体采访时表示,促进大规模应用、解决国家面临的挑战性问题、带动中国计算机产业的进步,才是中国发展超算更重要的目的。

E级超算:“耐力赛”的下一个“赛点”

“超级计算机,顾名思义,其基本组成组件与个人电脑没有太大差异,但规格与性能却要强大许多,主要表现为高速度和大容量,并配有多种外部和外围设备,以及丰富、高功能的软件系统。”石家庄铁道大学复杂网络与可视化研究所副教授王威说,超级计算机多用于国家高科技领域和尖端技术研究,是国家科技发展水平和综合国力的重要标志,被誉为计算机中的“珠穆朗玛峰”。

此前,凭借每秒9.3亿亿次的浮点运算速度,“神威·太湖之光”曾连续4次蝉联全球超级计算机500强榜单冠军。

“人类对于计算能力的渴求是无止境的,甚至可以说是‘贪婪的’,也正因如此,超级计算机的设计、建设和使用更像一场没有终点的马拉松。”王威说,目前,中国超算正持续增加,其跻身500强榜单的总数单已由2017年的201套增至如今的206套。”

在众多超算领域的专家看来,超算这场“耐力赛”的下一个“赛点”已经逐渐明确,全球都将目光不约而同地投向了E级超算。

所谓E级超算,是指运算速度超过每秒100亿亿次浮点运算的超级计算机。凭借其庞大的计算能力,它将在解决人类共同面临的能源危机、污染和气候变化等重大问题上发挥巨大作用,是公认的超级计算机界的下一顶皇冠。

“E级超算可用于模拟全球气候变化、宇宙演化,处理天体物理大数据,验证新型材料等重大计算需求。”王威说。

加快布局下一代超算,我国也已将E级超算写入了“十三五”规划,正在部署解决超级计算机的软硬件核心问题。王威说:“对我们而言,相比关注排名变化,更重要的还是脚踏实地地往前发展。”

新的挑战:降低能耗提升效率

想要研制出E级超算,科学家们面临着很多现实挑战。其中,首当其冲的便是功耗过高。

王威举了一个很有趣的例子:在Google中,用户只要输入一个关键字,再键入回车就可以得到他想要的结果。有人曾做过计算,就是这样一个不起眼的搜索动作,所消耗的电能就足够一个11瓦的节能灯亮15分钟到1个小时。

在王威看来,百亿亿次超级计算机的建造难度,不仅在于速度的提升,更在于对大规模超算设备的功耗要求。“按照国际公认标准,E级超算的功耗应低于20MW。”他说,根据这一目标要求,未来E级超算的能效比要达到50GFlops/W,而“神威·太湖之光”只有6GFlops/W,相差了一个数量级。

不只是中国,全球超算领域的科学家们几乎都在为如何降低功耗而伤透脑筋。

“围绕解决这一难题,近些年,操着不同语言的科学家们进行了很多有益尝试,比如,让存储器更接近计算器、让高性能存储器向三维扩展、超算与闪存结合、在芯片不使用时关闭其中的电路、改变电压或频率等来节省功率,都取得了一定成效。”王威说,但要真正降低能耗,还需要来一场制造工艺的革命性突破。

除此之外,全球超算竞争中,我国亟须跑赢的另一个“赛道”,便是如何更有效地利用超算。

王威用“搬砖”做了个形象说明:100块砖,一个人1趟搬1块,需要往返跑100次,而如果有100个人同时搬,只需搬1次即能全部搞定。

“‘神威·太湖之光’有1000多万个核,使用它,就是让1000多万个核去解决一个问题,相当于一个人指挥成千上万的‘人’干活,如果不能科学管理,很难实现每个‘人’工作效率的最大化。”王威说,想要超算更好用,就要不断加强软件设计和应用程序研发,形成超算生态,并使其不断完善、更新。

然而,相较于超算硬件的研制,超算软件的开发往往需要更长的时间,除了经历科学问题建模、网格划分、求解数学方程、算法设计、运行验证等一系列流程外,还会涉及多种学科,过程非常复杂。

“值得高兴的是,国家已经开始加强超算软件方面的研究。”王威说,“目前,国内同时启动了三套E级超算研发,分别为国防科大/天津超算中心的天河三号、中科曙光的E级超算以及江南所/济南超算中心的神威E级,本着自主可控的原则,我国超级计算机的设计、建设和使用正稳步推进。”

融入生活:从天气预报到金融服务

“提到超算,很多人都觉得太高大上了,很难将