河北新闻>>本网原创

新知|迈向E级,攀登超算“新巅峰”

2018-07-12 05:34:35 来源:河北新闻网
进入移动版,省流量,体验好

新知|迈向E级,攀登超算“新巅峰”

5月17日在天津梅江会展中心展出的“天河三号”原型机。  新华社记者李然摄

当前,全球超算领域你追我赶,正加紧竞跑步伐。而超算PK的指标已经不再只限于绝对计算能力,而是更侧重于能效比、应用等“实用性指标”。

最新统计显示,中国的超算系统总数以206套位居世界第一。中国超算专家钱德沛最近在接受媒体采访时表示,促进大规模应用、解决国家面临的挑战性问题、带动中国计算机产业的进步,才是中国发展超算更重要的目的。

E级超算:“耐力赛”的下一个“赛点”

“超级计算机,顾名思义,其基本组成组件与个人电脑没有太大差异,但规格与性能却要强大许多,主要表现为高速度和大容量,并配有多种外部和外围设备,以及丰富、高功能的软件系统。”石家庄铁道大学复杂网络与可视化研究所副教授王威说,超级计算机多用于国家高科技领域和尖端技术研究,是国家科技发展水平和综合国力的重要标志,被誉为计算机中的“珠穆朗玛峰”。

此前,凭借每秒9.3亿亿次的浮点运算速度,“神威·太湖之光”曾连续4次蝉联全球超级计算机500强榜单冠军。

“人类对于计算能力的渴求是无止境的,甚至可以说是‘贪婪的’,也正因如此,超级计算机的设计、建设和使用更像一场没有终点的马拉松。”王威说,目前,中国超算正持续增加,其跻身500强榜单的总数单已由2017年的201套增至如今的206套。”

在众多超算领域的专家看来,超算这场“耐力赛”的下一个“赛点”已经逐渐明确,全球都将目光不约而同地投向了E级超算。

所谓E级超算,是指运算速度超过每秒100亿亿次浮点运算的超级计算机。凭借其庞大的计算能力,它将在解决人类共同面临的能源危机、污染和气候变化等重大问题上发挥巨大作用,是公认的超级计算机界的下一顶皇冠。

“E级超算可用于模拟全球气候变化、宇宙演化,处理天体物理大数据,验证新型材料等重大计算需求。”王威说。

加快布局下一代超算,我国也已将E级超算写入了“十三五”规划,正在部署解决超级计算机的软硬件核心问题。王威说:“对我们而言,相比关注排名变化,更重要的还是脚踏实地地往前发展。”

新的挑战:降低能耗提升效率

想要研制出E级超算,科学家们面临着很多现实挑战。其中,首当其冲的便是功耗过高。

王威举了一个很有趣的例子:在Google中,用户只要输入一个关键字,再键入回车就可以得到他想要的结果。有人曾做过计算,就是这样一个不起眼的搜索动作,所消耗的电能就足够一个11瓦的节能灯亮15分钟到1个小时。

在王威看来,百亿亿次超级计算机的建造难度,不仅在于速度的提升,更在于对大规模超算设备的功耗要求。“按照国际公认标准,E级超算的功耗应低于20MW。”他说,根据这一目标要求,未来E级超算的能效比要达到50GFlops/W,而“神威·太湖之光”只有6GFlops/W,相差了一个数量级。

不只是中国,全球超算领域的科学家们几乎都在为如何降低功耗而伤透脑筋。

“围绕解决这一难题,近些年,操着不同语言的科学家们进行了很多有益尝试,比如,让存储器更接近计算器、让高性能存储器向三维扩展、超算与闪存结合、在芯片不使用时关闭其中的电路、改变电压或频率等来节省功率,都取得了一定成效。”王威说,但要真正降低能耗,还需要来一场制造工艺的革命性突破。

除此之外,全球超算竞争中,我国亟须跑赢的另一个“赛道”,便是如何更有效地利用超算。

王威用“搬砖”做了个形象说明:100块砖,一个人1趟搬1块,需要往返跑100次,而如果有100个人同时搬,只需搬1次即能全部搞定。

“‘神威·太湖之光’有1000多万个核,使用它,就是让1000多万个核去解决一个问题,相当于一个人指挥成千上万的‘人’干活,如果不能科学管理,很难实现每个‘人’工作效率的最大化。”王威说,想要超算更好用,就要不断加强软件设计和应用程序研发,形成超算生态,并使其不断完善、更新。

然而,相较于超算硬件的研制,超算软件的开发往往需要更长的时间,除了经历科学问题建模、网格划分、求解数学方程、算法设计、运行验证等一系列流程外,还会涉及多种学科,过程非常复杂。

“值得高兴的是,国家已经开始加强超算软件方面的研究。”王威说,“目前,国内同时启动了三套E级超算研发,分别为国防科大/天津超算中心的天河三号、中科曙光的E级超算以及江南所/济南超算中心的神威E级,本着自主可控的原则,我国超级计算机的设计、建设和使用正稳步推进。”

融入生活:从天气预报到金融服务

“提到超算,很多人都觉得太高大上了,很难将它跟自己联系在一起。但作为一项具有战略意义的技术,它的应用已不局限于基础科学研究等领域,还将在生活的方方面面发挥重要作用。”王威说,最显而易见的例子就是天气预报。

“根据大气的实际情况,我们在一定的条件下,通过超级计算机进行数值计算,求解描写天气演变过程的流体力学和热力学方程组,就能预测未来一定时段内的大气运动状态和天气现象。”王威说,比如从太平洋上空流向大陆的气团,可能要飞行2到3天才能到达河北,气象局利用卫星观测数据和超级计算机,将气团的加速度、边界条件都计算出来,就能预测出气团到达河北的时间与强度,再根据华北地区的气象数据作出综合判断,一般在0.5小时至1小时内即可作出未来24小时的天气预报。

怎样才能找到并更合理地开发油气资源?这也需要借助超算。“通过将人造地震波的回波和传感器接收到的大量数据输入超级计算机,再对地层结构进行分析,科学家和地质工作者们就可以获知油气的位置、规模并决定是否具备开采条件。”王威说。

同样离不开超算的还有时下风头正劲的人工智能。对我们而言,想要分辨一只猫、一条狗,只需要短短几秒钟、看上一眼就足够了。但同样的要求对机器来说,却需要耗费大量时间,处理海量的图片、声音和图像等信息进行训练。

“由于计算机本身是无法理解图像、声音这些数据信息的,所以,如果想让机器变‘聪明’,就要将实际问题先转化为数学问题,即数学建模和求解。”王威说,“在这一过程中,科学家和计算机工程师将任务分解成多个抽象层次去处理,不同的层次间又相互叠加,即本层的输出是高一层的输入,同时还要完成层与层之间的监督和调度,如果没有超级计算机的协助,是不可能完成的。”

此外,经济发展对金融服务的要求就是“快”和“准”,比如很多人都在使用的扫码支付,要求付款后钱要在很短的时间内到账或记账,且不能出错,这种情况下,如果没有超级计算机的支撑是不可能实现的。还有覆盖全国的铁路、公路、航空、船运交通网络,对其运力的监测、调度和分配,都必须依靠超级计算机的强大算力才能实现。

在2017年11月举行的全球超级计算大会上,由清华大学地球系统科学系副教授付昊桓等共同领导的团队所完成的“非线性地震模拟”获得国际高性能计算应用领域最高奖“戈登贝尔”奖。

这项成果正是基于“神威·太湖之光”超级计算机的强大计算能力完成。项目团队成功地设计实现了高可扩展性的非线性地震模拟工具。该工具可以实现高达18.9PFlops的非线性地震模拟,也是国际上首次实现如此大规模下的高分辨率、高频率的非线性可塑性地震模拟。该工具首次实现了对唐山大地震发生过程的高分辨率精确模拟,使得科学家可以更好地理解唐山大地震所造成的影响,并对未来地震预防预测等研究具有重要的借鉴意义。

“可以说,超算用‘快’为我们打开了一个新的数值世界。”王威说,“让我们拭目以待‘E级应用’即将开启的新天地吧。”  (记者 张怀琛)

责任编辑:张永猛
更多精彩内容请关注
			河北新闻网
			官方微信
			
			河北日报
			客户端
			

相关新闻

电子报
网站首页 我要评论 分享文章 回到顶部