新一轮超算竞争:中美争霸,日本紧跟,第一王座犹如“火山口”

云视角

2019-09-18

科技云报道原创。

在超算的竞争方面,中国、美国、日本三国均时刻保持着高度警惕和你追我赶的态势。

近期,日本理化学研究所和富士通公司联合设计制造的超级计算机正式命名为“富岳”,该超算运算速度超过目前日本最快计算机“京”的100-120倍,预计在2020年启用后,日本有望争取登上世界第一超算的宝座。“富岳”是富士山的别名,借此寓意新一代超级计算机性能之高、使用领域之广。

不过,世界第一超算的王座犹如一个火山口,想坐稳并不是那么容易的。即使“富岳”登顶世界第一超算,但可以料想的是,其排名随后可能就会被中美新的超级计算机赶超。

截至2019年,中国和美国分别拥有全球500台最快超级计算机的43.8%和23.2%。同时运行的两国都在追求生产第一台超级计算机的最终目标。

精密工艺造就彪悍性能

中美日三国共同瞄准超算

“富岳”继承和加强了“京”的构架,也继承“京”的程序遗产,以保证高实用性。“京”目前主要应用包括:

在天气预报精度上,可以同时处理世界各地的气温、气压和风速,预测天气下一步的变化;

首次对汽车空气阻力进行高精度模拟,节省了新车开发费用和时间;

在科学研究方面,描绘地球暖化后的未来世界,解释宇宙中物质诞生的机理,探索大灾难发生时最有效的避难方法等。

而“富岳”系统综合能力超群,其消耗电力性能、计算能力、使用简便性都将是划时代成果。

值得一提的是,富士通为该超算全新研发了“富岳”处理器——A64FX,该处理器架构转向ARM,富士通并联合ARM推出了SVE(可伸缩矢量扩展)指令集,支持512bit浮点运算单元,大幅强化浮点性能。

A64FX的架构设计也很特别,有48个计算核心及4个协助核心组成,分为四个CMG单元,每个单元13个核心,28Gbps I/O带宽,16条PCIe 3.0通道。

A64FX将使用高性能的HBM 2内存,每个CMG单元配备8GB HBM 2,带宽256GB/s,总计32GB HBM 2,1024GB/s带宽。

A64FX处理器使用7nm FinFET工艺生产,87.86亿个晶体管,性能可达2.7TFLOPS,是前代的SPARC V9处理器1.1TFLOPS的2.5倍左右。

如此之高的制造工艺造就了“富岳”强悍的运算性能,其运算性能超出“京”的100-120倍,耗电也较“京”的12.7兆瓦仅高出三倍,约为30-40兆瓦,并设计为适合深度学习等人工智能领域的广泛应用。

在排名方面,“京”在2011年的开发阶段,运算速度在全球排行榜中居首,但截至去年11月的最新排名为第18位。

前几名为美国和中国的超级计算机。美国和中国也表示到2020-2021年开发拥有“富岳”同等能力的超级计算机。

制造工艺极限有待突破

超算领域的竞争永无止境

在超算领域,没有什么是绝对的,有的只是相对,排名如此,格局亦如此。

20世纪90年代初期,个人计算机正式从16比特进化到32比特。64位精简指令处理器出现并应用于商用计算机领域。

彼时,超级计算机商业大战正处于鼎盛时期,采用专用的矢量型处理器可以同时处理大量运算,美国处于领先地位。随后,由通用处理器组成的标量类型出现,超级计算机转移到标量类型。

矢量计算机也被称为“向量计算机”,它是一种能够进行矢量运算,以流水处理为主要特征的电子计算机。对多组数据成批地进行同样的运算,得到一批结果的运算方法,即被称为“矢量运算”。

如果一次只能对一组数据进行运算,则称为“标量运算”。显然,矢量运算的速度要比标量运算的速度快许多倍。以前的大中型计算机一般只能作标量运算,目前世界上运算速度超过一亿次以上的巨型计算机已经设计成为矢量计算机。

注重矢量型超级计算机的是日本电气股份有限公司(NEC),在每半年评比一次的超级计算机500强排名中,NEC和日本海洋研究开发机构开发的“地球模拟”超级计算机在2002年获得世界第一,这一纪录保持了两年半之久。

“地球模拟器”向世界展示了日本的实力。但自2004年被美国IBM夺回第一名之后,日本远离了超级计算机性能排行榜的前几名。

日本在超级计算机领域的再次辉煌是“京”时代。2011年,理化学研究所和富士通合作设计制造的超级计算机“京”又一次坐上了世界第一的宝座,超级计算机重新被定位为日本国家根本的基础技术。

近年来,在超算王座的竞争中出现了中国身影。中国超算连续5年在竞争中排名第一。直到2018年11月,美国能源部所属奥克里奇国家实验室与IBM制造了“顶点”超级计算机,重新夺回了世界第一的位置。

“顶点”旨在将“CPU+GPU”处理器组合起来,根据用途分担擅长处理的“异构计算”。今年5月,美国公布了新型超级计算机“前沿”的开发计划。“前沿”与“富岳”一样,将应用在人工智能等领域,新一轮的超算竞争或许会在中、美、日之间擦出新的火花。

但就超算制造工艺而言,超级计算机以及支撑超级计算机系统的半导体技术已经接近目前基础科学的极限。世界主要几个国家正在研究远超目前超级计算机运算速度的数字退火计算机以及未来的量子计算机。

今年,富士通公司成功研发出了“数字退火”(Digital Annealer)计算机,这是目前唯一解决“组合优化问题”的实用化计算机。

“退火”是指借鉴传统固体退火物理原理设计的算法,数字退火是一种介于目前超级计算机和未来量子计算机之间的全新构架计算模式。

该计算机运算速度惊人,日本超级计算机“京”需要8亿年时间才能完成的运算,“数字退火”计算只需一秒即可完成。

此外,目前半导体工艺也遭遇到了极限挑战,半导体工艺的极限是1纳米,而现在已做到了3纳米。科学家正在努力寻找非半导体的下一个突破,而突破何时到来尚不可知。

当然,超算如今已成为科学力量的一种象征,不计其数的超级计算中心,以及它们所拥有巨大的底层计算能力,将为国家的声誉和战略竞争力提供不可替代价值,无论是哪个国家都不想错过。

【科技云报道原创】

微信公众账号:科技云报道

推荐文章