3000核!用750张树莓派挑战最经济超算

国家耗数亿元巨资打造的天河、太湖之光等超级计算机,使中国得以在超级计算机排名中长期霸榜。不过除了砸大钱盖超级计算机之外,美国国家实验室则是选泽了更节省成本的方式,来打造超级计算机,利用750片树莓派开发板组成的运算丛集,成功打造出一台更省钱的超级计算机,未来更要扩大至1万个节点扩充,挑战挤进全球百大Peta级超级计算机排名。目前这套HPC系统已经实际展开测试,未来也将用于科学研究之用。这台树莓派超级计算机本周也在美国丹佛举行的2017超级计算机展上公开展出 。

这套系统藉由5套每个包含150张Raspberry Pi 3 B的6U机箱模块构成,且由于Raspberry Pi 3 B搭载了64位的四核心ARMv8 1.2GHz,高达750张Raspberry Pi 3 B也意味著有超过3000个以上的核心,足以满足特定超级计算机的多核需求。

值得一提的是,Raspberry Pi 3 Model B的国内售价为240元左右,所以750张树莓派组成的超级计算机售价大概为18万元,这对于一台拥有3000核心以上的超级计算机来说已经是最低价格了。

其实利用树莓派来打造超级计算机,早已不是新鲜事。火柴盒大小外型的树莓派,因为具备有迷你电脑的功能,2012年一推出就十分受到欢迎,甚至还掀起了一股自造者(Maker)风潮。一台千元有找的树莓派开发板,因为价格便宜,不只成为许多新创公司开发及验证产品的首选,这股DIY热潮甚至也蔓延到科学界,开始有人将它用在科学研究,例如,2012年就有美国树城州立大学博士生Joshua Kiepert用32个树莓派组成运算丛集,成本不到2,000美元。

后来,更有英国南安普敦大学一名电脑工程师,使用64个树莓派和乐高积木,来打造出超级计算机Iridis-Pi,成本只花不到台币13万元。这次由美国能源部两大国家实验室之一的洛斯阿拉莫斯国家实验室( Los Alamos National Laboratory)自建的树莓派超级计算机,使用的树莓派更是当时数量的10倍,多达成750片树莓派开发板组成的运算丛集。

用750片树莓派打造世界级的超级计算机

洛斯阿拉莫斯国家实验室自建的超级计算机,主要采用BitScope提供的模组式刀锋机柜来搭建,因为全采用树莓派开发板来设计超级计算机,所以成本上也比一般超级计算机还便宜,甚至使用上也更省电,每个运算节点平均耗电只有2到3瓦而已。

根据洛斯阿拉莫斯国家实验室高效能运算部门负责人Gary Grider表示,这个树莓派超级计算机系统内,总共内建750个CPU计算节点(采用1.2 GHz Quad Core ARMv8处理器),拥有高达3,000颗核心可供计算使用,已经具备有等同超级计算机的计算能力。该实验室未来还要扩大规模挑战1万个,甚至最多5万个节点扩充,单以运算效能来看,理论上,跟自家的Grizzly超级计算机系统(全球排名85,运算效能达到1.5 PFLOPS)相比,将毫不逊色,甚至比台湾国网中心自行研发排行全球95名的Peta超级计算机(运算效能有1.325PFLOPS)都还快。

不只目标要挤进前百大,这台树莓派超级计算机的建置成本,比起一般超级计算机还更加便宜,虽然Gary Grider并未透露实际的建置成本,但若以他们使用的Raspberry Pi3 Model B(售价35美元)来计算的话,750个树莓派加总成本差不多2万6千美元(约台币78万元),即使在加上其他的基础建置费用,还是远比一般动辄上亿美元的超级计算机建置成本低许多。

Gary Grider表示,开发人员可以利用树莓派的模组及软体,在超级计算机上来编写应用,而不需要花费数亿美元购买高成本的软硬体,来搭建HPC测试平台,而且更耗电,需要数百万瓦(MW)的电力才可供系统正常运作。 Gary Grider也透露,他们自建的树莓派超级计算机,每个运算节点平均耗电只有2到3瓦,即使是将750个节点全部加总起来,耗电量也远低于目前许多的超级计算机,不只省钱也省电,而且系统还可以依需求弹性扩充。

树莓派超级计算机的机箱共有5个刀锋模组组成,每个模组可以装下150片树莓派开发板,上图为其中一个刀峰模组,并经由乙太网路连接,来建立运算丛集,机箱内也整合交换器,还配备一组48伏特的电源供应器设备来供电。

然而,要用数千到数万台树莓派组出一台Peta级的超级计算机,并不是件容易的事,因为随着运算丛集规模变大,不同运算节点和节点之间连接和传输也将变得更加复杂,而容易造成存取延迟与传输频宽不足的问题,而影响了系统的效能,这也是系统扩充的挑战。即使是洛斯阿拉莫斯国家实验室一开始,也只能扩充到最多40个运算节点,后来,他们找来了HPC厂商BitScope及SICORP共同合作,重新设计机箱和进行系统整合,来解决系统扩充的难题,才从原来最多40个节点,增加到144个,到现在的750个节点,未来还要挑战数千到数万个节点的扩充。

根据SICORP网站的介绍,树莓派超级计算机是采用BitScope提供的模组式刀锋机柜来搭建,机箱内由5个刀锋模组组成,每个模组一次最多可以装入150片树莓派开发板,这些运算模组可以经由乙太网路连接,来建立运算丛集,机箱内也整合网路交换器,还配备一组48伏特的电源供应器设备供电。

不过,Gary Grider也强调,这台树莓派超级计算机并非用来取代其他超级计算机,而是希望当作提供给开发人员,及研究者,另一个可用于研究测试及验证的全新HPC运算平台,不只具备高效能计算能力,而且更便宜。他也表示,未来除了会持续增加节点数量,来提高运算效能外,也将建立新的网路架构,并且结合引入( bootstrap)、管理及灾难复原的演算法,以及聚焦系统与分散式储存研究等。