小里亚美2010年底,我们曾经亲身走进天津的国家超级计算中心,目睹了当时世界第一超算天河一号A的风采。世事变迁,性能堪比至少五个天河一号A的“泰坦”(Titan)又在美国的橡树岭国家实验室(ORNL)里屹立起来。接下来,我们就跟随国外记者的脚步,一同去探秘这个新的全球超算No.1。(友情提醒:图灰常灰常多哟)
ORNL是美国能源部委托UT-Battelle公司管理的一个国家级核心科技研究基地,超级计算机只是他们的一个工具而已。上一代的“美洲虎”(Jaguar)建成于2005年,之后每年都在进行升级,泰坦则是一次超大规模的更新换代。
泰坦还是200个定制的19英寸机柜和18688个计算节点,但已经更换为最新的Cray XK7计算系统,内部配置也大为不同:登陆与IO节点翻番为512个;处理器还是AMD Opteron,但是从12核心变为16核心,总的核心数量从224256个增加到299008个;每颗处理器搭配开普勒架构的NVIDIA Tesla K20高性能计算卡,总计18688个GPU;系统内存每个节点原来是16GB,现在不但翻番为32GB,还有6GB GDDR5显存,总量从300TB增至710TB;硬盘是一万块标准的1TB 7200转2.5寸机械盘,总容量10PB,下次升级会增加到20-30PB。升级替换下来的老硬件照例都交还给Cray。
由于超算的大部分工作都是远程执行的,泰坦内部还有几十个10Gbps以太网链接,还接入了能源部能源科学网络(ESNET)的100Gbps骨干网内。
而在峰值浮点性能方面,美洲虎“只有”2.3PFlops,泰坦猛增了几乎十倍,超过20PFlops,也就是每秒钟可进行2亿亿次计算。
全速运行的时候,它需要消耗900万瓦特电力,典型负载下也要700万瓦特,而这也是唯一限制它扩充的地方。为了减少供电线V。
泰坦的升级工作已经按时基本完成,并且立即就能投入科学计算工作,而且得益于Tesla计算卡的加盟,大量科学应用可以提速4-8倍。
至于泰坦是不是能够成功拿下第一,要到半个月后的新一届超算大会SC12上才会知晓,但就目前看来,已经是十拿九稳的了。
也许你想知道如此一套规模宏大的超级计算机系统是怎么组装的,但说出来可能会让你觉得很没意思,跟普通人DIY装机并没什么两样,只不过设备略有不同,同样的工作需要重复N多次而已。
“泰坦”系统是之前“美洲虎”(Jaguar)的升级版,拥有200个机柜、18688个计算节点的CrayXK7超算系统,每个节点有一颗推土机架构的AMDOpteron6200十六核心处理器、一块开普勒架构的NVIDIATeslaK20GPU加速计算卡,整体浮点性能超过20PFlops(每秒钟2亿亿次浮点计算),是当今世界最强悍的开放科学超级计算机,有望在下个月的最新一期全球超级计算机TOP500排行榜上登顶。
|