数十亿美元的大脑

7分钟阅读

IBM在洛斯阿拉莫斯研发的Roadrunner有望成为世界上第一台突破petaflop大关的计算机,但它的最快速度可能不会保持太久。

曾经只被称为“Y遗址”,洛斯阿拉莫斯国家实验室作为曼哈顿计划的一部分,盟军开始秘密开发世界上第一枚核武器。

IBM的Cell刀片

50年过去了,该实验室的主要目的之一是运行美国的核储备管理计划。虽然这项艰巨的任务不再涉及核试验,但它需要一支由工程师和研究人员组成的小部队,对美国老化的核武器库进行测试。

该计划的关键要素之一是在房间大小的超级计算机上运行复杂的模拟,以了解老化核材料的动态特性,并模拟武器的各种组件随着时间的推移可能发生的变化。该计划更险恶的一面是,除了确保安全之外,还要确保这些武器随时可以使用。

这项任务的一个重要部分是计划建造世界上最强大的超级计算机,名为“Roadrunner”,这台下一代超级计算机将有助于确保世界上最强大国家的核武器储备的安全。

由美国能源部的国家核安全局这台机器是由谁制造的IBM与洛斯阿拉莫斯合作。据估计,一旦Roadrunner完成,它将成为第一台打破千万亿次浮点运算神秘障碍的超级计算机。Flops(每秒浮点运算次数)是计算能力的衡量标准,指的是系统能够执行的计算次数。

在Roadrunner上线之前,最强大的计算机也是由IBM制造的:Blue Gene L劳伦斯利弗莫尔实验室在加州。这台机器引领了新一代强大计算机的潮流,轻而易举地让当时世界上最强大的日本计算机黯然失色地球模拟器.虽然“蓝色基因”几乎比“地球模拟器”强大一个数量级,但“Roadrunner”的能力将再次提高五倍。

在过去的几年里,蓝色基因系统在计算能力上不断打破所有记录,最高时速达到207万亿次。teraflop相当于每秒运算10亿次,而petaflop——科学计算的圣杯——相当于每秒运算1万亿次。据估计,Roadrunner的运算速度将达到迄今为止难以想象的每秒1.6千万亿次。

IBM深度计算副总裁David Jursik表示,尽管Roadrunner将承担管理核储备的关键工作,但它在普通科学领域也有巨大的潜在应用,特别是在大型物理和化学实验中的数字处理方面。他说,这将比以前建造的任何建筑都要大得多。“Roadrunner真的比Blue Gene再上一个台阶。”

洛斯阿拉莫斯国家安全局发言人凯文·罗克解释说,“Roadrunner”的主要任务将是验证武器代码,并研究非常详细的水动力系统计算机模型,以分析核武器爆炸时具体发生了什么。罗克说,目前计算能力的限制意味着这样的模拟通常需要几个月的时间,因此不经常执行。他声称,有了Roadrunner,在短短几天内就可以进行核武器爆炸的3D模拟。这将使美国核武库接受比目前更为严格和频繁的分析成为可能。

这台机器并不会把所有时间都花在核武器上。它还将用于各种各样的理论和计算科学实验,在这些实验中,它的相当大的能力将被用于应对诸如气候系统建模和原子尺度上模拟奇异材料等挑战。
然而,它不会像许多欧洲研究机构那样供外界使用。罗克强调说,“跑路者”是一个围栏后面的设施,不能在武器设施之外使用。

IBM的Jursik表示,建造超级计算机的一个限制因素是芯片制造的自然极限已经达到了它们的紧凑程度。

他说,在过去二三十年里,要想让它更强大,你只能让更小的芯片更强大,但现在芯片已经尽可能小了。“所以人们只是在他们的芯片上添加更多的cpu,并寻找不同的方法来最大化功耗。”Roadrunner是一个答案,但还会有其他答案。”

Roadrunner背后的创新在于它的混合特性。除了更传统的AMD Opteron处理芯片外,这台超级计算机还将配备等量的Cell芯片,这些芯片最初是为索尼的Playstation 3游戏机设计的。蓝色基因的方法是使用大量低速、低功耗芯片,而Roadrunner的设计则依赖于Cell芯片提供的惊人加速。它们是专为高速传输海量数据而设计的,自诞生之初就已经在游戏市场之外的许多应用中找到了自己的方式。工程师,七月三日)。

Roadrunner完成后将占地1.2万平方英尺,包括约16,000个AMD Opteron处理器和另外16,000个Cell处理器。尽管这台机器将使用标准的现成硬件来运行,但它的混合特性将需要极其先进的软件来协调两组处理器。

该系统将配备智能“混合编程”软件,可以根据特定需求将任务部署到机器的不同部分。例如,涉及机器内部通信和内存的“标准”计算任务和过程将通过Opteron处理器运行。然而,更复杂、更密集或更专业的计算将被发送给Cell处理器来处理。Jursik说:“我们希望这将定义一套编程工具,对其他计算社区有用。”

虽然IBM正在为Roadrunner提供处理器和节点,但基础设施的责任将由Los Alamos承担。普通的观察者可能会认为这种超级计算机的冷却和电力需求会带来一些重大的工程挑战,但根据罗克的说法,运行Roadrunner是这个高科技设施的日常工作。“我们有能够冷却运行异常热的部件的冷却器——我们的计算楼层甚至还没有接近容量——我们有多余的空间、冷却和功耗——这些都不是问题。他得意地说。

然而,这个基础设施最有趣的方面之一是冷却系统。该系统目前用于冷却超级计算机q和两个主要的Linux集群,即闪电和Bolt,该系统迫使冷空气通过蜂窝地板系统。当冷却的空气被计算机加热时,它上升,被墙壁上的风扇拉出计算地板,最终排回冷却系统。

但是,当工程师们准备开始安装Roadrunner时,竞争对手的开发正在加快步伐,可能会削弱它的霸主地位。Jursik说:“欧盟已经有了建造千万亿次计算机的计划,而日本也有了建造每秒10千万亿次计算机系统的早期计划。”

事实上,《工程师》杂志的研究表明,这些竞争对手中最先进的是日本的项目,在那里,日本研究机构获得了1100亿日元(4.97亿英镑)的政府资助日本希望能在2012年拥有10-petaflop的计算机。

据理研研究所下一代超级计算机研发中心开发组主任Ryutaro Himeno博士介绍,这台强大的机器将被用于模拟蛋白质和其他分子之间反应核心的原子间作用力。Himeno解释说,一台10-petaflop的机器将能够处理100万个原子,在24小时的计算时间内,可以模拟20纳秒的蛋白质反应。他补充说,这台机器还将促进地球科学、环境科学、纳米科学和制造业等其他领域的进步。

事实上,理研的意图是,与Roadrunner不同,它的机器将用于工业。据理化研究所的一位发言人说,例如,该系统可以被工程行业用于通过流体流动模拟来改进气动设计。另一个现实世界的好处可能来自材料科学。该发言人表示,该计算机可用于测试每种可能材料的所有合成比,以发现用于燃料电池的新材料。

尽管如此,这家日本公司已经在考虑一台处理能力曾经不可想象的计算机的局限性。Himeno称,10-petaflop的机器对于模拟整个人体的组织、血液流动和运动来说太慢了,他的团队希望最终能开发出1亿亿次浮点运算的机器,这将能够“模拟生命本身的现象”。

在美国本土,欧洲超级计算机突破千万亿次大关的计划则有些不明朗。微软高端计算部门负责人休·皮尔彻-克莱顿表示EPSRC在美国,这种机器的计划还处于萌芽阶段,欧洲的研究人员和科学家目前正在研究一个科学案例。
根据两周前公布的科学路线图欧洲研究基础设施战略论坛(ESFRI),可能需要一个强大的超级计算机在金字塔的顶端较小的设施。

但牛津大学首席执行官约翰•伍德(John Wood)教授研究委员会中央实验室ESFRI主席、牛津郡卢瑟福-阿普尔顿实验室(Rutherford-Appleton Laboratory)的教授表示,欧洲研究界所需要的并不一定就是功能强大的超级计算机。他说:“对于是需要一台通用的大型机器,还是需要几台专门用于特定领域的机器,人们展开了激烈的辩论。我们确实感到,各国都在争先恐后地拥有最新最强大的机器,而不考虑是否有足够的用户能力。”
与此同时,英国下一个超高速数字处理器的研发工作正在蓄势待发。虽然它无法达到Roadrunner所承诺的处理速度,但将于明年4月启用的高端计算四次计算资源(HECTOR)将能够以高达100万亿次浮点运算的速度运行。这将使它比目前欧洲可用的任何东西都要快。然而,EPSRC的赫克托项目经理詹妮弗·霍顿(Jennifer Houghton)说,机器的位置还没有决定。

基于Cray XT3超级计算机,赫克托将供整个英国研究界用于实验,包括环境建模,原子物理实验,以及计算工程和材料模拟。

例如,该设施预计在大型设施(如牛津郡的钻石同步加速器)的实验计划和研究中特别有用,以及在设想中的4GLS项目(工程师9月18日)。

核心工程应用可能包括提高对湍流现象的理解,这是一种异常难以用数学方法预测和分析的现象。在格拉斯哥大学的一个研究小组提出的一个项目中,他们希望利用这台机器来加深对直升机旋翼叶片周围不稳定流动的理解。该设施还可能在材料开发方面取得突破。

例如,根据Hector的科学案例,大多数裂缝模拟仍然只是二维的,但随着计算机能力的提高,这些模拟可以完全变成三维的,使工程师能够解决诸如裂缝边缘台阶结构及其对一系列材料性能(如抗化学攻击)的影响等问题。

回到新墨西哥州,Roadrunner的第一批部件已经开始运抵。在接下来的几年里,IBM将开始为超级计算机安装第一批硬件。然后,编程系统的工作将正式开始,该系统将在两组处理器之间分配工作,并开始寻求突破千万亿次浮点运算的障碍。

但是,无论它多么强大,在超级计算机的世界里,事情发展得很快,Roadrunner作为世界上最强大的超级计算机可能不会持续太久。