“天河一号”总设计师杨学军揭秘“冠军”计算机

时间:2024-03-11 15:16:10

资料图片:2009年10月29日,国防科技大学成功研制出的峰值性能为每秒1206万亿次的“天河一号”超级计算机在湖南长沙亮相。我国成为继美国之后世界上第二个能够研制千万亿次超级计算机的国家。超级计算机又称高性能计算机、巨型计算机,是世界公认的高新技术制高点和21世纪最重要的科学领域之一。新华社发(何书远 摄)

11月17日,一名工作人员检查正在运行的“天河一号”。新华社记者 岳月伟 摄

新华网天津11月17日电题:“天河一号”折桂得益于技术上的“绝活”——新华社独家专访“天河一号”总设计师杨学军

  新华社记者余晓洁、周润健、吕秋平

  17日,美国新奥尔良。

世界超级计算机500强正式颁发证书。国防科技大学研发的我国首台千万亿次超级计算机“天河一号”一举夺魁,站上世界计算速度之巅。

  “天河一号”究竟有多快?如何在众多欧美超算高手中“突出重围”?有哪些创新之处?掌声背后研发人员经历了哪些不为人知的艰辛?中国超算未来面临哪些新的机遇和挑战?

  “天河一号”总设计师、国防科大副校长杨学军第一时间接受新华社记者独家面对面专访时,即兴赋诗——“梦幻天河弹指间,电闪巡地十亿年。滨海坐拥飞流急,倚天妙算出奇篇。”

  “天河一号”算一小时,相当于全国13亿人每人算340年

  记者:“天河一号”究竟有多快,性能到底有多强?功耗和安全性怎样?

  杨学军:“天河一号”峰值运算速度每秒4701万亿次。它运算1个小时,相当于全国13亿人同时计算340年;它运算一天,相当于一台双核高档桌面电脑不停工作620年。“天河一号”存储容量为2千万亿字节,能“吞进”100万字的书籍10亿册。

  它满负荷运行的总功耗是4.04兆瓦,即每小时耗电4040度。在国际绿色超级计算机排名(Green 500)中,紧随3台IBM蓝色基因之后,名列第四。

  “天河一号”的操作系统软件是国防科大自主研制的“麒麟”。用户可定制“私密”空间,就像租用银行保险箱一样,其他用户甚至管理员都不能访问,所以非常安全。

  “天河一号”折桂得益于技术上有“绝活”

  记者:从2008年投入研制,到2010年问鼎世界之最,是什么让“天河一号”这么短时间内在众多欧美超算高手中“突出重围”?它有哪些创新之处?

  杨学军:这得益于党建设创新型国家的战略布局,得益于我国经济建设对高性能计算机的需求,得益于军委和总部领导对国防科大的关心与厚爱,得益于科技部和“863”专家组对国防科大的信任,得益于国防科大校领导的果断决策和精心组织,得益于全国超算专家的大协作,得益于周兴铭院士、卢锡城院士等老专家、老教授的传帮带,得益于天河团队的勇气、信心、拼搏和奉献,得益于国防科技大学在高性能计算技术方面的长期积累和技术“绝活”。

  在技术方面,“天河”有如下主要特色:一是结构设计上,我们采用通用CPU和GPU结合的构架。它保证“天河一号”在有限场地、有限资金、有限电源容量的情况下实现每秒4701万亿次的高效计算。中国最先在世界上成功运用了这条技术路线。

  二是自主研制的互联通信的整套软硬件,可以把几万颗微处理器高效地联系在一起,求解一个问题。它比国际上最好的商用产品快两倍。如果没有高效互联,CPU、GPU数量越多,实用性能反而会越低。

  天河的互联通信系统最核心的是两片芯片,一个芯片是路由器,实现数据交换,传统上是一个大的交换开关,现在我们在一个单片上用许多小“瓦片”(小的交换开关)实现了更强大的数据交换能力,这是天河又一技术创新。第二个芯片是网络接口,有效、合理地分配了通信接口的软硬件功能,保证了数据能快速进出计算部件。对高性能计算机而言,好的互联通信系统能保证数据从一个目的地(计算部件)到另一个目的地快速传递,使多个计算部件协调工作,来求解一个问题。

  打个比喻,如果把一台大机器比作一个城市,互联通信系统就是城市内的公路网,路由器就是立交桥,通信接口就是主干道出入口。现实证明,城市其他市政设施建设得再好,如果这两个地方没有设计好,城市交通依然会拥堵不堪,只有它们设计得合理,才能保证城市运行高效。