超级计算机天河二号浅析_天河二号 剖析-程序员宅基地

技术标签: 超级计算机  高性能计算  超级计算  人才  

1.天河二号诞生

  天河二号是国家科技部“十二五”863重大项目立项研制的项目,国防科技大学牵头进行了研发工作。近300人的研发团队从2011年开始,历时两年多才研制完成。

  在天河二号之前,国防科技大学的团队曾在2010年研制出了天河一号,并首次让中国超级计算机站到了世界冠军的领奖台上。

  然而,仅仅过了不到8个月,日本一台名为“京”的超级计算机就将天河一号挤下冠军台。之后,美国研制的“红杉”、“泰坦”超级计算机也先后坐上世界第一的交椅,天河一号排名滑落至第8名。

  实际上,当外界还称赞天河一号夺得世界第一时,天河二号的开发工作已经悄然展开。2013年6月,经过280多人长达2年多的潜心研发,天河二号正式研制成功,并很快夺回超级计算机冠军的宝座。至今,天河二号已经连续3次成为全球最快的超级计算机。

2.天河二号能够做什么

  天河二号历时两年多研制完成,耗资上亿美元。如此巨额的投资,最终当然是为了服务国家经济建设,而非只是标榜国家在超级计算机领域的能力已经达到怎样的高度。

  除了助力探月工程、载人航天等政府科研项目外,天河二号目前已经逐渐应用于民用领域,比如石油勘探、汽车飞机的设计制造、基因测序等。

  在“天河二号”一排排高大的黑色机柜里,一共装有32000颗主CPU和48000个协处理器,共300多万个计算核心。拥有如此多的计算核心让它的运算速度也非常惊人。

  据测算,天河二号的峰值计算速度达到每秒5.49亿亿次,而持续计算时的速度每秒可达3.39亿亿次。假设每人每秒钟进行一次运算,“天河二号”运算一小时,相当于13亿人同时用计算器算上1000年。

  据专家介绍,传统手段研发新车,一般要经过上百次碰撞实验、历时两年多才能完成,而利用天河二号进行模拟,只需3到5次实车碰撞、两个月即可实现。

  此外,天河二号还可应用于娱乐产业,现在通过超级计算机制作动漫和3D电影已经成为潮流。电影《阿凡达》动漫渲染制作耗时一年多完成。如果用天河二号,仅用1个月就可制作出与《阿凡达》动漫渲染效果相当的影片。

  中国商用飞机设计有限公司北京研究中心利用约2.4万CPU核开展了大型民机全参数气动优化设计,在天河二号计算6天,完成了其自身计算平台约需2年的工作量,极大地提高了优化工作效率。

  华大基因互联网支撑与发展中心负责人说,天河二号具有强大的计算能力,以500人规模的全基因组信息关联性分析为例,华大基因利用原有计算机需1年时间,利用天河二号只需3个小时。华大基因是天河一号和天河二号的大商业客户。

  据该负责人表示,华大基因使用的生物信息软件能迅速在天河二号上运行,不需要再另外进行编程;同时天河二号强大的计算能力,可以快速满足华大基因海量基因数据分析所需的计算资源,节省大量分析时间。

  截止目前,国家超算广州中心的天河二号在短短几个月的运行中为120多家用户提供了300多项典型应用计算。

  更为重要的是,天河二号这样的技术实际上可以进行复制。据天河二号主任设计师卢宇彤透露,天河一号和天河二号的技术可以用在规模小一点,用户可以定制的“小天河”超级计算机上。“2010年,天河一号研制成功以后,实际上到2012年,‘小天河’这样的系统已经推广了11套。”

3.能耗难题:年耗电上亿元

  对于外界对天河二号的耗电量高的质疑,中科院计算所计算机体系结构国家重点实验室研究员张云泉表示,虽然目前天河二号的能耗绝对值很高,但是外界应该看到它的性能也高。  从目前天河二号来看,计算节点的能耗约为18兆瓦,再加上散热系统的整体能耗在20兆瓦以上。如果正常运行,天河二号每年的电费就会超过1亿元,年耗电量约为2亿度。

  张云泉的意思是说,外界也应该注意到这一点:天河二号在单位耗能内实现的计算速度更快。

  目前天河二号的的运算能耗比约为1.90千万亿次/秒兆瓦,落后于计算能力排名第二、第三的“泰坦”和“红杉”,但是远高于排名第四位的日本“京”的 0.83千万亿次/秒兆瓦,也高于排名第五的“米拉”的0.92千万亿次/秒兆瓦。

  “泰坦”和“红杉”的运算能耗比分别是1.95千万亿次/秒兆瓦和2.17千万亿次/秒兆瓦,运算能耗比略高于天河二号。

  现如今,天河二号作为世界排名第一的超级计算机,其理论峰值性能超过了5亿亿次/秒,但是距离未来将要实现的100亿亿次/秒目标依然有着不小的差距。

  目前天河二号拥有1万多个计算节点,未来计划将节点数量增加到3万甚至5万个。但随着节点数量的提升,在管理和能耗方面的问题也将彻底凸显出来。天河二号“4个超级”其中包括超级耗电

  “如果按现在的趋势这样增加下去,100亿亿次/秒的超算系统功耗将达到400兆瓦,肯定是无法接受的。”张云泉告诉新浪科技,国际上公认的100亿亿次/秒的超算标准是,功耗必须控制在20兆瓦内。

  “实际上,这就要求未来的超算系统能够进行体系结构,硬件、软件和制冷等多方面的创新。” 张云泉说。

4.超算的难题:应用软件缺失

  计算能力的不断提高是一个重要的课题,但将超级计算机应用起来显然意义更大。

  中国已经连续四届拿下超级计算机的桂冠,但根据国际TOP500组织今年6月公布的最新全球超级计算机500强排行榜,美国仍然是拥有超级计算机最多的国家,在500强名单中占据233席。中国有76个超级计算机进入最新的500强榜单,位居世界第二。第三位至第六位,分别是日本、英国、法国和德国。

  目前,我国国家级超算中心主要有天津中心、济南中心、长沙中心、深圳中心以及广州超算中心。这些超算中心承担了超算推广与应用的任务。

  据行业人士介绍,按运行时间看,国内超算中心的资源利用率普遍都在70%以上,有的甚至超过80%。相比之下,国外超算中心的利用率普遍在60%左右。不过,受限于软件开发和应用支持,国内超级计算机运行时的资源利用率低下。

  上海超算中心拥有200万亿次计算能力,但是只有20-30%运算任务能够扩展到10万亿次,有20-30%的计算任务能够利用的计算力低于2万亿次。很多计算资源由于应用的问题实际上用不到,造成一定的浪费。

  对于应用落后的问题,国家863计划“高性能计算机及其核心软件”重大专项总体组组长钱德沛教授曾指出,这主要有三个原因:第一、中国开展超级计算机业务的时间还很短;第二,超级计算人才缺乏;第三,中国软件发展体制存在问题,由于盗版等因素没人愿意进行大型应用开发。

  据他当时透露,“十一五”期间国家在超级计算机项目上投资了9.4亿元,但是真正用于应用开发的费用还不到1亿元。“应用瓶颈是一个过程问题,未来这个问题还会长期存在。”

5.超级计算机前五名(参考网址:http://www.top500.org/)

附:世界超算前5名


本文参考网址:http://tech.sina.com.cn/it/special/forefront/tianheerhao/


版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/ftdliyang/article/details/38826271

智能推荐

慕课编译原理(第八章.扩充的巴科斯范式和语法图)_bnf范式概念在编译原理第几章-程序员宅基地

文章浏览阅读700次。慕课广西大学.编译原理.第八章.语法分析-自上而下分析2.扩充的巴科斯范式和语法图0 目录8 语法分析-自上而下分析28.2 扩充的巴科斯范式和语法图8.2.1课堂重点8.2.2测试与作业9 下一章0 目录8 语法分析-自上而下分析28.2 扩充的巴科斯范式和语法图8.2.1课堂重点8.2.2测试与作业9 下一章博客地址: ..._bnf范式概念在编译原理第几章

【(自动)运动控制系统】学习笔记_从电感矩阵方面说明非线性强耦合的根本原因-程序员宅基地

文章浏览阅读1w次,点赞17次,收藏69次。作者:MiTu_-_课程:运动控制系统参考书目:《自动控制系统》第二版 北京邮电大学 任彦硕 赵一丁运动控制系统一、课后习题二、直流调速三、变流调速四、简答一、课后习题U1 绪论自动控制系统结构七个环节:给定环节、放大环节、执行环节、控制对象、反馈环节、比较环节、校正环节自动控制系统举例(三选一):(一)速度给定控制系统  对 A 点列节点电流方程为:  某一时刻开始直流电动机转轴上负载转矩增加了一个恒定量,起始时,由于电动机输出功率还未来得及增大,转速将降低。使得测速发._从电感矩阵方面说明非线性强耦合的根本原因

报错: Could not build wheels for pillow, which is required to install pyproject.toml-based projects的解决_error: could not build wheels for pillow, which is-程序员宅基地

文章浏览阅读8.2k次,点赞6次,收藏4次。刚开始按报错的提示安装pillow==4.0.0版本的,就报上面的错误,上网上找解决方法,都未能解决,然后试着安装更高版本的pillow==10.0.0版本的,结果就成功了,我用的python版本是3.8的,估计是和python的版本与pillow版本里引用的库的兼容有关系,升级到相对应的版本就可以解决以上问题。以上供大家参考,讨论。_error: could not build wheels for pillow, which is required to install pypro

win10+uefi+gpt安装一键GHOST之后无法重启的快速解决方法(无需重装系统无需修复引导)_一键ghost不支持uefi+gpt-程序员宅基地

文章浏览阅读5.8w次,点赞2次,收藏7次。今天装完常用软件后,准备一键备份一下系统,就从一键GOST官网下载安装了一键GHOST,安装完成之后提示不支持UEFI+GPT格式系统,但仍可以使用,就没在意,也没卸载,接着就重启电脑试一试,结果就出现了无法进入系统引导的情况。 折腾一番BIOS之后,发现只需要按F7(我的笔记本主板选择启动方式或者说选择启动盘的快捷键是F7键,具体哪个按键根据自己电脑主板选择),选择windows_一键ghost不支持uefi+gpt

JVM之三大性能调优参数_jvm三大性能调优参数-程序员宅基地

文章浏览阅读339次。—Xss:规定了每个线程虚拟机栈的大小,会影响此进程中并发的线程数。—Xms:堆得初始值。—Xmx:堆能达到的最大值。一般Xms与Xmx的值设置的一样大小,当堆不够用进行扩容时会发生内存抖动,影响程序运行的稳定性。..._jvm三大性能调优参数

AndroidStudio_安卓原生开发_Android中调用摄像头拍照_并剪裁图片---Android原生开发工作笔记138_android studio如何调用摄像头-程序员宅基地

文章浏览阅读884次。写一个按钮,点击事件,然后:1.调用代码: openCamera(this);2.粘贴以下代码实现拍照 public void openCamera(Activity activity) { //獲取系統版本 int currentapiVersion = android.os.Build.VERSION.SDK_INT; // 激活相机 Intent intent = new Intent(MediaStore.ACT.._android studio如何调用摄像头

随便推点

JavaScript运算符之三元运算符_js三元运算符-程序员宅基地

文章浏览阅读585次。三元运算符在程序开发时运用较多,他跟条件语句能同时实现某种效果时,三元运算符相对简单,代码量也相对较少,熟悉三元运算符是很有必要的;_js三元运算符

Window对象方法_window撖寡情 function-程序员宅基地

文章浏览阅读268次。Window 对象表示浏览器中打开的窗口。setTimeout() 方法功能:用于在指定的毫秒数后调用函数或计算表达式。语法:setTimeout(code/function, milliseconds)返回值:返回一个 ID(数字),可以将这个ID传递给 clearTimeout() 来取消执行。clearTimeout() 方法功能:可取消由 setTimeout() 方法设置的定时操作。语法:clearTimeout(id_of_settimeout)返回值:无_window撖寡情 function

贪心算法——找零钱、装豆子、分糖果、区间覆盖、霍夫曼编码等_找零钱贪心算法-程序员宅基地

文章浏览阅读708次。一、找零钱根据实际情况,有1元、(2元的已经不流通了)、5元、10元、20元、50元、100元。当有人给出36524元时,如何找钱给对方。// 找钱的类class payMoney{public: payMoney(); ~payMoney(); int howManyCash(int waitToPay);private: int *arr;};// 初始化钱的种类..._找零钱贪心算法

MVP模式研究与实践_前端 mvppersistent模式-程序员宅基地

文章浏览阅读450次。虽然有那么多资料介绍MVP了,但是还是想把自己的实践经验分享一下。MVP简介相信大家对MVC都是比较熟悉了,:M-Model-模型、V-View-视图、C-Controller-控制器,MVP作为MVC的演化版本,那么类似的MVP所对应的意义:M-Model-模型、V-View-视图、P-Presenter-表示器。 从MVC和MVP两者结合来看,Controlller/Presenter..._前端 mvppersistent模式

VMware Vsphere 6.0安装部署 (三) vCenter Server安装-程序员宅基地

文章浏览阅读132次。安装准备环境需求:安装vcenter需要域环境,因此要先安装域控(有些功能比如horizon view需要用到域环境),学习环境可以用一台虚拟机做域控。建议将域控和vcenter服务器分别装在不同的服务器上,生产环境应该尽量在物理服务器上安装vcenter服务器,这里学习环境我们就在虚拟机上安装vcenter管理程序。安装vcenter需要最低2核CPU,8G内存本例中采用一..._使用命令行从vcenter 6.0或更高版本的服务器设备或外部平台服务控制器中收集支持

计算机原理 - 第五章 存储器_内存储器是按字长编址-程序员宅基地

文章浏览阅读1.9k次。5.1 存储器基本概念存储器的分类按存取方式分:随机、顺序、直接、相联按存储介质分:半导体、磁表面、激光盘按信息可更改性:可读可写、只读按断电后可否保存:易失、非易失按功能/容量/速度分:寄存器、Cache、主存(内存)、辅存(外存)解决内存访问速度慢的措施:1、提高主存芯片本身的速度2、在主存和CPU之间加入Cach..._内存储器是按字长编址

推荐文章

热门文章

相关标签