【转】我国研制出超千万亿次高性能计算机:星云
龙芯吧
全部回复
仅看楼主
吧务
level 11
liquidrainbow 楼主
2010年05月28日 12点05分 1
吧务
level 11
liquidrainbow 楼主
从曙光公司获悉,我国首台实测性能超过千万亿次的高性能计算机“星云”近日在曙光公司天津产业基地研制成功。
“星云”高性能计算机将于今年年底交付国家超级计算深圳中心,用于科学计算、互联网智能搜索、基因测序等行业和领域。
曙光公司总裁历军说,作为“曙光6000”千万亿次高效能计算机系统两大分区之一的服务分区,“星云”采用X86处理器,该分区由近6万个通用处理器核及近5000个GPGPU加速部件组成,峰值性能为每秒近3000万亿次,实测Linpack性能达到每秒1000多万亿次。
目前,这一实测性能超过了落户在天津滨海新区的我国首台千万亿次超级计算机“天河一号”,后者实测Linpack性能为每秒500多万亿次。
据了解,“曙光6000”千万亿次高效能计算机系统的计算分区目前正在紧张研制中。
“曙光6000”高效能计算机系统由中国科学院计算技术研究所、曙光信息产业(北京)有限公司、国家超级计算华南中心联合研制,由曙光公司天津产业基地制造,设计目标是满足未来云计算环境的应用需求,将于2010年底交付国家超级计算深圳中心使用。
曙光公司成立于1995年,实现了国产高性能计算机的产业化生产,构建了集研发、设计、制造于一体的服务器产业链。2008年,该公司推出了我国首款百万亿次超级计算机。

2010年05月28日 12点05分 2
吧务
level 11
liquidrainbow 楼主
~
居然也使用了GPGPU!!!
2010年05月28日 12点05分 3
吧务
level 11
liquidrainbow 楼主
配置性能揭秘 “星云”与“天河”区别明显
曙光“星云”超级计算机和“天河一号”的主要区别有两方面:一是架构上天河一号主要是GPU计算+x86处理器;而“星云”是模块化服务器(按计算需求自行选择主要计算组件)——前者是众核计算做并行处理,后者是国产模块化刀片服务器(x86处理器+GPU计算卡)的异构体系。第二方面是可靠性方面,众所周知传统GPU计算在可靠性方面由于缺乏ECC奇偶效验等RAS特性因此计算可靠性被人诟病;而“星云”中由于采用的是模块化服务器,每节点可容纳10块GPU计算卡,因而在较重要的节点可实现多卡冗余的计算模式(互相比对),保证了数据可靠性。
从性能上来看,“天河一号”的峰值性能在千万亿次,平均Linpack性能在500多万亿次。而“星云”超级计算机的实测性能平均在千万亿次——全球之前只有“走鹃”和“Jaguar”达到了平均千万亿次的性能。从实用角度看,“星云”超级计算机的效能名列前茅,是一台通用性超级计算机——已有的x86处理器的强大生态环境和可根据应用调整的模块化服务器提供了保证。
据记者了解,“星云”超级计算机采用的是曙光最新的SSI模块化刀片服务器TC3600作为节点 ;网络方面采用了QDR Infiniband模块(最高速率的互联模块);此外,由于TC3600的I/O扩展性,每个节点还配备了10个GPU计算卡,在针对“华大基因”这类公司的微生物计算方面拥有明显优势。
来自:
http://tech.qq.com/a/20100528/000334.htm
2010年05月28日 12点05分 4
level 6
TOP500 2010 June新秀。
2010年05月28日 13点05分 5
level 6
不知道是什么体系的啊……难道是M2050|||这个太YY了……
2010年05月28日 13点05分 6
level 6
回复:7楼
关键是第几代……T10架构还是Fermi?
2010年05月28日 14点05分 8
level 0
原来用的是ATI GPU,估计这回也是。
2010年05月28日 21点05分 9
吧务
level 11
liquidrainbow 楼主
NV也称为GPGPU么?
我以为就是AMD这么说的
~
fermi的话不可能有这么大的供应吧……
2010年05月30日 03点05分 10
level 6
回复:10楼
Fermi的HPC量还是足够的。
2010年05月30日 10点05分 11
level 6
回复12楼:
性能每瓦特照样秒杀i7
2010年05月30日 11点05分 13
level 0
这个拿来玩游戏,那得多流畅啊,全是GPU加速。
可惜,龙芯3的cache有bug,要不就不是用tesla了。
2010年05月31日 11点05分 15
level 6
顶!
2010年05月31日 14点05分 16
level 11
回复:16楼
谢谢了
2010年05月31日 14点05分 17
level 0
tesla2050 一万多一块。用fermi的曙光星云,效率还赶不上用hd4870的天河一号,hd4870当时只要一千多一块。
2010年05月31日 18点05分 18
level 6
回复18楼:
编程难度不考虑了?稳定性呢?
2010年06月01日 11点06分 19
level 6
好个C2050!太GJ了!
就是不知道问题出在哪里了?我感觉效率太低了。不可能还不如4870啊,Fermi毕竟在Cache和Thread上是有一些很独到的设计的
TOP500的评价
A Chinese system called Nebulae, build from a Dawning TC3600 Blade system with Intel X5650 processors and NVidia Tesla C2050 GPUs is now the fastest in theoretical peak performance at 2.98 PFlop/s and No. 2 with a Linpack performance of 1.271 PFlop/s. This is the highest rank a Chinese system ever achieved. There are now 2 Chinese systems in the TOP10 and 24 in the TOP500 overall.
China keeps increasing its number of systems to 24 and is now tied with Germany (steadily declining) for spot No. 4 after the USA, UK and France.
China also climbed with respect to overall installed performance and is now holding for the first time the No. 2 spot behind the USA and ahead of Germany.
The Jaguar system at Oak Ridge National Laboratory managed to hold the No. 1 spot with 1.75 PFlop/s Linpack performance even as it’s peak performance is lower than the Chinese Nebulae system. 
2010年06月01日 12点06分 20
level 0
犯经验主义了。原来用的是NV的。我是9L。
2010年06月01日 22点06分 21
吧务
level 11
liquidrainbow 楼主
超级计算机五百强:中国“星云”傲居第二
原文:
http://news.mydrivers.com/1/165/165827.htm
2010年06月02日 12点06分 22
吧务
level 11
liquidrainbow 楼主
不管怎么说 好事 先祝贺下!
希望这批fermi买的价值不只是冲击个名次~
2010年06月02日 12点06分 24
1