配置性能揭秘 “星云”与“天河”区别明显
曙光“星云”超级计算机和“天河一号”的主要区别有两方面:一是架构上天河一号主要是GPU计算+x86处理器;而“星云”是模块化服务器(按计算需求自行选择主要计算组件)——前者是众核计算做并行处理,后者是国产模块化刀片服务器(x86处理器+GPU计算卡)的异构体系。第二方面是可靠性方面,众所周知传统GPU计算在可靠性方面由于缺乏ECC奇偶效验等RAS特性因此计算可靠性被人诟病;而“星云”中由于采用的是模块化服务器,每节点可容纳10块GPU计算卡,因而在较重要的节点可实现多卡冗余的计算模式(互相比对),保证了数据可靠性。
从性能上来看,“天河一号”的峰值性能在千万亿次,平均Linpack性能在500多万亿次。而“星云”超级计算机的实测性能平均在千万亿次——全球之前只有“走鹃”和“Jaguar”达到了平均千万亿次的性能。从实用角度看,“星云”超级计算机的效能名列前茅,是一台通用性超级计算机——已有的x86处理器的强大生态环境和可根据应用调整的模块化服务器提供了保证。
据记者了解,“星云”超级计算机采用的是曙光最新的SSI模块化刀片服务器TC3600作为节点 ;网络方面采用了QDR Infiniband模块(最高速率的互联模块);此外,由于TC3600的I/O扩展性,每个节点还配备了10个GPU计算卡,在针对“华大基因”这类公司的微生物计算方面拥有明显优势。
来自:
http://tech.qq.com/a/20100528/000334.htm