没办法,只好贴图
文中明确提出:统一用GCC -o2,去掉那些额外的option,测base值,这也是业界用户的主流用法。
这篇下面还有华为官方回应,发布的成绩印证了这种做法。


华为已认证的官方帐号143 人赞同了该回答
感谢知友们对鲲鹏920芯片的关注哈,这个问题,我们找来了华为海思的小伙伴们,看看他们是怎么回复的:
华为鲲鹏920的计算子系统,Memory子系统以及I/O 子系统针对云计算领域的workload做了全面优化设计,可广泛应用于大数据、分布式存储、数据库、Web和ARM 原生等场景。
鲲鹏920基于ARMv8指令集,自主开发处理器内核,针对每个核进行了优化设计,采用多发射、乱序执行、优化分支预测等多种手段提升单核的性能。在Memory子系统上也进行了大量的优化,采用当前典型的3级Cache的架构,对Cache大小以及延时进行了优化设计。鲲鹏920采用自研Mesh互联Fabric,集成了64个自研核,典型主频2.6GHz,性能达到业界领先水平,尤其是整型计算能力,业界标准Benchmark SPECint_rate_base2006
@gcc 7.3.0 -O2评分超过930。同时采用了优化的高带宽低延时互联总线,支持多路互联。
同时将DRAM的通道数据从当前主流的6个通道提升到8通道,DRAM的典型主频也从2666MHz提升至2933MHz, 总带宽达到187GB/s,保证了920超强算力的高效输出。
集成PCIe 4.0, CCIX等高速接口,更高效地和外设或其他异构计算单元通信;集成2个100G RoCE端口,片上集成了SAS/SATA3.0可以帮助降低部分存储等场景的TCO。
发布于 2019-01-14