计算产品基础算力测试基准工具CPUBench
中国芯吧
全部回复
仅看楼主
吧务
level 11
mygo358 楼主
计算产品性能基准测试是支撑计算产品性能迭代优化、牵引计算产业能力提升的重要工作。为了推动计算产品性能基准工具在市场中的应用,计算产品性能基准工作组在线上组织召开“计算产品基础算力测试基准工具CPUBench宣讲会”,本次宣讲会由中国电子技术标准化研究院主办,中国电子工业标准化技术协会新一代计算标准工作委员会、开放计算标准工作委员会承办,绿色计算产业联盟(GCC)协办。中国电子技术标准化研究院信息技术研究中心陈海针对基础算力基准工具CPUBench工作进展进行了介绍,集成电路测评中心钟伟军博士针对基础算力基准工具CPUBench的设计、测试与分析进行了详细阐述。
为准确评估计算系统的真实性能,解决传统性能基准工具存在的问题,弥补国内在性能测试技术研究及基准工具研制方面的经验不足,由处理器厂商、整机厂商、评测机构及学术机构在2020年共同成立了计算产品性能基准工作组。经过较长时间的研究、设计、开发、验证等阶段,工作组于2021年世界计算大会上完成了计算产品基础算力测试基准工具CPUBench的发布,当前工作组成员单位也已突破80家
计算产品基础算力测试基准工具CPUBench定位于对通用计算场景下的CPU、内存子系统以及所依赖的编译器进行综合计算能力评估。考虑到多种计算架构平台的性能评测需求,目前已经移植到x86_64、aarch64、ppc64le、sw_64和loongArch64等指令集架构的处理器平台,覆盖飞腾、海光、合芯、鲲鹏、兆芯、龙芯、申威、超微、英特尔等不同单位处理器产品,可运行在Debian、KylinOS、openEuler、Redhat、SUSE、UOS等基于Linux的操作系统,兼容AOCC、BiSheng、Clang、GCC和ICC等编译环境。计算产品基础算力测试基准工具CPUBench安装包提供针对不同指令集架构的内置依赖库,简化测试环境部署过程,提高了工具的易用性。
计算产品基础算力测试基准工具CPUBench的测试负载选择考量了诸多因素,首先,测试负载应来自于实际的应用场景,具有较高的业界认可度和影响力。其次,还要综合评估各负载于多架构平台的移植成本、计算密集程度、编程语言、稳定性、公平性、知识产权等因素。另外,基准工具整体的微架构特征覆盖度、业务领域覆盖度、不同负载之间的差异性同样作为重要的选择依据。基于原始业务应用,设计并实现一个可用的测试负载也是一个复杂的过程,不光要移除掉除业务核心计算逻辑外的其他代码部分,如网络、图形、I/O操作、依赖于特定架构的汇编代码等,同时要为裁剪后的负载设计输入数据集,并确保运行时长在合理范围内。最后要基于一系列不同的测试环境进行测试验证,考察裁剪后负载的稳定性、兼容性、可重复性、资源利用率、微架构特征等指标。
当前,计算产品基础算力测试基准工具CPUBench已经正式进入市场应用推广阶段。2022年8月,工作组正式面向全行业启动测试报告提交活动,得到积极响应。活动中共计收到30余家单位报名,参测机型达40余款,基本覆盖业界主力销售产品;生成有效测试报告200余份。首批测试数据在计算产品性能基准工作组网站已完成发布,相关单位包含众多国内优秀服务器整机厂商,如新华三、超聚变、宝德、同方、百信、长江计算、广电五舟、华鲲振宇等单位,中国移动研究院作为客户单位也提交了部分测试结果,上述结果可为行业和用户提供高价值选型参考和前瞻性指引。
后续,工作组将持续发布经各单位提交的不同产品有效测试报告,并在官网汇聚成性能数据库,帮助客户选型、牵引产品性能提升。工作组也将积极推动测试报告进入运营商集采、金融、电力、信息创新等重要市场项目,打通研究-标准-工具-认证-商业项目路径,形成产业链条闭环。
在工作组的长期推动下,性能基准作为牵引计算产业高质量发展的抓手已凝聚为各方共识。未来,工作组将持续支撑计算产品性能迭代优化,构建芯片、单机、集群、数据中心全栈式计算产品性能基准标准体系,推动工具在重点行业领域深度应用,吸引产学研用单位广泛参与,完善性能评价及基准生态,为促进计算产业全链条健康有序发展提供抓手。
计算产品性能基准工作组(Computing Product Performance Benchmark Workgroup,简称“CPPB WG”)主要针对计算产品性能基准需求,开展计算产品性能基准顶层设计,建设和维护计算产品性能基准标准、测评工具和运营体系,积极开展应用推广。
2023年05月14日 07点05分 1
level 8
好家伙!!!!!
2023年05月14日 08点05分 2
level 8
都200份有效成绩了, 谁有给大家发一份啊
2023年05月14日 08点05分 3
吧务
level 15
电子四院的人和我说,Intel听说出了这个测试工具,也派人接触,生怕性能测试落后了
2023年05月14日 08点05分 4
官网打不开啊,不然普通人也可以下载来测试。
2023年05月15日 06点05分
吧务
level 11
mygo358 楼主
计算性能基准专委会 2022-12-08 16:11 发表于北京
在基于国产处理器的计算产品中,单核整型第一成绩来自于宝德提交的PR210K Pro型号服务器,该服务器搭载的CPU为鲲鹏920 7265型号,Int_Single: 1.611分。
单核浮点第一成绩由同方提交的THTF H628型号服务器获得,该服务器搭载的CPU为海光 C86 7285型号,Float_Single:1.647分。
多核整型、多核浮点第一成绩均出自长江计算4路服务器产品R240K V2,该服务器搭载了4颗鲲鹏920 5250 CPU, Int_Concurrent:192.117分,Float_Concurrent:163.6分。
当前,取得单核整型测试第一成绩的为新华三提交的H3C UniServer R5300 G5型号服务器产品,Typical模式分数达到Int_Single: 2.433分,该服务器采用2颗英特尔第三代至强可扩展处理器 Platinum 8362 CPU。新华三提交的另一款H3C UniServer R4950 G5型号服务器产品在单核浮点、多核整型、多核浮点测试模式中也均取得了第一的成绩,Typical模式下的分数分别为:Float_Single:2.785分,Int_Concurrent:258.533分,Float_Concurrent:220.288分,该服务器采用2颗超微第三代霄龙处理器AMD EPYC 7763。
2023年05月16日 12点05分 6
吧务
level 11
mygo358 楼主
CPUBench:一款开放的通用计算CPU性能基准工具原创 CPUBench项目 计算性能基准专委会 2022-08-08 21:59 发表于陕西计算性能评测是提升计算机系统能力的重要方法,一款好的性能基准评测工具不仅能够客观、公正地揭示出不同计算机系统的性能差异,还能够用于反映计算机系统处理不同负载任务时的性能特征,对定位系统性能瓶颈、指导系统性能优化、牵引产品设计具有重要帮助。
CPUBench作为一款开放的通用计算CPU性能评测基准工具,定位于对通用计算场景下的CPU、内存子系统以及所依赖的编译器进行综合计算能力评估。
CPUBench工具由计算产品性能基准工作组设计开发,并在2021年世界计算机大会上进行发布,参与单位包括CPU厂商、整机厂商、用户单位、研究机构等60余家单位。工具下载请前往 http://www.cppb-wg.com申请。
考虑到多种计算架构平台的性能评测需求,CPUBench已经移植到x86_64、aarch64、ppc64le、sw_64和loongArch64等指令集架构的处理器平台,可运行在openEuler、KylinOS、UOS、CentOS和Ubuntu等基于Linux的操作系统,兼容GCC、Clang、AOCC、ICC和BiSheng等编译环境。CPUBench安装包提供针对不同指令集架构的内置依赖库,简化测试环境部署过程,提高了工具的易用性。
测试负载
CPUBench的测试负载选择需要考量诸多因素,首先,测试负载应来自于实际的应用场景,具有较高的业界认可度和影响力。其次,还要综合评估各负载于多架构平台的移植成本、计算密集程度、编程语言、稳定性、公平性、知识产权等因素。另外,基准工具整体的微架构特征覆盖度、业务领域覆盖度、不同负载之间的差异性同样作为重要的选择依据。基于原始业务应用,设计并实现一个可用的测试负载也是一个复杂的过程,不光要移除掉除业务核心计算逻辑外的其他代码部分,如网络、图形、I/O操作、依赖于特定架构的汇编代码等,同时要为裁剪后的负载设计输入数据集,并确保运行时长在合理范围内。最后要基于一系列不同的测试环境进行测试验证,考察裁剪后负载的稳定性、兼容性、可重复性、资源利用率、微架构特征等指标。
性能指标
CPUBench共包含四个测试套件:IntSingle、IntConcurrent、FloatSingle和FloatConcurrent,分别用于评估计算机系统的单核整型运算能力、多核整型运算能力、单核浮点运算能力和多核浮点运算能力。每个测试套件均可指定typical或extreme模式来运行,其中typical模式是基本优化下的性能测试,任何优化措施统一应用到所有的测试负载;extreme模式可针对不同的测试负载采用不同的优化措施。
单核测试套件里每个测试负载的得分是一个比值,即该负载在参考机器上运行得到的参考时间除以被测系统运行该负载的时长,而后将测试套件所有负载的得分取几何平均,便是该套件的最终得分,该分数可用于评估单核运算能力;多核测试套件里的测试负载以多任务并发的形式执行,该负载在参考机器上运行得到的参考时间除以被测系统运行其中最慢任务的时长,再乘以并发的任务数量,最后对所有负载得分进行几何平均处理便是该套件的得分,该分数用于评估多核并发的运算性能。
总之,CPUBench可用于衡量不同计算机系统的性能差异,指导通用计算CPU、服务器等计算产品的设计、优化和规格选型等工作,对国内计算产业的发展具有重要牵引意义。未来我们将继续对CPUBench工具展开更深入细致的分析,并广泛收集不同业务领域的应用负载,持续提升性能基准工具质量。
2023年05月16日 12点05分 7
level 8
好家伙,楼主介绍的够多了,我就不多说了
下面请各家发表自己的测试结果
2023年05月16日 13点05分 8
计算性能基准专委会是国字头,由工信部牵头,中国科学院计算技术研究所、中国计量测试学会、中国电子技术标准化研究院、中国软件评测中心等众多的学习研究所共同发的,计算基准这个专委会的目标就是制定最权威的信息技术测试标准
2023年05月16日 17点05分
希望各家国产cpu拿出CPUBench的评测分数来。
2023年05月16日 17点05分
level 1
这个没开放民用下载,得申请
2023年08月05日 15点08分 9
level 14
6月13日开了2023年第一轮测试活动启动会。别急,等测试结果吧。
2023年08月06日 01点08分 10
网站已经可以打开了,有了一些数据了,但是不是很齐全。
2023年08月06日 09点08分
level 14
又恢复上线了,网页链接
2023年09月01日 09点09分 11
目前只有ARM和x86的数据,没有龙芯的数据。
2023年09月01日 13点09分
level 14
2023年8月18日,中国电子技术标准化研究院在北京组织计算产品相关企业代表和行业专家,就2023年第一轮CPUBench公开测试活动提交的15款处理器产品共79份报告进行了审查。与会专家从测试数据合理性、测试报告完整性等多个维度给出客观公正的意见和建议,审查结果可作为后期数据公开和发布的支撑。
2023年09月02日 04点09分 12
还是不够齐全,应该所有信创的都去评测。
2023年09月02日 06点09分
1