PCIe4.0+BiCS5正片SSD白菜价?Plextor PX-1T M10eGn专业向评测
浦科特吧
全部回复
仅看楼主
level 13
前世
▲“这对我们来说是一次激动人心的收购。Solid State Storage Technology Corporation 的卓越能力加上我们领先的闪存和 SSD 技术将为协同带来重大机遇,并使我们能够进一步为客户提供增值解决方案。我们将提升我们在全球 SSD 市场的领先地位,并致力于开发由人工智能、5G、物联网和云数据中心驱动的新型 ICT 基础设施。” --KIOXIA控股公司总裁兼首席执行官 Nobuo Hayasaka
随着KIOXIA收购原光宝科技SSD业务完成后,原光宝科技SSD业务被改名为Solid State Storage Technology Corporation,简称SSSTC,而Plextor品牌按照KIOXIA的规划继续作为SSSTC的高端消费级品牌存在。这句话如何解读呢,简单来说,SSSTC就是SSD解决方案的提供商和制造商,而Plextor是品牌运营商。
SSSTC的PCIe Gen 4x4方案暂时有两款,CA6和CL4。
▲可以说Plextor的选品都来自SSSTC,比如M10P产品就原自SSSTC的CA6产品线。
▲而CL4中又分为三个规格,2230、2242和2280。
▲CL4 2230
▲CL4 2242
▲CL4 2280
而CL4 2280则被Plextor选中,经过FW的定制和NAND的选型之后,就有了M10E这条产品线。
今生
▲在我看到M10E上市的时候,第一感觉就是WD SN570有对手了,明显Plextor是剑指WD SN570而来,首先两者同样使用了KIOXIA/SanDisk BiCS5的112层堆叠3D TLC,其次SN570的WD inhouse主控是PCIe Gen 3x4,而Plextor有意使用了支持PCIe Gen 4x4的SMI SM2267XT去应对。
现今的趋势里,SSD的分级越发明晰了,PCIe Gen 3x4被边缘化低价化,PCIe Gen 4x4被各种buff加持重点开发。IO接口速度为1200-1600Mb/s的HDR(High Data Rate)NAND被使用在PCIe Gen 4x4产品中,而800-1200Mb/s的NAND被广泛使用在PCIe Gen 3x4中。首先在NAND的应用以及成本上就开始分级,所以你想知道要买的这个SSD速度到底怎么样,就去关注两点:
1、主控是不是PCIe Gen 4x4?
2、NAND IO接口速度是1200-1600Mb/s的高速还是800-1200Mb/s的普速?
如果你需要一颗高性能M.2 SSD,那么不用关心别的,直接购买PCIe Gen 4x4 + 高速NAND即可。
PCIe Gen3x4产品因为要便宜要缩减成本,所以无缓存方案就成为最佳的成本方案,有缓存的方案因为成本也逐渐有序的减产或者被停产进行转型,此时市面上大量的群联PS5018-E13T,慧荣SM2263XT以及InnoGrit IG5216主控的就成为最佳的选择,而WD也看到了这一块市场细分后的蛋糕,急忙推出了自己的无缓存产品SN570去应对低价策略。
PCIe Gen4x4产品则各家都用上了大招,PCIe Gen 4x4,Nvme 1.3/1.4,LPDDR4高速大缓存,HDR NAND。这就造成了这个系列的产品成本较高,售价自然暂时下不来。
此时Plextor发布的M10E却特立独行,使用了SM2267XT完成了对BiCS5 NAND的无缓存PCIe Gen 4x4解决方案,随后Plextor也在尽量以最低调的方式和节奏推出这款产品。这款产品也给希望以较低价格购买到PCIe Gen 4x4+BiCS5 NAND方案产品的消费者一个选择。
作为首批使用KIOXIA/SanDisk BiCS5的112层堆叠3D TLC的PCIe Gen 4x4 SSD,性能稳定性都是不确定因素,所以Plextor M10E还是值得一测的产品。
开箱
▲包装正面
▲包装背面
▲包装左侧
▲包装右侧
▲开盒全家福
▲SSD本体正面
▲SSD本体背面
2021年11月11日 00点11分 1
level 13
产品解析
▲首先我揭去贴标暴露SSD的PCB,因为是无缓存单面SSD方案,所以1TB SSD使用了一颗主控以及两颗NAND。
▲主控:SM2267XTV AB
▲NAND:TH58LKT2X25BAEF x2
特别说明的是,此NAND为KIOXIA原厂原片。
▲首先来说下这颗主控SM2267XT
▲上图为SMI提供的SM2267XT公版设计,看得出来,SSSTC还是没有使用SMI的公版版型设计,而是自己重新设计了PCB走线。
▲SM2267XT由28nm工艺制造,SoC部分使用了双核心ARM Cortex R5处理器,NAND支持4通道4CE,NAND IO接口速度为1200MT/s,持续读写最大速度为3900/3500 MB/s,4K随机读写最大速度为500K/500K IOPS。这个参数相对SMI的旗舰消费级主控SM2264来说降规了不少。
说句题外话,其实Plextor这么多年产品线一直没有低阶这个概念,只有中阶和高阶,本次M10系列的高阶为采用了InnoGrit IG5236+BiCS4 HDR NAND的M10P系列,而中阶的M10E却意外的没有采用PCIe Gen3的InnoGrit IG5216转而采用了PCIe Gen4的SMI SM2267XT ,直接配上了最新的BiCS5 HDR NAND。这确实令我有点意外,难道Plextor的意图是直接全线升级PCIe Gen4么?
▲Kioxia TH58LKT2X25BAEF NAND是KIOXIA BiCS5,112层堆叠3D TLC,因为BiCS5首发的依然是512Gb(64GB)Die,所以TH58LKT2X25BAEF依然是8Die 2CE,NAND IO接口速度为1200Mb/s。
2021年11月11日 00点11分 3
level 13
其实Kioxia/WD的BiCS NAND的历史还是蛮有特点的:
▲历年ISSCC会议厂商公布的Roadmap
可以发现,历年来Kioxia/WD在ISSCC公布的数据和实际发布的数据还是有很大差异的:
对于2018公布的96层BiCS4而言,其IO速度就直接从64层的BiCS3的533Mb/s提升到了800Mb/s,其具体的产品应用举例Plextor M9P和M9P Plus来举例说明:
▲Toshiba TH58TFT1T23BAEF NAND是KIOXIA BiCS3,64层堆叠3D TLC,256GB容量,8Die 4CE。被使用在Plextor M9PeGN 1TB 上,板载4颗,正反面各两颗,
▲KIOXIA TH58LJT2T24BAEF NAND是KIOXIA BiCS4,96层堆叠3D TLC,512GB容量,8Die 2CE。被使用在Plextor M9PeGN Plus 1TB ,正面板载2颗。
同样是Marvell 88ss109X系列的主控,M9P 1TB 接驳了32Die 16CE,可是还是干不过16Die 4CE的M9P Plus 1TB。理论在主控的能力范围内,Die越多,SSD的读写性能应该越强,但是由于533Mb/s和800Mb/s的IO接口速度差距,让BiCS4的产品完全压制了BiCS3。
而对于BiCS4而言,分类其实水很深,其具体分位普速版本和高速版本。
▲普速版的1TB单颗BiCS4在KIOXIA XG6-P 2TB SSD中就使用到了,NAND编号为TH58LJT3X24BAEG,单颗1TB,16Die,IO接口速度依然是800Mb/s。正面板载两颗,KIOXIA XG6-P 2TB是一颗标准的PCIe Gen3x4 SSD。
高速版一般称之为HDR(High Data Rate)NAND,特指大容量且IO速度达到1066-1200Mb/s的BiCS4,这种NAND一般特供给自家PCIe Gen4x4 SSD使用。
▲TH58LKT3T2MBAEG NAND 是KIOXIA BiCS4 HDR NAND,96层堆叠3D TLC,1TB容量,16Die 。被应用在Plextor M10P 2TB,正面板载2颗。Plextor M10P 2TB是一颗标准的PCIe Gen4x4 SSD。
其实我们可以溯源猜测一下编号规则:
BiCS4
1TB容量版本
普速版编号为TH58LJT3X24BAEG,
高速版编号为TH58LKT3T2MBAEG
512GB容量版本
普速版编号为TH58LJT2T24BAEF
BiCS5
1TB容量版本
TH58LKT2X25BAEF
其实我们没必要关心太多的数据,只需要关心第9和第11位数字即可,
第9是NAND的分级类型。
第10是Block Page参数
第11是制造该产品的nm技术。
第9的颗粒分级就不细说了
第11而言,我怀疑同样的BiCS4有4和M两种nm技术制造,其中用M的则是HDR NAND。
复杂如斯的编码规则理解起来全部靠猜,KIOXIA的NAND实在水深不可测。那么到底BiCS5有几种nm技术制造呢?会不会出现闪存接口为1600Mb/s的HDR版本呢?只有让时间告诉我们!
2021年11月11日 00点11分 4
level 13
测试平台
• CPU : AMD Ryzen 7 5800X
• MB : ASRock X570S PG Riptide
• Dram : Oloy DDR4-3600 16GBx2
• SSD(sys): Intel DC-S3500 800GB SATA
• GPU : ASRock Radeon RX 6600 Challenger D 8GB
• Cooler : Thermalright AK120MINI
• PSU : Greatwall GW-EPS1560DA
• Windows 10 Workstation Edition X64 20H2
• Ubuntu 19.04 X64
WINDOWS测试部分官方参数
TBW
▲测试前期CrystalDiskiinfo 8.12.1检测的SMART信息
▲测试后期CrystalDiskiinfo 8.12.1检测的SMART信息
从这里的写入量来看的话,主机写入量总计19.605TB,寿命消耗在1%-2%之间,参数收紧一点假设寿命消耗是2%,换算出来的FW的寿命计算为19.605TB/0.02=980.25TBW,远大于官方设定的640TBW。
2021年11月11日 00点11分 5
level 13
官方性能定标
PX-2T M10PG的官标性能我相信很多人测试过,但是估计没一个人能摸到随机读写的IOPS极限,测试条件很关键,首先官方说他们使用的测试工具是CrystalDiskMark 5.0.2 和 IOmeter 1.1.0,测试硬件Z590,操作系统WIN10专业版X64,自己也可以尝试测试所有QD深度和T线程数,可以摸到了这个极限,如下图:
▲CrystalDiskMark 5.0.2的持续读写使用QD32T1的默认设置,随机读写使用QD32T16的条件,可以非常接近官标所标识的UP TO的最大值:
Sequential Read [持续读取](Q=32,T=1) : 3765 MB/s>官标 3700 MB/s
Sequential Write [持续写入](Q=32,T=1) : 2619 MB/s>官标 2600 MB/s
Random Read 4KiB [4K随机读取](Q=32,T=16) : 520K IOPS<官标 550K IOPS
Random Write 4KiB[4K随机写入] (Q=32,T=16) : 433K IOPS<官标 460K IOPS
持续读写达标超越官标的UP TO最大值,随机读写则接近官标UP TO最大值却没有达标。
说说定标过程的感受,这个盘在连续做测试时所获得的数据比较稳定,因为是Dramless方案,所以这一点比较难能可贵。连续测试了4次,所获取的数据保持着保持着高度的一致性。
我觉得大家买到盘第一件事情都会回去定标一下,或者做类似定标的操作,那么记得以下几件事情可以帮助你得到比较可靠的分数:
1、尽可能提高CPU的主频,可以通过超频或者开启类似Turbo Boost的CPU加速功能。
2、尽可能开启16线程,如果你没有16线程,那么至少要有8线程,这样开出的随机读写数据才能正常。
3、SSD尽可能接驳在直通CPU PCIe的M.2插槽中,如果不懂请看主板说明书,最好不要接驳在主板PCH芯片桥接的M.2插槽中。
天堂和地狱
有了以上的经验,我有点怀疑官方针对4K QD32 T16有特殊优化,所以继续用这种天堂和地狱的手法进行其他软件和版本的对比,结果如下:
▲CrystalDiskMark 5.0.2 默认设置下的空盘1GB数据块和93%满盘32GB数据块的测试对比,配置使用持续读写Q32T1和随机读写Q32T16,可以很直观得使用软件的最大压力限制反应磁盘在该软件下最好和最差的表现。
测试结果反馈4K随机读写和持续读写均发生不同程度的下降。
▲AS SSD Benchmark 2.0.7316.34247默认设置下的空盘1GB数据块和93%满盘下10GB数据块的测试对比,可以很直观反应在该软件最大压力限制范围内磁盘最好和最差的表现。
测试结果反映4K随机读写的衰减和延迟的暴增是显而易见的存在,看起来仍在可接受范围内。
没有厂家的FW工程师不对这两个软件的默认效能做优化,所以这个默认效能我们也称之为纸面最高效能,而接近满盘的设定最大数据块的效能才是纸面最差效能。对于无缓存方案的SSD而言更为如此。
SSD的固件开发就如同一个天平,主控的CPU资源有限,NAND的实际读写能力有限,SLC Cache的大小有限,往往你去优化了该软件的默认效能,就很可能没办法再去优化最差效能,所以我们得出的数据对比才有参考价值。
这个测试带我们走过厂商宣称的最好效能和我们实测的最差情况下的效能参数对比,体现了一个SSD在3D TLC NAND调教、主控固件平衡以及盘内容量大部分被写入情况下的综合能力。
SLC Cache验证
DATAWRITE是我的一个大神级程序员朋友pufer在谈笑间写出的一个小程序,用于验证2D 3D TLC真实写入速度的。规则是使用随机模式QD1深度随机往SSD里面以1GB数据块大小为单位写入并且反馈即时的写入速度,这个软件当时我们开玩笑说的是,大部分的测试软件都在RAW格式下测试写入速度有失偏颇,那么我们能否直观一些在NTFS格式下进行一些动态写入以获得初略的2D 3D TLC NAND真实的写入速度评估,这就是这个软件编写的初衷。但是现在这个软件被我用来验证确切的SLC Cache大小。
▲很直观,写入在222GB附近开始掉速,这就是大致的SLC Cache容量,之后的写入速度是稳定在880MB/s左右。
▲然后我们写到597GB附近开始继续速度降低,最低到260MB/s附近,其中有性能回复到880MB/s的挣扎,但是很快又被打压下去,这是FW的GC机制和性能恢复机制在生效,但是由于主控和缓存的资源有限,无法持续维持高性能,这种情况会一直持续到测试结束。
2021年11月11日 00点11分 6
level 13
TrimCheck 0.7
TRIM CHECK是一款很实用的检测SSD是否TRIM生效状态的软件,TRIM指令让操作系统可以告诉固态驱动器哪些数据块是不会再使用的;否则SSD控制器不知道可以回收这些闲置数据块,TRIM可以减少写入负担,同时允许SSD更好地在后台预删除闲置的数据块,以便让这些数据块可以更快地预备新的写入。当然光操作系统支持TRIM不行,还需要SSD的固件支持。
▲向SSD里写入一个16M的文件,这文件头的前16位字节如上图白色区域所表示,这也是该文件唯一的文本字符串,然后将其删除,如果TRIM工作,控制器也将删除这个数据,这时候软件让你等待大约20秒后然后按ENTER继续,然后关闭软件再次打开。
▲再次打开软件,提示原白色区域的字节已经被0所填充,说明主控固件的TRIM机制有效。
URWTEST
▲URWTEST这个软件和前面的DATAWRITE有异曲同工之妙,不同的是他是使用随机模式QD1深度随机往SSD里面以2GB数据块大小为单位写入并且反馈即时的写入速度,写满了盘之后可以进行一次数据校验,校验的过程就是随机读取的过程,而校验的结果就是数据完整性的检测。这个测试更接近我们日常的应用等级。
Secure Erase有效性测试
考虑到SM2267XT主控毕竟较新,使用的厂家也较少,我比较怀疑使用目前主板自带的Erase Tool对其进行Secure Erase操作的可行度,故此有了这个测试。
▲INTEL平台使用ASRock Z590 Taichi主板bios自带的SSD Secure Erase Tool对SSD进行Erase操作,实测有效。
▲AMD平台使用ASRock X570S PG Riptide主板bios自带的SSD Secure Erase Tool对SSD进行Erase操作,实测有效。
2021年11月11日 00点11分 7
level 13
SNIA PTS评估验证
每次跑这个测试大家都会觉得枯燥,无意义,看不懂,其实我自己个感觉这是个类似汽车撞击类别的测试项目,做这个测试的意义在于评估SSD的稳定性,因为大部分的WINDOWS测试都是基于瞬时测试,在短时间内在SLC Cache区域内测试并得到高性能反馈,而对于SSD而言真正重要的是长时间的压力测试下的性能状态,这才是大家使用SSD的安全保障红线,这也是进行此项测试的初衷。不过也有很多厂家抵制我的此项测试,终其言曰:良莠之分 涉 商贾之利矣!
先介绍下这个测试的来历:
▲全球网络存储工业协会(Storage Networking Industry Association,SNIA)是成立时间比较早的存储厂家中立的行业协会组织,宗旨是领导全世界范围的存储行业开发、推广标准、技术和培训服务,增强组织的信息管理能力。作为一家非盈利的行业组织,拥有420多家来自世界各地的公司成员以及7100多位个人成员,遍及整个存储行业。它的成员包括不同的厂商和用户,有投票权的核心成员有Dell、IBM、NetApp、EMC、Intel、Oracle、FUJITSU、JUNIPER、QLOGIC、HP、LSI、SYMANTEC、HITACHI、Microsoft、VMware、Huawei-Symantec十五家,其他成员有近百以上,从成员的组成可以看出,核心成员来自核心的存储厂商,所以SNIA就是存储行业的领导组织。在全球范围SNIA已经拥有七家分支机构:欧洲、加拿大、日本、中国、南亚、印度以及澳洲&新西兰。
Solid State Storage Performance Test Specification Enterprise v1.0是SNIA于2011年给Enterprise SSD都制定了Performance Test(性能测试)的规范,可以到其网站http://www.snia.org下载。
很少有人将一个消费级SSD推到极限的情况下去评估Perfermance效能,因为大部分的情况是掉成狗,有很多厂家是很忌讳使用SINA的标准SSD测试规范对他们的产品进行评估的,这个测试会将一切的外部加成全部忽略掉,将其打落到NAND本质的速度,进行严格的稳定态测试,如果性能浮动太大的话,可能永远无法达到稳定态直到测试中断,或者如果EARSE机制偶发性失效出现问题,这个测试也会中断,所以不是什么盘都能得到最终的测试结果,很多盘没跑完测试就已经被强制中断测试了,所以我很想知道这个盘以何种姿态通过测试或者不通过。
在SNIA组织定义的规范中,规范了如何测试闪存设备或固态存储。业界希望有一种来比较SSD的科学方法,这也是需要SNIA测试规范的原因。SSD的写入性能在很大程度上取决于NAND的写入历史。SSD一般有三个写阶段:
1、FOB(全新从盒子里拿出来的状态)
2、Transition(过渡)
3、Steady State(稳定状态)
以上图例来自SINA PTS 1.1测试规范
Transition(过渡)过渡是FOB和稳态的良好表现之间的阶段。大多数情况下,性能会随着时间的推移而持续下降,直到达到稳定状态为止。SNIA PTS1.1的测试规范则很严格的监控了FOB到稳定态的每一个阶段,以及评估标准帮你去确认你的企业级SSD确实达到了稳定态,所以根据以上溯源我们有了如下的操作:
软件系统及设置
操作系统 : Ubuntu 19.04 Disco Dingo (development branch)
内核版本 : 5.0.0-11-generic
测试软件: fio-3.12
Number of jobs: 2
Number of outstanding IOs (iodepth): 32
常规操作使用T2线程进行测试。因为双核环境够广普。
2021年11月11日 00点11分 8
level 13
1、IOPS测试(IOPS)
测试方法
进行Secure Erase安全擦除
预处理:128K持续写入双倍SSD容量
每一轮测试包含.512B,4K,8K,16K,32K,64K,128K,以及1MB数据块大小,每个数据块在100%,95%,65%,50%,35%,5%和0%运行读/写混合测试,各为一分钟。试验由25回合(Round)组成(一个循环需要56分钟,25回合=1400分钟)
使用4K随机写入的IOPS作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准。
▲测试真实性溯源
<iops>
<fioversion>"fio-3.1n"</fioversion>
<numjobs>2</numjobs>
<iodepth>32</iodepth>
<runtime>60</runtime>
<xargs>["refill_buffers"]</xargs>
<roundmat>[[[2432, 10938, 33548, 63838, 123724, 192338, 245814, 238940], [1056, 6487, 10480, 20391, 24832, 36246, 38927, 30847], [275, 1543, 2864, 5645, 7265, 11484, 15687, 9829], [217, 1109, 2000, 3560, 5262, 8151, 14150, 7150], [134, 873, 1483, 2742, 3962, 6509, 9361, 5646], [110, 638, 1148, 1929, 2977, 4958, 7031, 4034], [184, 495, 953, 1907, 3266, 4787, 10668, 3890]], [[2124, 9174, 30796, 60493, 116320, 186405, 241785, 238398], [1297, 4861, 9628, 15560, 22887, 30806, 35144, 30736], [367, 1457, 2203, 4434, 6072, 9193, 15128, 8178], [176, 901, 1916, 3364, 4679, 8067, 11803, 6077], [152, 728, 1339, 2387, 3877, 6446, 8496, 5716], [111, 499, 1013, 2003, 3135, 4612, 8276, 3315], [166, 566, 929, 2438, 3027, 5279, 9614, 3658]], [[2124, 9162, 30755, 60348, 115999, 185863, 241585, 238234], [842, 4787, 9568, 13453, 22942, 28776, 36984, 33523], [442, 1561, 2726, 4763, 6978, 10759, 16787, 9109], [198, 980, 1686, 2976, 4462, 7387, 11257, 6123], [118, 646, 1319, 2489, 4000, 6238, 9244, 5654], [113, 603, 922, 1817, 2775, 4442, 7544, 3775], [146, 604, 1066, 1933, 3248, 4533, 9333, 3666]], [[2122, 9162, 30698, 60275, 115643, 185312, 241427, 237116], [864, 5350, 9321, 16735, 22603, 29922, 40348, 32172], [375, 1806, 2506, 4712, 6419, 11029, 13835, 9144], [184, 1033, 1728, 2834, 4857, 6311, 11532, 6309], [133, 675, 1436, 2499, 3962, 5886, 8280, 5363], [57, 505, 958, 1884, 2925, 4141, 7457, 3501], [125, 506, 1173, 2153, 2786, 5864, 8471, 3637]], [[2117, 9164, 30702, 60329, 115650, 185371, 241488, 237215], [952, 4887, 8290, 16093, 21943, 31324, 39489, 32172], [394, 1760, 2597, 5212, 6422, 11220, 14865, 9684], [156, 988, 1597, 3509, 4666, 7300, 11179, 6672], [147, 703, 1444, 2723, 4268, 5764, 10947, 5297], [114, 564, 1077, 1797, 2885, 5043, 7147, 4352], [213, 394, 915, 1979, 2756, 5379, 10438, 3618]], [[2118, 9166, 30701, 60316, 115645, 185786, 242075, 238358], [867, 4345, 9368, 15551, 20884, 32296, 36210, 32093], [358, 1885, 2596, 4954, 6559, 11263, 16243, 9773], [192, 945, 2103, 3302, 5446, 7231, 11326, 7205], [133, 858, 1316, 2767, 3938, 6256, 8459, 5351], [85, 583, 946, 1851, 2657, 4487, 6878, 3612], [114, 628, 999, 1910, 2874, 5211, 9224, 3521]], [[2120, 9202, 30673, 60184, 115470, 185281, 241693, 238123], [1020, 4904, 7570, 14733, 22327, 30045, 37226, 32410], [320, 1515, 2687, 5088, 7318, 8506, 15331, 9004], [209, 981, 1779, 2904, 4433, 7375, 10671, 6257], [154, 813, 1399, 2642, 4139, 6393, 8740, 5811], [116, 513, 918, 1593, 2715, 4824, 7041, 3492], [135, 622, 871, 1860, 3509, 4738, 10485, 3032]], [[2118, 9159, 30701, 60287, 115664, 185403, 241858, 236411], [884, 5422, 8009, 16724, 19681, 26664, 39355, 29825], [378, 1592, 2433, 5007, 6599, 10348, 18714, 9489], [170, 1017, 1715, 3577, 4528, 8291, 11445, 6575], [142, 699, 1382, 2783, 3586, 6196, 9284, 5190], [95, 544, 1086, 1764, 2872, 5109, 6804, 3640], [136, 808, 996, 2058, 2918, 4842, 10404, 3459]], [[2117, 9206, 30581, 60157, 115130, 185297, 241446, 236091], [930, 5146, 7711, 15831, 21330, 30117, 36796, 29462], [375, 1429, 2861, 4815, 6365, 10861, 14546, 9828], [170, 884, 1708, 3137, 5024, 7713, 10712, 7767], [152, 730, 1291, 2339, 3664, 6113, 9756, 4402], [92, 539, 898, 1746, 2909, 4566, 6966, 3406], [161, 568, 966, 1746, 2778, 4594, 7967, 3735]], [[2118, 9154, 30589, 60108, 115256, 185012, 241257, 238159], [1032, 4835, 8101, 15180, 21750, 31279, 33222, 32408], [386, 1714, 2545, 4725, 7065, 10080, 16876, 9578], [154, 949, 1906, 3222, 5037, 7304, 12185, 6657], [167, 830, 1362, 2466, 3812, 5766, 10681, 5208], [97, 486, 916, 1932, 3202, 4716, 7245, 3518], [129, 631, 1084, 2152, 3162, 4682, 10297, 3615]], [[2116, 9153, 30585, 60127, 115345, 185180, 241645, 237715], [1014, 5537, 8612, 14453, 21196, 30316, 36557, 32230], [337, 1773, 2792, 4775, 6474, 11276, 14952, 9684], [170, 866, 1809, 3168, 4367, 7011, 11256, 6753], [130, 756, 1290, 2560, 3860, 5236, 8959, 5739], [78, 492, 990, 1933, 2861, 4768, 7259, 3216], [116, 465, 1146, 1941, 2790, 5537, 8969, 3465]], [[2117, 9202, 30597, 60154, 115227, 185033, 241538, 238028], [1127, 5073, 8244, 14491, 21285, 28323, 34772, 31615], [359, 1638, 2670, 5011, 6952, 11046, 15416, 9612], [174, 940, 1756, 3481, 4748, 6787, 10582, 6736], [116, 670, 1225, 2531, 4053, 5670, 8068, 5254], [96, 571, 904, 1856, 2525, 4781, 7591, 3860], [121, 685, 1020, 1947, 3464, 5119, 9853, 3477]], [[2113, 9190, 30551, 60068, 115128, 185231, 241611, 237140], [805, 5100, 7927, 16899, 21693, 29894, 32898, 32314], [337, 1533, 2752, 5423, 7192, 10771, 17439, 9667], [188, 1045, 1987, 3506, 5242, 7101, 11297, 6556], [148, 814, 1305, 2813, 4208, 6155, 9201, 5241], [127, 734, 1089, 1968, 2739, 4594, 7106, 3421], [201, 456, 1024, 2278, 2997, 5368, 9613, 3579]], [[2117, 9147, 30558, 60071, 115232, 185133, 241940, 238203], [999, 5035, 9044, 16990, 19428, 31941, 32904, 32028], [355, 1748, 2670, 5343, 6757, 11743, 17028, 10376], [248, 1052, 2079, 3435, 5192, 7280, 13185, 6640], [145, 774, 1291, 2274, 4658, 5356, 8273, 4785], [111, 495, 894, 2063, 2362, 4636, 7261, 3514], [98, 832, 1226, 1836, 3541, 4404, 8779, 3965]], [[2111, 9320, 30552, 60104, 115014, 184829, 241325, 236363], [1091, 5194, 8608, 14430, 19488, 30351, 37848, 31572], [321, 1857, 2341, 5283, 6275, 10711, 16116, 8952], [182, 876, 1864, 3324, 4794, 7501, 10054, 5865], [122, 646, 1293, 2378, 4144, 5834, 8428, 4666], [111, 396, 897, 1709, 2907, 4170, 7381, 3638], [99, 587, 962, 2060, 3157, 4911, 9308, 3469]]]</roundmat>
<stdyrounds>[10, 11, 12, 13, 14]</stdyrounds>
<stdyvalues>[8969, 9853, 9613, 8779, 9308]</stdyvalues>
<stdyslope>[-39.59999999999975, 9779.599999999999]</stdyslope>
<stdyavg>9304</stdyavg>
<reachstdystate>true</reachstdystate>
<rndnr>14</rndnr>
</iops>
▲完整测试数据
▲IOPS稳态收敛图-QD32
显示相关变量如何收敛到稳定状态的过程
▲IOPS稳定态验证图-QD32
显示(10,11,12,13,14)回合进入了稳态,这里需要说明的是,当性能特别稳定的盘上去,一般来说都是(0,1,2,3,4)直接进入稳定态了,而稳定性差点的盘上去,可能就在更多的回合进入了,4K随机写入性能浮动较大的盘如果不能控制在20%以内的话,那就永远通不过这个测试。所以这个环节,从FOB状态过渡到稳定态耗费了14回合,表现尚可并不能说很好。
▲IOPS测试2D图-QD32
▲IOPS测试3D图-QD32
2021年11月11日 00点11分 9
level 13
2、带宽测试(TP)
测试方法
进行Secure Erase安全擦除
对于['1024k', '64k', '8k', '4k', '512']数据块大小进行持续读写60秒为一回合(Round)
使用1024K持续写入的吞吐量作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准
▲测试真实性溯源
<tp>
<fioversion>"fio-3.1n"</fioversion>
<numjobs>2</numjobs>
<iodepth>32</iodepth>
<runtime>60</runtime>
<xargs>["refill_buffers"]</xargs>
<roundmat>[[[3725354, 3277335, 3278308, 3277062, 3278205], [2651352, 2578415, 2596977, 2570363, 2585582]], [[3299945, 997837, 1234085, 1259419, 1507750], [2703742, 2587558, 2633498, 2659778, 2641698]], [[2091133, 304914, 253312, 257360, 286883], [2348931, 2296204, 2302381, 2308348, 2308758]], [[1198589, 236826, 196704, 279619, 334403], [2085200, 2045703, 2046894, 2052723, 2052022]], [[164951, 18161, 20261, 24430, 17458], [18430, 17817, 17726, 17023, 17503]]]</roundmat>
<stdyrounds>[0, 1, 2, 3, 4]</stdyrounds>
<stdyvalues>[2651352, 2578415, 2596977, 2570363, 2585582]</stdyvalues>
<stdyslope>[-13959.200000000215, 2624456.2000000007]</stdyslope>
<stdyavg>2596537</stdyavg>
<reachstdystate>true</reachstdystate>
<rndnr>4</rndnr>
</tp>
▲完整测试数据
▲带宽稳态收敛图-QD32显示相关变量如何收敛到稳定状态的过程
从测试原数据可以看出:
数据块=1M时,读取最高达到3725.354MB/s,
数据块=1M时,写入最高达到2703.742MB/s,
▲带宽稳定态验证图-QD32
显示(0,1,2,3,4)回合直接进入了稳态,稳定性不错,满足验证标准给出了1M数据块下持续写入振幅20%平均值与测量值线性最佳拟合线的斜率的条件。
▲读写带宽测试2D图-QD32
我们可以看到稳定态下持续读写各个数据块下的平均表现力,1M数据块下持续读最大平均带宽3288.333MB/S,持续写最大平均带宽2535.681MB/
2021年11月11日 00点11分 10
level 13
3、延迟测试(LAT)
测试方法
进行Secure Erase安全擦除
预处理:128K持续写入双倍SSD容量
对于['8k','4k','512']数据块大小进行100%读,65%读35%写,100%写的随机读写测试,测量最大最小以及平均的延迟,60秒为一个回合(Round)
使用4K随机写入的平均延迟作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准
▲测试真实性溯源
<lat>
<fioversion>"fio-3.1n"</fioversion>
<numjobs>1</numjobs>
<iodepth>1</iodepth>
<runtime>60</runtime>
<xargs>["refill_buffers"]</xargs>
<roundmat>[[[[53.0, 3902.0, 105.710797], [47.0, 4013.0, 99.853133], [44.0, 3900.0, 97.016123]], [[39.199999999999996, 69965.65, 359.4632366], [34.95, 91963.6, 361.77495745], [32.65, 72896.85, 318.
15015530000
005]], [[8.0, 128795.0, 123.563264], [7.0, 135774.0, 112.653272], [6.0, 138493.0, 236.889554]]], [[[51.0, 3926.0, 119.95984], [47.0, 3898.0, 107.635439], [44.0, 3918.0, 104.802343]], [[37.25, 89650.0, 349.40837575], [34.300000000000004, 78946.4, 325.24743085000006], [32.0, 96508.0, 319.02409415]], [[8.0, 133281.0, 115.0438], [7.0, 134433.0, 83.577042], [6.0, 118809.0, 253.322864]]], [[[52.0, 3960.0, 119.535323], [47.0, 3924.0, 107.456937], [45.0, 3889.0, 104.615696]], [[37.25, 91341.85, 349.96775495], [34.300000000000004, 92327.65000000001, 307.53230560000003], [32.65, 82694.4, 338.7314271]], [[8.0, 195531.0, 104.398156], [7.0, 128311.0, 78.987528], [6.0, 117964.0, 266.041528]]], [[[52.0, 3967.0, 120.0621], [48.0, 3928.0, 107.515948], [45.0, 3912.0, 104.735922]], [[37.9, 95485.85, 310.14125244999997], [34.300000000000004, 85264.0, 306.20680545000005], [32.0, 78246.95000000001, 336.68389615]], [[7.0, 126246.0, 105.016278], [7.0, 118327.0, 80.32419], [6.0, 117867.0, 251.55435]]], [[[51.0, 3935.0, 119.624179], [47.0, 3906.0, 107.348089], [45.0, 3915.0, 104.497997]], [[37.9, 80144.45, 320.481111], [34.300000000000004, 87220.
15000000001
, 313.63956795], [32.0, 75692.85, 338.59971995]], [[8.0, 130834.0, 106.767471], [7.0, 198461.0, 83.041385], [6.0, 191358.0, 285.698825]]], [[[52.0, 3954.0, 119.722101], [47.0, 3895.0, 107.369846], [44.0, 3919.0, 104.567105]], [[37.9, 117047.75, 287.7163215], [33.650000000000006, 75933.15, 300.2259734], [32.0, 84561.0, 314.58683775]], [[8.0, 185646.0, 105.394929], [7.0, 111884.0, 79.135861], [6.0, 96226.0, 241.416694]]]]</roundmat>
<stdyrounds>[1, 2, 3, 4, 5]</stdyrounds>
<stdyvalues>[83.577042, 78.987528, 80.32419, 83.041385, 79.135861]</stdyvalues>
<stdyslope>[-0.4828504999999869, 82.46175269999998]</stdyslope>
<stdyavg>81.0132012</stdyavg>
<reachstdystate>true</reachstdystate>
<rndnr>5</rndnr>
</lat>
▲完整测试数据
▲延迟稳定态收敛图-QD32显示相关变量如何收敛到稳定状态的过程
▲延迟稳定态确认图-QD32显示了4K随机写入过程中,在(1、2、3、4、5)回合达到了稳定态,说明稳定性很好。
▲平均延迟在所有进程中的表现在0.35毫秒以内。
▲最大延迟在所有进程中的表现在200毫秒以内。随机读的部分是最大延迟很低的,而只有随机写的部分最大延迟相对较高,这里涉及到的问题就是主控资源的充足度以及LDPC解码资源和耗费时间问题之间的平衡调节问题了,相对于3D TLC而言,写入部分的最大延迟普遍性高一些和以下一些因素有关:
1、硬件资源,比如主控的主频以及核心数,ARM构架或者MIPS构架的实际效,Cache的大小。
2、LDPC硬软解码的能力。
3、主控固件的硬软件开发能力。
SATA盘中的SMI2258H主控+TSB 64层3D TLC的盘在这个测试中随机写最大延迟普遍在700毫秒以上,这样比较就可以更加明晰本款产品的最大延迟处在什么级别。
▲平均和最大延迟3D图-QD32以及汇总数据。
2021年11月11日 00点11分 11
level 13
4、写饱和度测试(WRITESAT)
测试方法
进行Secure Erase安全擦除
执行4K随机写入1分钟为一回合(Round),写入4倍全盘容量或者24h,以先达到者为准
计算各个回合的平均IOPS(Avg IOPS)
▲测试真实性溯源
▲写饱和平均IOPS图-QD32
这个测试实际写入写了746轮写满4倍全盘容量,其实纯写入任务相对于混合读写比例的测试要简单很多,这个测试其实显示出了无缓存方案以及双核ARM主控资源的不足,所以卡在低速IOPS跑了746轮,速度低归低,跑出的曲线虽不是一条直线却也仍算相对稳定。
▲写饱和平均延迟图-QD32
测试跑在2.9毫秒以内一直到测试结束。
SNIA PTS对比测试
为什么要对比?有几个目的:
1、有缓存和无缓存的PCIe Gen4x4产品差异有多大?
2、有缓存的PCIe Gen3x4和无缓存的PCIe Gen4x4产品差异有多大?
这次选用的对比产品为:
▲官标参数如上
软件系统及设置
操作系统 : Ubuntu 19.04 Disco Dingo (development branch)
内核版本 : 5.0.0-11-generic
测试软件: fio-3.12
Number of jobs: 2
Number of outstanding IOs (iodepth): 32
1、IOPS测试
测试方法
进行Secure Erase安全擦除
预处理:128K持续写入双倍SSD容量
每一轮测试包含.512B,4K,8K,16K,32K,64K,128K,以及1MB数据块大小,每个数据块在100%,95%,65%,50%,35%,5%和0%运行读/写混合测试,各为一分钟。试验由25回合(Round)组成(一个循环需要56分钟,25回合=1400分钟)
使用4K随机写入的IOPS作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准
▲IOPS测试对比图
▲IOPS稳定态验证图-QD32:Plextor PX-1T M10eGn
▲IOPS稳定态验证图-QD32:Plextor PX-2T M10PG
▲IOPS稳定态验证图-QD32:Plextor M9PeGN Plus 1TB
速度方面:Plextor PX-2T MP10G无论读写占据绝对优势,Plextor PX-1T M10eGn和M9PeGN Plus 1TB互有胜负,简单来说就是M10eGn读取很好,写入不行。
稳定性方面:Plextor PX-2T M10PG和M9PeGN Plus 1TB的稳定性是最好的,在第四回合进入稳定态,说明性能振幅较小。Plextor PX-1T M10eGn是三者最差的,因为其速度一直在大振幅抖动,导致进入稳定态很慢,到了14回合才进入稳定态。
这个测试可以看出Dramless SM2267XT方案的不足,4K随机写入能力较低,且性能浮动也较大。
2021年11月11日 00点11分 12
level 13
2、带宽测试(TP)
测试方法
进行Secure Erase安全擦除
对['1024k', '64k', '8k', '4k', '512']数据块大小进行持续读写60秒为一回合(Round)
使用1024K持续写入的吞吐量作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准
▲带宽测试(TP)测试对比图
▲带宽测试(TP)稳定态验证图-QD32:Plextor PX-1T M10eGn
▲带宽测试(TP)稳定态验证图-QD32:Plextor PX-2T M10PG
▲带宽测试(TP)稳定态验证图-QD32:Plextor M9PeGN Plus 1TB
速度方面:这个测试Plextor PX-1T M10eGn明显针对1M的持续读写作为针对性的优化了,如果您只关注1M的持续读写,会得出Plextor PX-2T M10PG>Plextor PX-1T M10eGn>Plextor M9PeGN Plus 1TB的结论。这貌似非常合理但是针对性操作的意图也极为明显。
再看64K和8K的持续读取,你会发现Plextor M9PeGN Plus 1TB>Plextor PX-1T M10eGn,理论上就这闪存和主控的优势,是不太可能出现这个结果的,明显急着上市,1.00版本的FW有部分的优化调整不到位。
稳定性方面:Plextor PX-1T M10eGn和M9PeGN Plus 1TB的稳定性是最好的,在第四回合进入稳定态,说明性能振幅较小。而Plextor PX-2T M10PG略逊一筹在第五回合进入。
3、延迟测试(LAT)
测试方法
进行Secure Erase安全擦除
预处理:128K持续写入双倍SSD容量
对于['8k','4k','512']数据块大小进行100%读,65%读35%写,100%写的随机读写测试,测量最大最小以及平均的延迟,60秒为一个回合(Round)
使用4K随机写入的平均延迟作为测试目标,写入振幅20%平均值与测量值线性最佳拟合线的斜率作为验证进入稳定态的标准
延迟测试(LAT)对比图
4K QD32随机混合读写的数据,Plextor PX-1T M10eGn无论读写还是混合读写,平均延迟都是最高的。
▲延迟测试(LAT)稳定态验证图-QD32:Plextor PX-1T M10eGn
▲延迟测试(LAT)稳定态验证图-QD32:Plextor PX-2T MP10G
▲延迟测试(LAT)稳定态确认图-QD32:Plextor M9PeGN Plus 1TB
我们先看进入稳定态时刻4K QD32随机写入的延迟
稳定性方面:Plextor PX-2T M10PG=Plextor M9PeGN Plus 1TB>Plextor PX-1T M10eGn
这个测试稳定性三者差不多,Plextor PX-2T M10PG和Plextor M9PeGN Plus 1TB在第四回合进入稳定态,Plextor PX-1T M10eGn在第五回合进入稳定态,有差距但很小。
延迟方面:我们计算进入稳定态时刻的五个回合的平均延迟数据统计得出结论,这个测试再次暴露了Dramless的SM2267XT方案的不足,PX-1T M10eGn的4K QD32随机写入的延迟达到80us,PX-2T M10PG达到45us,M9PeGN Plus 1TB是最好的只有16us。
说实话,这个产品我看到SSSTC的CV4的时候我就很担心SM2267XT这颗SoC集成的双核ARM R5在4K随机读写时候会发生资源不足而导致平均延迟冲上1ms的情形,结论也印证了我曾经的猜想不是空穴来风,但是Plextor PX-1T M10eGn实测起来资源紧张的情况比我预测的结果要好不少。
2021年11月11日 00点11分 13
level 13
4、写饱和度测试(WRITESAT)
测试方法
进行Secure Erase安全擦除
执行4K随机写入1分钟为一回合(Round),写入4倍全盘容量或者24h,以先达到者为准
计算各个回合的平均IOPS(Avg IOPS)
▲写饱和度测试(WRITESAT)平均IOPS图-QD32可以看到写入四倍全盘容量的过程:
我形容这个测试就是对SSD进行连续不间断的毁灭性打击,因为这个测试的本质就是直接的消耗寿命。最要命的是这个测试完全不给主控垃圾回收恢复性能的机会。要抗住这个测试,首先缓存要大,其次主控SoC的CPU性能要足,其实测试结论也印证了我的说法,四核心的IG5216+2GB大缓存占据绝对优势,其次是三核心的88SS1092+1G缓存,最后是双核心的SM2267XT无缓存。
从测试结果来看,暴力的4K QD32随机写入过程中:
Plextor PX-2T M10PG能基本稳定在540K IOPS
Plextor M9PeGN Plus 1TB能稳定在310K IOPS
Plextor PX-1T M10eGn只能稳定在22K IOPS
温度测试
▲测试SSD温度使用的环境为裸片测试。
我在Ubuntu下使用
sudo watch -n 1 nvme smart-log /dev/nvme0n1
这条命令来监控SSD的温度
▲空闲温度为23度
▲然后进行4K QD32的随机写入,持续一段时间速度趋于稳定了,再记录温度,这个温度高温临界值在50度附近,达到50度就会主动降温,曾经用持续的大量读写加吹风给温度拉到60以上,还是会被主动降温拉到49度。
所以这个盘的目标使用客户比较适合紧凑型超级本使用。话说M10E的原型SSSTC CL4就有2230 2242 2280三种规格,2230 2242规格肯定是供给超级本目标客户采购的。这么一分析就豁然开朗了。
总结
先说缺点:
我们看完PTS测试,其实不难发现,IOPS、LAT、WRITESAT都是4K随机性能测试,只有TP是持续读写测试。而结论也说明,SM2267XT的Dramless方案确实在持续读写方面表现出色,4K随机读取方面也还是不错的,但是因为无缓存以及双核ARM R5的硬件资源拖累,所以在4K随机写入方面差强人意,资源紧张问题体现明显。
再说优点:
无论如何,Plextor PX-1T M10eGn也确实通过了变态的企业级存储PTS全套测试,其实我测过的Dramless的SSD没几个能过这个测试,大部分都栽在LAT和IOPS测试中了,所以M10E在工规来说是一款合格的SSD产品,适合消费级和轻商业级的应用,但不适合24X7的企业级应用。
这个盘的温度控制做的很好,温度不再成为困扰超级本用户的难题。
强压下的持续读写和随机读取是没有问题的,随机写入差强人意,对于普通笔电客户来说,这貌似不是大问题。
京东折后799元,刚需可入
作者 gaojie
2021年11月11日 00点11分 14
1