Seagate2008 Seagate2008
关注数: 37 粉丝数: 673 发帖数: 13,937 关注贴吧数: 9
业余选手对Zen3的看法 此文于昨晚发表在A吧,被A吧85删帖,来图吧发一次试试。 我保证以后再也不发文打扰任何人了。 原文如下: 我本来已经多次表示不准备再发帖子了,但是还是有很多小伙伴不停的问我怎么看Zen3. 那我就再简单说几句吧,这段时间非常忙,没有时间详细说。 不少人说到目前为止Zen3的保密做得非常不错,一点非常十足和靠谱的爆料都没有看到。 在我看来,与其说是保密做得好不如说Zen3的进度可能比大家想的要慢,真正到来的时间也可能比大家预想的更晚。 关于Zen3目前的重要传闻和我的看法: 1.一个CCX从原来的4C8T改为8C16T,一个CCD只有1个CCX,8个核心共享一个整块L3缓存。 我认为这个为真的概率是80%。 在Zen1(我在这里和后面会把Zen和Zen+统称为Zen1)的时候我是比较支持一个CCX只有4C8T的,因为这个架构是为服务器准备的,不是为桌面游戏准备的,桌面型号只是顺带着玩的。但现在不一样了,现在我是支持把CCX升级到8C16T的,不是因为Zen3架构转向桌面U了,而是因为这样的升级势在必行。 Zen1的EPYC核心数量还比较少,CCX带来的性能损失相对较小,但却可以带来更低的功耗和面积成本,这对EPYC很重要。 但渐渐的发展到Zen3,处理器的IPC越来越高,EPYC的核数也更多,CCX带来的性能损失就变得越来越不可忽视了,小小的牺牲一点点面积成本和功耗获得更高的多线程效率就变得越来越划算了。所以Zen2比较折中,虽然保留了一个CCX 4C8T,但通过IO die巧妙的缩短了CCX沟通延迟,到了Zen3更进一步的改成一个CCX 8C16T也是顺理成章的。 你们想要的游戏性能也将因此而获得提升。大家也都看到了,3300X相对于3100在同频的游戏性能平均差距有10%以上,最低帧的差距可能更大。 我知道有些观点不认可3300X与3100这个差距是CCX的问题,有人说因为单个核心调用的L3容量如何如何的,你看3300X游戏并没有比3500X强多少,还不如3600呢,这也说明不是CCX的原因啊。对于这种说法,我只能说,你大概还不了解Zen的L3缓存到底是怎么运作的。3300X与3500X、3600这类拉不开差距另有原因,其中比较主要的有两个,一个是处理器的负载,4C8T现在很多时候负载率都偏高,这必然导致线程之间争抢资源影响游戏表现,核数太少的跟6核的对比肯定会吃亏;另一个就是L3容量问题,CCX沟通延迟并不是决定游戏性能的唯一因素,L3容量对游戏影响也非常大,尤其内存延迟越大的架构对L3容量的依赖就越大,3300X才16M的L3,你跟32M L3的U比个神马。 不过CCX 8C16T的L3到底以什么方式共享还不清楚,不同的方式和策略带来的效率是不同的,会和牙膏厂一样的环形总线吗?不知道,拭目以待吧。环形总线可能并不是性能最高的策略,但是他的性能、成本、功耗等多方面的平衡性比较好。 再有就是L3的测试带宽大概率会比Zen2缩水非常多。原因比较简单,其实并不是带宽真的缩水,Zen2因为一个CCD有两个CCX,L3也就有两个,16M一个。所以你测的带宽其实是两个L3带宽之和,实际上单个L3带宽只有你测出来结果的一半。Zen3一个CCX 8C16T就意味着只有一个L3了,测出来的结果必然会减少。到时候如果实测带宽不减反增,那我只能说蒜泥狠了。 2.Zen3的工艺不再是早期说的7nm+,而是和Zen2一样的7nm。 我认为这个为真的概率90%。 毕竟牙膏厂现在也没有什么办法,AMD花式挤个牙膏省点成本并不感到意外。 3.Zen3的浮点流水线规模+50%。 我认为这个为真的概率10%。 也就是说,我认为不大可能,原因就非常的复杂,反正也就是我的猜测和预计而已,没必要花太多时间在解释这个事情上面,反正将来要是出现了偏差你们别来找我,毕竟就是猜测。 除了上述传闻,还有一个我自己的一个猜测: Zen3的IO die和Zen2会是同一个规格,不会有升级,最多就是细节上稍微优化一下,小修小补一下。有可能连工艺都没变,也可能是12nm+。 我认为这个猜测为真的概率70%。 苏妈最大的特点就是省成本,没必要改动的就不会改。 今天就先说这么多,过几天我如果有时间的话,有可能会接着说下一个问题,我想象中的Zen3什么样?或者说如果Zen3的升级让我来做,我要怎么做? 岔气牛 2020-07-15晚
业余选手对Zen3的看法 我本来已经多次表示不准备再发帖子了,但是还是有很多小伙伴不停的问我怎么看Zen3. 那我就再简单说几句吧,这段时间非常忙,没有时间详细说。 不少人说到目前为止Zen3的保密做得非常不错,一点非常十足和靠谱的爆料都没有看到。 在我看来,与其说是保密做得好不如说Zen3的进度可能比大家想的要慢,真正到来的时间也可能比大家预想的更晚。 关于Zen3目前的重要传闻和我的看法: 1.一个CCX从原来的4C8T改为8C16T,一个CCD只有1个CCX,8个核心共享一个整块L3缓存。 我认为这个为真的概率是80%。 在Zen1(我在这里和后面会把Zen和Zen+统称为Zen1)的时候我是比较支持一个CCX只有4C8T的,因为这个架构是为服务器准备的,不是为桌面游戏准备的,桌面型号只是顺带着玩的。但现在不一样了,现在我是支持把CCX升级到8C16T的,不是因为Zen3架构转向桌面U了,而是因为这样的升级势在必行。 Zen1的EPYC核心数量还比较少,CCX带来的性能损失相对较小,但却可以带来更低的功耗和面积成本,这对EPYC很重要。 但渐渐的发展到Zen3,处理器的IPC越来越高,EPYC的核数也更多,CCX带来的性能损失就变得越来越不可忽视了,小小的牺牲一点点面积成本和功耗获得更高的多线程效率就变得越来越划算了。所以Zen2比较折中,虽然保留了一个CCX 4C8T,但通过IO die巧妙的缩短了CCX沟通延迟,到了Zen3更进一步的改成一个CCX 8C16T也是顺理成章的。 你们想要的游戏性能也将因此而获得提升。大家也都看到了,3300X相对于3100在同频的游戏性能平均差距有10%以上,最低帧的差距可能更大。 我知道有些观点不认可3300X与3100这个差距是CCX的问题,有人说因为单个核心调用的L3容量如何如何的,你看3300X游戏并没有比3500X强多少,还不如3600呢,这也说明不是CCX的原因啊。对于这种说法,我只能说,你大概还不了解Zen的L3缓存到底是怎么运作的。3300X与3500X、3600这类拉不开差距另有原因,其中比较主要的有两个,一个是处理器的负载,4C8T现在很多时候负载率都偏高,这必然导致线程之间争抢资源影响游戏表现,核数太少的跟6核的对比肯定会吃亏;另一个就是L3容量问题,CCX沟通延迟并不是决定游戏性能的唯一因素,L3容量对游戏影响也非常大,尤其内存延迟越大的架构对L3容量的依赖就越大,3300X才16M的L3,你跟32M L3的U比个神马。 不过CCX 8C16T的L3到底以什么方式共享还不清楚,不同的方式和策略带来的效率是不同的,会和牙膏厂一样的环形总线吗?不知道,拭目以待吧。环形总线可能并不是性能最高的策略,但是他的性能、成本、功耗等多方面的平衡性比较好。 再有就是L3的测试带宽大概率会比Zen2缩水非常多。原因比较简单,其实并不是带宽真的缩水,Zen2因为一个CCD有两个CCX,L3也就有两个,16M一个。所以你测的带宽其实是两个L3带宽之和,实际上单个L3带宽只有你测出来结果的一半。Zen3一个CCX 8C16T就意味着只有一个L3了,测出来的结果必然会减少。到时候如果实测带宽不减反增,那我只能说蒜泥狠了。 2.Zen3的工艺不再是早期说的7nm+,而是和Zen2一样的7nm。 我认为这个为真的概率90%。 毕竟牙膏厂现在也没有什么办法,AMD花式挤个牙膏省点成本并不感到意外。 3.Zen3的浮点流水线规模+50%。 我认为这个为真的概率10%。 也就是说,我认为不大可能,原因就非常的复杂,反正也就是我的猜测和预计而已,没必要花太多时间在解释这个事情上面,反正将来要是出现了偏差你们别来找我,毕竟就是猜测。 除了上述传闻,还有一个我自己的一个猜测: Zen3的IO die和Zen2会是同一个规格,不会有升级,最多就是细节上稍微优化一下,小修小补一下。有可能连工艺都没变,也可能是12nm+。 我认为这个猜测为真的概率70%。 苏妈最大的特点就是省成本,没必要改动的就不会改。 今天就先说这么多,过几天我如果有时间的话,有可能会接着说下一个问题,我想象中的Zen3什么样?或者说如果Zen3的升级让我来做,我要怎么做? 岔气牛 2020-07-15晚
这一记响亮的耳光能否扇醒FX吹? AMD推土机虚假宣传案首战失利,模块多核到底是不是真多核? 在2017年推出Zen架构的锐龙及霄龙处理器之后,AMD在高性能CPU市场已经有了底气,今年CES展会上还展示了7nm Zen2架构的锐龙3000处理器,不需要多核心就能硬刚英特尔同级别处理器,意味着之前弱势的IPC性能也追上来了,现在有压力的是英特尔了。在这样的情况下,可能没多少人记得AMD 8年前推出的推土机处理器了,顶着首款桌面8核处理器光环的它并没有给AMD带来荣光,反而因为弱机的表现惹上了集体诉讼。在这场诉讼中,AMD提出的多核认知观点被法官驳回,推土机到底是不是真正的8核处理器要交由12人评审团来决定,换句话说普通人而非技术专家将决定这次诉讼的结果。AMD的推土机架构发布于2011年,没上市之前AMD就对这款处理器寄予厚望,广大粉丝也对此热烈期盼,因为之前的K10及改进版架构中AMD在面对英特尔酷睿处理器时已经没优势了,指望全新架构的推土机处理器扳回局面的呢,结果.....大家都知道了推土机那一代处理器的命运了,以致于AMD在2012年推出改进版Piledriver打桩机核心之后就事实上放弃了桌面FX处理器架构升级,直到2017年锐龙处理器上市。 推土机发布时被AMD宣称为首个桌面8核处理器,但是它的架构跟主流的X86架构不同,通常完整的核心应该是1个整数单元+1个浮点单元再加上其他功能单元组成,这样2个核心就应该有2个整数+2个浮点单元,而推土机架构一个模块内是2个整数单元,但只有1个弹性浮点单元,2个核心总计有2个整数+1个浮点单元,所以推土机才被人质疑不是完整的核心。 2015年AMD就因为这件事吃了集体讼诉官司,被指控虚假宣传,原告方认为AMD的8核实际上应该是4核处理器,但他们花了8核处理器的钱来购买,要求AMD返还多花的钱,虽然单价可能不多,但是集体诉讼输了的话,AMD就需要给大量用户提供退款,即便现在的AMD出得起这个钱,输了官司也不是什么有脸面的事。 对于这起指控,AMD方面指出普通人对CPU核心数的理解是没有说服力的,言外之意就是普通人认为的4核、8核概念是不对的,但是这个说法被美国法官Haywood Gilliam驳回了,双方将在2月5日开庭,The Register网站报道称12人的陪审团将决定推土机的8核到底是不是真正的8核。
Zen2全核(12甚至16核)频率或将4.0GHz起步,风冷5.0不是梦 看了这俩图不禁让人浮想联翩接下来且听我对这俩图的YY,不过不一定对,欢迎各路专家指点。 先说第一个图。这个图是14nm(是不是LPP不知道,不过既然是在宣传Ryzen的时候介绍的,应该是LPP,我们就先按照LPP来理解吧)和28nm的对比, 横坐标是功耗,纵坐标是频率,从这个图可以看到14nm工艺确实够差劲的,仅做到了功耗比28nm低,但最大额定频率和28nm是一样的。 我在14nm那根曲线上面做了两个标记,黄圈标记的位置,我把它称为 甜蜜拐点,大约对应着Ryzen的3.0-3.2GHz左右的频率,过了这个频率开始功耗上升较快但频率提升较慢;红圈标记的位置我把它称为最大额定频率,大约对应着Ryzen的3.5-3.7GHz左右的频率。 接下来说第二张图。这张图,蓝色的线是14LPP的工艺,橙色的线是7nm高密度工艺(6T标准单元库),绿色的线是7nm超高性能工艺(9T标准单元库)。(注意此高性能非彼高性能。GF此次的7nmDUV工艺通通都是Leading Performance,也就是GF口中的高性能工艺。这个工艺以高性能为基础,在此基础之上发展出两种有所区别的工艺,一种是侧重于集成密度,一种是侧重于高主频低密度。罗里吧嗦说了半天,意思就是,橙色的线代表的是倾向于高密度的高性能工艺,绿色的线代表的是倾向于高主频低密度的超高性能工艺。) 需要注意的是这张图的横坐标是频率,纵坐标是功耗,这与第一张图是反着的。然后请忽略绿色的线,因为Zen2我认为有90%的概率会采用橙色的那个工艺。 然后就是这张图里面的3根曲线并没有见到拐点,这也许意味着图中的最大频率就是甜蜜拐点。也就是蓝色线横坐标接近1.3的位置可能大约对应着的是Ryzen的3.0-3.2GHz的位置。 所以这也许就意味着7nm高密度工艺的甜蜜拐点大约就在横坐标接近1.7的位置。甜蜜拐点频率大约比14LPP高出30%,换算过来,意味着对应着Zen2的甜蜜拐点频率大约就在3.9-4.2左右。 Ryzen7 1700的全核频率恰好就定在了3.2GHz,所以Zen2架构的Ryzen7 3700也极有可能就是4.0-4.2GHz左右的全核频率。 可惜的是图中推测不出来高主频型号会到什么频率,更无法推测超频后能达到什么频率。不过4.2起步了,5.0还会远么? 本文纯属外行人的YY,欢迎A粉、A吹、A炮一起YY! 只接受高手点评,不接受任何批判
转载:英特尔CPU被漏洞团灭 而且暂时还没法修复 前段时间,谷歌的研究人员发现英特尔在处理器中隐藏了一个迷你操作系统MINIX,虽然大小只有几十M但功能强大,有网络堆栈、文件系统、USB等功能,并且拥有Ring-3级权限(拿地球举例就是Ring-3就是地心,只知道存在,用户无法操作也无法触碰的地带)。八代酷睿不能幸免 公开资料中,英特尔称之为“安全管理系统”,但背后到底做了什么谁也不知道,很多人担心系统漏洞会影响系统安全。现在人们最担心的事情真的出现了,Intel今天公布一份安全报告,承认近三年的处理器中,管理引擎ME 11.0.0-11.7.0版本、可信赖执行引擎TXT 3.0版本、服务器平台服务SPS 4.0版本里,共存在多达11个安全漏洞,而被利用的环境正是MINIX。刺客之心 挺应景的 受到影响的处理器包括 - 六代酷睿Skylake、七代酷睿Kaby Lake、八代酷睿Coffee Lake系列 - Xeon E3-1200 v5/v6系列 - Xeon Scalable系列 - Xeon W系列 - Atom C3000系列 - Apollo Lake Atom E3900系列 - Apollo Lake奔腾系列 - 赛扬N/J系列   也就是近几年的英特尔处理器几乎全军覆没,漏洞可以用来加载、执行任意代码,甚至进行远程攻击。   英特尔还准备了一个漏洞测试工具,可以查看设备是否中招知道危险又怎样 一般来说,系统出现漏洞打个补丁就好,但问题在于MINIX系统并不在大家看的到的地方,没法通过下载安装补丁的来修复。但需要厂商配合部署,所以目前我们现在只能干瞪眼,毫无解决办法。   对于普通用户来说,不必太担心,但金融机构和大型企业用户就得小心了,一日不修复一如不心安啊。
12张图简单研究内存带宽对性能的影响,兼谈Ryzen双通道 话说PassMark的跑分一下让贴吧炸了锅。Ryzen在质数计算和物理计算这两个项目上面只有对手一半多一点的成绩。并有人就此断定Ryzen的游戏性能一定不好,跟推土机系列一个水准。 那么今天我们就来研究一下这个问题。 我通过私底下的测试发现,PassMark的质数计算和物理计算这两个项目对内存带宽特别敏感,估计Ryzen只有对手一半多点的成绩并非因为处理器内核的计算能力不佳,而是因为对手内存四通道,内存带宽是Ryzen的2倍。 我的研究用的测试平台就是我现在用的电脑,1366平台,至强6C12T。 我分成4个不同的内存状态,16G单通道低频(DDR3 1232)、16G双通道低频(DDR3 1232)、24G三通道低频(DDR3 1232)、24G三通道高频(DDR3 1540,处理器超频之后也只能支持到这个频率)。 为了减少内存控制器造成的瓶颈,我将uncore超频至3080,无奈U的体质太烂,3080的频率还是有不小的瓶颈,不过没有关系,这个程度足以明显区分上述4种状态对应的内存性能。 先看前4张图,分别测试了PassMark的质数分、物理分,还测试了CR15、象棋、wPrime(这也是一个质数计算程序),还有AIDA64的内存带宽。这4个图中的信息量还是比较大的,大家可以稍微认真的看看。 通过观察不难发现,PassMark的质数、物理这两项的成绩几乎就是和内存带宽成正比,尤其物理分与内存带宽相关度接近于完全正相关。 与其说是物理分不如直接说是内存分好了。因此我认为这个PassMark的物理分没有什么参考价值。 我们平常的应用没有对内存带宽依赖到这种程度的,至少我是没有见过,如果谁知道有那样的应用可以介绍给我,让我长长见识,学习一波。 统计一下三通道高频相对于单通道低频的成绩提升: 象棋 +1.18%; CR15 +0.87%; 质数分,4种情况中,每一种我都是跑3次,出来3个不同结果,所以我就不算了,大家自己看,反正差别还是很小。 这一组测试可以看出来,对于一个性能有点弱的6C12T的U来说,单通道DDR3-1232与三通道DDR3-1540的差别其实很小,以内存读取带宽为例,三通道DDR3-1540读取带宽是单通道DDR3-1232的2.48倍!但实际的跑分只高了不到2%,甚至可以算是测试误差级别了。
1 下一页