hxxllanx hxxllanx
小小软工宅,但是喜欢gaming,致力于追求流畅游戏体验
关注数: 0 粉丝数: 31 发帖数: 773 关注贴吧数: 7
我对是否购买amd的观点 如果觉得amd卡,换Intel就完事了 (但是我不推荐小白买Intel) 983不能满足的情况下,一般能满足你的只有 水冷14代k oc配8400 d5或者4400 d4 如果不追求高帧你可以果断选择12代配d4养老或者2便宜搞套z890杠p配265k 确实存在Intel没那么卡而amd卡的情况,有一种原因是代码写得不够好导致amd的cpu性能吃紧。这玩意涉及到cpu架构的问题,目前看了一些行业大佬的文章,他们有人指出的是amd的前端还是不如Intel所以导致其在遇到麻烦代码的时候确实会吃紧,而结果就是cpu效能降低。(这玩意展开太他妈多事了就记个结论就行) 如果你想继续看下去,这就不得不提两个测试,一个是cpuz,一个是cinebench r23。 cpuz其实是一个压力前端的测试,zen5 解码从zen4的4宽变成双4宽并且在中高负载压力能够维持6宽水准,然后加上其所含有的448条rob,所以说其cpuz跑分能够和12代酷睿坐一桌,并和13 14(这两代架构和12代很接近)接近。而Intel那套从12代开始,13代加l2并无修改延续到14代的架构,有6宽解码512条rob,其实前端资源相比zen5还是更充沛一点,所以在超频之后实际上跑分提升也不小,顺带说一说u200这玩意跑cpuz有因为rob资源不足导致其性能相比14代倒吸的状况。 但是不是说zen5的算力不行,恰恰相反,是他的算力更容易因为前端阻塞而被浪费掉。 我认为这个观点能够解释为什么x3d在玩cod战区不卡但是在玩永劫吃鸡的时候会卡。cod对amd的优化真的可以。 我认为amd这么做,本身的初衷是为了节省成本,他们把核心端的一些资源缩减到刚好满足企业用户的需求,以减小硅片尺寸并减少晶圆浪费。企业软件的代码通常是极度优化的,而且Linux系统的调度基本上懂得都懂,反而不会有很严重的前端瓶颈。 当然,25h2可能优化了系统底层,现在amd用起来比24h2舒服很多了! 最后提一句,目前来看zen6有可能出现最坏的情况就是因为架构没大改,所以即使换if总线让内存延迟变低了,带宽上去了,但是因为架构问题,游戏卡顿不跟手可能还是难以解决(当然,至少不会坏过zen5。但是对novalake还是不好说,Intel在pantherlake还是展现出了不小的野心)
向各位大佬汇报一下目前的研究进度 1.auto没啥问题,主流游戏随便应付,除了某些沙茶游戏。 2.pbo2的机制十分激进,对散热器有要求,我认为实质上很难防得住负载的突然攀升带来的掉帧,但是一般优质的水冷能够应付掉帧,最好可能还是开盖上液金配冷水机。 3.我认为主板厂给的电压就非常适合auto,在手动调试超内存超fclk的时候需要配套调vddg、vddio、vddp、vdd misc,我认为理论上不建议抄作业,所以萌新还是auto。amd最关键的就是if总线加iod加dram这一套链路的稳定性。dram小参的作业大佬给得很详尽,vdd vddq和对应频率参数是可以直接参考的。 4.目前来讲,amd已经通过芯片组驱动优化三缓效率,按道理来说已经掉low的情况好了很多,如果仍然出现明显频繁掉low我认为应该是游戏底层设计的问题使得三缓利用率不佳或者是pbo撞墙。应该如何理解这个撞墙呢? 我的理解是因为amd使用先进制成,所以芯片内部热密度十分高(单位体积内发热的晶体管多),不清楚有没有可能虽然检测软件在只有60度,但是cpu内部因为局部过热或者某些不可探测的情况为了稳定会降频(这有可能出现在某些极端单核压力的游戏) 而且有大佬启发了我有关于供电品质对于amd处理器稳定性的问题,这个我没有示波器无法下结论,但是我会继续寻找机会研究。 5.不同场景的负载不同,目前仍然很难去找一个场景来综合解释,但是我会继续努力,AMD YES!
别瞎几把说AMD卡 以当年whea18为例子,这whea是啥意思呢?WHEA(Windows Hardware Error Architecture)Event ID 18 并不是某个“单一 bug”,而是一类致命硬件错误(Machine Check Exception,MCE)的通用报告。它的目的是说明CPU 内部的错误检测机制发现了无法自行恢复的异常,并把信息交给操作系统记录下来。 那么在 AMD 平台上,常见触发点主要有三类: 1. 内存子系统和IMC(集成内存控制器)不稳定 XMP或EXPO 频率过高、时序过紧、或内存 rank/插槽拓扑导致 IMC 负担过重。 SoC电压、VDDIO等电压设置不当(过高或过低都会触发)实际上这是社区里最常见的原因。 2. 电源/供电瞬态异常 主板 VRM 设计或 PSU 瞬态响应不足,导致核心电压、SoC电压在负载切换时掉压或过冲。LoadLine 校准(LLC)设置得不好,会加剧瞬态不稳。关键周期拿不到合格电压就容易报错。 3. 单核或核心缓存/互联 Fabric 的硬件故障如果在完全 stock、稳定供电、稳定内存的条下,仍然是同一个 APIC ID/同一个核心持续报错,那就可能是 CPU 本身物理缺陷(这种情况才真的要 RMA)。 这可不是“AMD自带缺陷”,因为AMD 芯片内部if总线系统本来就有ECC和Parity检测逻辑,WHEA 18 是它在“救不了”的时候把信息扔给系统。大量玩家遇到的情况,其实是电压参数配置错误、内存超频过激、供电品质不佳,并非 CPU 天然不稳定。真正的芯片硬损坏(要 RMA)只占极少数。 以我自己的例子来说,我自己就重新试出来我的这两块amd的soc电压。比如说我7800x3d fclk2000 6000c26就给1.18v, soc电压(实际1.19v),vddio 1.25v(换了主板平台,到时候还要继续调) 9950x fclk2133 6400c28, soc电压1.28v(实际1.29v)、vddio 1.28v,过了run memtest 300% 实际上amd的一般进系统低负载娱乐卡顿最关键的点就在if总线、dram相容性以及wintel联盟的联合负优化三个部分。if总线的性能会受到soc电压和vddio的影响,soc电压影响对于iod的供电,vddio影响在内存控制器和if总线系统中间的桥接组件的供电。奇怪了,这if总线不就是一条线吗有啥讲究?错了!if总线不仅仅包含那条线那么简单,实际是包含那条线还有其与iod和ccd链接处的信号处理交互组件,这一套叫做GMI,意思是(Global Memory Interconnect),就是全局存储内部互联组织,就是if fabric(单纯的if总线里面的线)与if fabric与ccd互联部分的硅电路和if fabric与iod互联部分的硅电路。你电压给不对相当于那俩部分电路工作异常,所以就会卡顿,严重的甚至会报错。 amd游戏重载卡顿正常,但是日常用卡顿还是找找自己原因先。amd增加了xi缓冲队列能够让if总线纠完错再传输,但是if要是总在纠错,那爆队列可正常了。 有个厂的主板呢就有点**。他的那个内存电压和vddio电压是联动起来的,这会严重影响超频之后的稳定性。 最后,祝Intel好死。
梳理一下amd的cpu阵列 目前,大家目光都在5000\7000\9000系上。 根据架构设计来说,zen4其实算是zen3+(具体在CSDN网站搜索zen4架构解析就行了),所以7800x3d锁4.85的表现其实和4.85g的5950x单个ccd来说并没有很多。 但是783有个问题就是积热很严重,所以频率很容易抖动,好的散热还是有必要的,能够减少频率抖动。 所以你要买cpu的话,7000系等于5000系超频版,而且fclk有提升,所以说内存性能实际上比5000系好一些些,但是目前来看实际上ddr5延迟不比ddr4小,他只是带宽会大一些,所以实际上对于游戏就差不多了。 真正架构比较大改的就是zen5,而且zen5的在一些细节也做出改变,没那么积热,更好超更好玩。而且这一代真正在单核性能上追上了Intel,所以是最推荐购入的。 X3D肯定是大家最关心的cpu了,其实根据我的解析,大家应该不难发现为什么9800x3d会比7800x3d和5800x3d强。 但是也不是说7800x3d和5800x3d就没有意义 我认为,如果你要极致体验,那就9000x3d。 7000x3d和5000x3d有好价就捡,很适合配一般的itx和matx这种板子,而且x3d缓解了内存延迟不如Intel的问题,所以简单来说确实内存压力小很多,不怎么挑板子。 然后就是amd桌面端只有两种产品:950和900系列和其他。950和900的ccd的质量和iod的质量都最顶,想折腾有钱就给完事了。 最后,zen6马上来了,准备好了吗?msi b850mpower出了,而且是新走线,可以整一张来备战zen6(记住,高频ddr5你要玩得转还得是双槽,现在技术,只要是ddr,5000频率以上开始就归为高频,对主板走线和cpu的imc的要求就高起来了,未来超频8层板2oz双槽永远是最好的搭档,当然10层或者更多也是很好的)
为什么可以期待zen6 台积电fan out技术诞生于2015年,并在2017年于移动手机高端产品线普及。 而amd在fan out技术普及高端手机的5年之后,也就是在2022年之后才将其引到rdna3架构,这在一定程度上降低了生产成本,同时带来接近10倍的带宽提升。 而这个fan out技术的技术原理就是使用特殊工艺加工,通过合理压缩信号线长度并提高走线密度来保证高频数据信号传输的稳定性。 这对fclk的提升有可能是超越3000mhz,可以甚至达到6000mhz与cpu完全同步,这个时候全看amd在工艺上的进一步配套定制优化(你看看小米玄戒o1的soc解析就明白了) 但是有个问题,这个压缩信号线长度怎么体现呢?详情请见图一,手机的封装方式就是直接就是贴在芯片上面(真的一元硬币的厚度哦!哈啊哈哈 ) 然后如果你看过rdna3芯片你会发现芯片块之间靠得很近(图二),这就是为了减少走线长度。相比之下图三的7945hx的ccd和iod就显得十分之远了,这就是有机基板封装的if总线。那你再看看图5和图6中zen6的爆料,是否就豁然开朗了? 那当年amd大胆使用fan out技术带来了什么呢?仔细看回当时候的宣传稿,if时钟提升了43%!这个就是一个关键!(图四放大,第二行) (7000系列会输,主要是因为计算单元效率过差) 而amd的桌面端会在26年年底和27年登场,几年沉淀后我觉得完全有理由相信这次表现更好。如果达到4000,能直接配合同频8000,真就***裂。 感兴趣的朋友直接看这个知乎大佬的链接就行http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fzhuanlan.zhihu.com%2Fp%2F511279570&urlrefer=bf1d03a358e70856c746059925c3c9df 这时候有人肯定会狐疑。zen2和apu甚至是硅芯片内部if总线,为啥频率辣么低?我认为是amd做硅芯片为了良率会尽可能压缩面积,比如apu中有gpu和本来在桌面端就应该分离在iod的东西,全都挤压在了一个小硅片里,使得if总线空间太小(zen2同理,if被ccx挤压),这导致在小范围内把频率做上去,其功耗和发热可能会影响周围电路。所以我认为amd有可能设置一些东西限制了fclk。 如果选择相信我的,可以至少备一块x670gene x870apex或者微星今年年底可能会出的x870unify(双槽战神!)。这个时候超过Intel 14代之后换平台留下来的高频内存会直接在amd zen6时代再度辉煌。(当然前提是amd自己好好搞) 我将拭目以待,如果amd成了,当然是最好的!
我觉得对于amd应该有个基本认知 我看最近很多**说9700x还有9600x强过146kf。 其实不然。 首先说明,我的目的是建立更好的amd gaming pc环境。 上来就带节奏的死出去,找骂的我毫不客气。 原因就在于if总线带宽瓶颈以及小核。 我使用9950x的时候经常使用process lasso把后台能挂的全tm挂到ccd1,只留ccd0打游戏,实测流畅度完全爆杀默认调度,而76x和783需要我在玩cs2的时候杀完所有后台。 那么这个具体涉及什么? 首先你要明白一个点:if总线的特性就是每周期32b读16b写。 乘上2000的fclk频率(也就是if总线时钟频率)就是理论值64000b读 32000b写。 这俩我们近似看成64gb读,32gb写。 ok,经常超频的老烧肯定发现问题了! ***,amd写都90多gb每秒了现在!民科滚一边去! 别急,听我讲。aida64测的是大块数据读写。什么意思呢? 关键就在于amd三缓里面有缓冲队列xi(就是一个指令中转站)。你每次传16b是很少,但是你放多点,堆满64b再打包会怎么样?而aida64恰好测的是你多次爆发写入的速度,就是说支持你打包作弊。你只要每次打包好64b等测试间隔到了再放出去就完事了。 amd负责干这个指令缓存的模块叫xi模块,负责把你的cpu发出的读写指令暂缓,然后进行字节对齐的,而且xi指令暂缓有限制,我列一下(按ccx来排): 3000系列是64条 8核=双ccx 5000系列是192条 8核=单ccx 7000系列我约摸估计可能是256条(网上没找到数据)8核=单ccx 9000系列是320条 8核=单ccx xi越多,对于读写负载大的程序来说越好,因为你的指令操作不会因为xi满了所以只能停下来等(你就把xi理解成火车站大小就懂了,火车站大,容纳的人多,就不容易挤慢)。 (所以你打电竞不用win10老坛酸菜这种精简系统的你牢牢实实上9000系,别再用7000系坐牢,玩吃鸡和永劫这些优化贼他妈烂,数据天天跑内存找的游戏包你怎么调都有可能卡到妈都不认得。) 如果要求连续写入,32位总线慢过16位同频怎么可能?真实的锐龙if总线,如果你真要货真价实连续读写,那就是fclk2000=64g读/32g写,没得讲。 这边我放一个外国的有趣的数据(需要魔法)http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fchipsandcheese.com%2Fp%2Fpushing-amds-infinity-fabric-to-its%3Futm_source%3Dchatgpt.com&urlrefer=f765986f02ec67ea26c8f449e1b13c89 。 如果没办法看到的话,我来简单说一说怎么一回事。就是因为amd zen5架构优化之后,内存延迟需求线程和内存带宽需求线程之间做了取舍平衡,使得你在ccd1跑内存带宽要求高的程序基本不会影响到ccd0里面对内存延迟高的程序,所以理论上没有任何7000系以及之前的amd cpu在游戏直播(你哪怕不直播,后台杀完也是)方面强过9950x3d。你要做的就是只留一个三缓ccd给游戏,别的软件和系统后台全tm放ccd1给它用高频全部搞定。而且zen5架构ipc和Intel 14代同级别,同频就是能打,5.7的x3d就是猛。 你amd再怎么折腾,都是单ccd fclk 每秒64读 32写。你要帧数上去,延迟下去,就是把fclk拉高。最高2200,提升百分之10%,那就是70.2读 35.2写。内存这个时候搞6600c26,打吃鸡才够爽。之前zen4有个延迟表,fclk在整数时候延迟最低,分别2000和2200。我记得是因为省去了非整数周期的对齐修正延迟。而在我玩下来,也是2000这种最大众,最稳定。zen3不用想就是1800。别的非整数相比于较低的整数,效能肯定好看,因为带宽就是上去了,但是你实际的数据链路因为需要额外修正,延迟就是比整数高。同样,ddr5对于内存信号和imc质量要求高。 你非整数比例高帧肯定可以,但是不一定手感稳定。 2000配6000同步、8000异步 2100配8400异步 2200配8800异步 别花里胡哨整这么多33和67在末尾。能稳定是运气,不是实力。超频本质是人去摸硬件潜力而不是人去激发硬件潜力,他的潜力都被设计好了。 Intel不管是146 147 149还是129 127 126,他的读写都是实时均衡,并没有受到if总线的干扰。根据Intel官方,可达89.6gb每秒的带宽,而且Intel传输线路是对称形式,所以你89.6的读,89.6的写。而且Intel的读写指令缓存队列是分开的,读一个,写一个,完全互不干扰,不会像amd那样有读写混合,读和写会打架。(这一点我在cs2中能感受到,有时候卡操作而帧数不卡,有时候卡帧数而操作不卡)如果你超ring还能上去。而且Intel有小核心辅助你去挂载后台,防止污染游戏线程的三缓。 指令缓存并不是什么坏东西,关键是amd的if线路导致内存瞬发读写的弱势,这点就是卡顿的关键。所以,越吃内存的游戏,Intel就是越屌。 欢迎大神讨论。
1 下一页