ecc homelab选购指南
nas吧
全部回复
仅看楼主
level 1
雷军i 楼主
1L省流: ecc 99%情况心理安慰大于实际作用,优先级很低
2025年02月23日 04点02分 1
level 1
雷军i 楼主
1. ecc概述
ecc内存是除了常规的数据位之外拥有额外若干位宽的内存,这些额外的位储存了某种校验码,可以对数据的错误进行一定程度的校验/纠错。
本文讨论的ecc是传统ecc。ddr5新增了一种"片上ecc",可以纠正内存内部产生的错误,但和cpu的通信并不包含额外的校验位。这种"片上ecc"在下文会当做没有ecc处理,因为并不能阻止数据从内存条到cpu的传输过程产生的错误。
windows用户可以通过aida64之类的软件查看当前系统是否开启ecc。linux用户可以通过dmidecode -t memory来查看,如果total width大于data width就说明有ecc,多出来的就是校验位
2025年02月23日 04点02分 2
level 1
雷军i 楼主
ecc内存又分为rdimm和udimm。rdimm多了一个寄存器,cpu通过这个寄存器和内存通信,延迟增加但是更稳定也更容易跑到高频。服务器那么多通道能每个通道插两条内存还不降速就是靠rdimm。ecc udimm除了多了ecc之外和普通内存没有区别,会存在一个通道插两条降速,或者出现不同品牌内存插一个通道不兼容的问题。
rdimm和udimm通常并不通用,除了少数例外,一个主板只能支持一种内存。ddr4时代rdimm和udimm的插槽一样,会出现有的人兴冲冲买了大船回来发现不兼容的问题。ddr5这两种内存插槽做了区分。
有人把udimm叫"纯ecc",叫的多了就有人不知道是不是结合了所谓纯血rog的概念,把udimm叫"纯血ecc"。纯ecc可以说是没说错,但是纯血这个叫法就有点扯了
本文的讨论将大多集中在udimm,这其实也是情况比较复杂的地方。rdimm的世界简单的多,买来,插上,用就完事了。想用ecc udimm,你需要进行板u搭配,亮机后还要确认ecc是不是真的启用了,然后你还要忍受插满后可能要降频。但是udimm的价格一直还是居高不下,只能说爱折腾的人还是很多的
2025年02月23日 04点02分 3
level 1
雷军i 楼主
2. 主流家用平台对ecc的支持
2.1. inter
在阻止普通人用ecc这件事上,牙膏厂一直是不遗余力的,可能也是这个公司目前为止做的最大的恶了,什么缩肛和这个比不了一点。
2.1.1. 主板
想在intel平台使用edlcc udimm,首先你得需要特定南桥。比如c246。然后你还要确认bios是否支持,没错,部分寨厂的c246是不支持ecc的。你得找正经板厂的c246
要命的是intel对于什么人配用ecc的想法一直在变,所以南桥型号也一直在变。1150/1151时代是服务器,c242/c246,1200之后变成了workstation系列,w480/w580/w680。没错,skylake时代的工作站是不配拥有ecc的,x299据说最开始测试版还支持,某次微码更新就屏蔽了。
2.1.2. cpu
主板有了,你还得有一个支持ecc的cpu,否则虽然插上ecc内存能点亮,但是ecc并不会启用。不支持ecc的cpu是刻意阉割出来的,intel说你需要额外花大钱买完整版
首先所有志强都是支持ecc的。除了大家都比较熟悉的e3,8代和9代还有e21xx和e22xx系列,10代和11代有w12xx和w13xx,11代还有个e23xx系列(11代看来真的是卖的太差就)。13代有e24xx系列(13代全大核版)。这些cpu除了e3外一个比一个贵,尤其是e21xx和e22xx,6核8核带核显的版本都贵出天际,没有什么购买价值
除了志强外,9代之前带核显的i3及以下支持ecc,在对应的主板上可以启用。所以说8100真的是一代神u。当时很多人觉得这是inter仅有的良心,i5 i7级别性能的u想要ecc都得花大价钱买志强,i3奔腾赛扬就可以直接用,正所谓专坑富哥们
然后10代11代仅有的良心就让狗吃了,这两代酷睿全系不支持ecc,只有w系列支持。可能是这个阶段策略变了,认为只有高贵的工作站才能用。然而这两代工作站什么水平大家都知道,w-31xx和32xx被线程撕裂者吊打,酷睿生产力被16核3950x吊打,工作站出货量应该不大,所以w12xx和w13xx价格也下不来
到了12代情况又变了,i5 xx500以上的带核显的cpu都支持ecc,这下劫贫济富了,只要有w680就能启用。12代还有一大优势是同时支持d4和d5,12代扩展性也很给力,可以说是一片光明。不过目前12代还算比较新的平台,目前板u价格都居高不下甚至还涨价,不过以12代的保有量后面价格肯定会下来的
2025年02月23日 05点02分 4
level 1
雷军i 楼主
2.2. amd
amd比inter要有良心不少,但是策略和产品线都更为混乱,搞的也很复杂。我们暂且把amd的cpu分为"cpu"和"apu",其中cpu包括台式锐龙3000,5000,7000,9000这些,apu包括迷你主机的绝大多数以及桌面平台结尾带g的。这部分下文的cpu都特指"cpu"而不是通常意义的cpu
2.2.1 cpu
amd的桌面cpu全系支持ecc,只要板厂不禁止。禁止的例子有微星的am5。amd cpu的ecc策略和超频一样,就是我就不阉割了你爱用用不用拉倒。如果能忍受较高的待机功耗,那amd cpu确实是ecc的一个好选择
2.2.2 apu
apu对ecc的策略比较接近牙膏厂,除了少数apu(pro系列以及7735hs等个别)外都是不支持ecc的。而且pro系列apu不零售,所以保有量非常少,个别甚至还锁主板,联想的oem apu只能在联想主板用,可以说连牙膏都不如。
目前在售的apu除了少拆机的4000pro和5000pro外,几乎没有支持ecc的diy方案,只能买联想工作站之类的整机。迷你主机用apu的非常多,但也几乎没有支持ecc的。
2025年02月23日 05点02分 5
level 1
雷军i 楼主
3. 选购指南
3.1 x11ssh-f+e3 1225v6
这应该是目前最具性价比的ecc平台了,板u不到300,itx,8sata,还有ipmi。e3v6的核显是7代的,补齐了6代核显的编码。skylake虽然老但并不算很落后,avx2,aesni都有,做aio除非性能要求非常高不然没什么短板
3.2 戴尔3630/惠普z2g4 + i3 8100
这两个都是c246,原生支持8100不用魔改。3630两百多,z2g4要将近400,虽然单论价格比x11ssh贵不少,但是这是准系统的价格,带个做工比较不错的机箱以及效率非常高的电源,整体还是很值的。品牌工作站的bios锁的比较死,扩展性也比不上超微/华擎,但是插个直通卡插个网卡当aio还是绰绰有余的。c246还可以上e21xx和e22xx,如果有一天这帮大爷的价格可以降下来也可以考虑升级
3.3 华擎b550 pro4 + 3600
这套板u都比intel 4核平台贵,但是比6核平台便宜多了,e21xx实在太贵了。锐龙支持显卡插槽拆分成4x4,所以扩展性比看上去强很多。最高可以上到16核,彻底解决性能焦虑。不过待机功耗比较高
3.3 w680(?) + 12500
如果8700的性能没法满足你,又不想忍受amd平台的待机功耗,那可能只能12代了。这套其实不是特别推荐,目前看来还是很贵。cpu的价格降下来是迟早的事,但是主板目前还看不出哪个主板有成为x11ssh的潜力。最便宜的铭瑄w680产量小到二手都不好买,华硕pro ws看起来量挺大,但是还是有点贵而且鉴于华硕w790信号门感觉和铭瑄一样不靠谱。
御三家
(联想惠普戴尔)的塔式工作站保有量相当大,虽然现在准系统还要2000多但是未来可期。不过御三家工作站用的全是d5,插满四条只有3600约等于d4,而且d5 ecc的价格感觉会比1700平台坚挺几倍。除此之外还有各种工控板,比如研域的(yysy研域的w680是经过intel官方认证的,比一众寨板高到不知道哪里去了),但是当第一个吃螃蟹的人还是需要勇气。
2025年02月23日 09点02分 6
x11ssh-f如果要调用核显可能会有死机问题,慎入
2025年02月23日 12点02分
@▫杰杰杰 感谢提醒,怪不得那么便宜
2025年02月23日 14点02分
level 4
小白一枚、懂得不多。前段时间想着用intel消费级别cpu搞pve作homelab、结果发现牙膏消费cpu基本不支持ecc。现在发现好多新的东西都在路上(pcie5ssd、pcie5卡槽、ddr5、雷雳5、a18)没钱也就yy一下自己理想的homelab:利用好的intel未来新款cpu来搞雷雳五网桥、ecc内存、3个pcie5ssd、pcie5显卡、预留一个pcie5卡槽、4-6个hdd组raidz。因为雷雳选intel、主板连mac所以没搞网卡而走雷雳网桥、当然现在其他系统和mac的雷雳网桥不太ok、希望未来搞好吧。总想高性能低功耗、还是个人太贪了[泪]
2025年02月23日 14点02分 7
扩展性主要还是看pcie通道数,不然哪怕pcie6来了也没用。便宜好用的扩展卡都是3.0的,甚至还有2.0的。理想的pcie5x4是等效pcie3x16,然而现实是你只能插一张pcie3的扩展卡,所以等效pcie3x4。并且很多情况下只能找到pciex8的扩展卡,非开放式pcie5x4等效x0
2025年02月23日 14点02分
或者就是等十来年之后pcie5扩展卡成了消费级主流服务器古董,到时候再组现在的平台就不会浪费带宽了,就像现在回头看1151,平台便宜,当年3647用的那些贵的要死的扩展卡也便宜,1151的性能做homelab也相当够用,大概七八年后1700平台的性能也还是能战吧
2025年02月23日 15点02分
level 5
老哥好,请问下至强W-1350这种cpu的正显版会出现不支持ecc内存的情况吗,我买了惠普z2g8,w580芯片组,插上ecc就直接内存报错,插普通的就没问题,换了一根ecc还是这样,给我整郁闷了
2025年02月23日 18点02分 8
你先上普通内存进bios把频率调低一两档,调成2933或者2666之类的再试试能不能开机。不行的话可能就是你这颗u的问题了,qs功能上一般不会有阉割,有可能是被艹坏了
2025年02月23日 23点02分
@雷军i 那估计就是被干烂了,我买的ecc就是2666频率的,而且这种工作站的bios好像没有调内存频率的选项,没想到买个正显版还能遇到这种坑。
2025年02月24日 02点02分
@4676683 z2g8twr的规格手册的内存兼容表总结一下大概是用惠普原装ecc内存不是4x32的话保证3200,4x32只保证2933,第三方ecc内存只保证2666。bios不让调的话我也不知道他手册上这些数据怎么测出来的,你要不试试xtu行不行
2025年02月24日 02点02分
1