qubeleymk4 qubeleymk4
关注数: 52 粉丝数: 235 发帖数: 3,255 关注贴吧数: 23
还是285k,扩内存后 前面发过两个测试贴了,当时因为没有4条套条所以只有96g内存,又因为时间紧迫没有进行充分的软件优化,因此基于139k架构开发的程序下,285k略微输了几秒 而今天,刚刚拿到贼船的192g套条,调试后xmp2模式运行在5200下,memtest前6项无错通过,test6出现过一次连续地址错误(原先139跑4条时稳定性也差不多就这b样),反正普通计算任务凑合能用。软件端对于任务二修改为更多任务并发,取消多线程设计,任务三略微提升并发数。 进行同样数据修改前后的时间对比如下: 任务二: 多任务高io压力 任务三: 多任务高计算压力 任务二修改前26分55秒,修改后14分49秒 任务三修改前32分02秒,修改后21分54秒 期间内存占用峰值107.3g,也就是说还可以继续提升并发数,但性能提升应该不会这么大了,原因是本次测试中美光那块pcie5的ssd峰值占用率达到了98%,温度62度,已接近理论性能上限,无法长时间运行在更大压力下 由于工作时间关系,无法在139k上对同组数据采样,而且针对框架优化后无法形成合理横比。但从以前帖子的成绩来看,两者差距非常小,因此可以推论,优化后如此大幅度的成绩提升说明,当285k的性能得到充分发挥的前提下,综合成绩远远高于139k 至此,285k的性能测试全部结束,以供各位工作党参考。 闲聊一句,本次测试对游戏党的影响不大,看之前的单进程测试(任务一)可以明白,只不过是功耗和发热的优势而已。我个人使用的感觉是问题出在cpu内部的延迟上,并且唯独这点使用者是无从下手的。这个是从工作的细节以及看了intel的检测结论中得出的,没有什么科学依据
用了1个月了,U9 其实也还好 首先linux下工作的朋友可以无视此贴,很多问题是windows环境的问题导致的。然后前面发过测试贴,使用环境和任务什么的不赘述了。这阵子也没少被游戏党和一些感觉自己啥都懂的人的阴阳怪气。当然其实只是他们没有接触过工业级应用或者后台程序的开发,不明白瓶颈在哪,遇到瓶颈的时候什么样子而已。 跑题了,说回来,在遇到了一大堆窝心的状况,以及把intel号称的bug踩了一遍以后,我用了比较流mang的方法绕开了一些限制。首先就是激活win10以后,把能关的特效什么的全关了,用户策略上能给的权限全给了,电源策略也给满。其次关闭了虚拟内存,重新平衡了一下 任务的内存占用,给所有任务写了个工作量预期,然后按内存占用排序分队,防止爆内存。最后就是绑了内核,但是还会有大核跑不满的情况,这就明显是微软的锅了-_,-……最后生气直接拉进程优先级,彻底接管了windows的调度。 说说这么干的结论吧。由于优先级仅次于system进程,因此如果不在代码里适当手动释放计算资源的话会把windows卡死,直到一些内核的任务完成被释放(windows机制限制,你就是去ring0写代码也没法优先于它,也不知道系统资源分配在哪个内核上)。但是这样做的好处就是大核完全归我控制。在调度满所有大核满负荷工作后,如果同时绑定超过6颗小核满负荷计算的话,cpu的功率和温度就会直线升高。不过我同时跑满20个内核也就200w,70多度而已,所以不触发系统卡死的话其实还好。 但是!!重点来了,不知道是我 这颗u的体质不高还是怎么,经常看到有内核给不到应有的频率的情况,比如大核跑在4.8或者5.3而不是5.4,或者小核冲到4.2就缴枪了。我感觉这才是真正的硬件bug…… 性能方面,满负荷工作也只比139提高一点,这一点估计还是io的提升带来的。所以说真的,有点对不起它ipc的提升量。又或者说,不用avx优化一下的话,想把它性能充分发挥出来还真挺难的。 但是!!继续说重点!稳定性回来了!我这样修改后(不卡死系统的方案下),再也没蓝过屏,满负荷工作个30分钟轻松得很,发热的降低,节能的提升,稳定性的回归,这些对我的应用场景来说还是相当满意的,毕竟数据出问题一次,修复就得4个小时以上,损失大了去了。还有就是高并发的情况下性能毫无折损,这可是9代以来头一次,毕竟以前都不敢配置太多进程,怕互相抢资源,现在只要不把ssd打傻,进程少于内核数就行,这可是太香了 反正玩游戏的现阶段不建议考虑,它对不起这价格和ipc应有的表现,继续等intel修复所谓的bug再看。干活的,如果你的程序归你自己管理,可以考虑。
285k克服调度问题的试验 看过我前面两个帖子的人应该知道我遇到了2个问题 一个是调度优先了小核 一个是分配到大核的进程被在几个大核间来回切换 这种调度倒是不至于损寿命,但是性能也发挥不太出来,唯一的实打实的优势就是功耗低。但是对于我这种用它干活的人来讲就真的不太友好。 实验思路: 基于我的三项测试,既然这代io有富裕,那么增加一些并发数也不会反过来降低效率。刚好我的任务三内存占用很低,同时开几十个进程都没问题,那么就用它开刀了。 既然调度的时候优先了小核,那么,如果并发数超过小核数量不就强制使用大核了吗?所以我直接给它20个并发,如此一来,系统面临二选一,或者是16小核+4个大核,或者是8个大核+12个小核。即使是前者大核也没法频繁切换内核,由此省去一部分调度时产生的时间损耗。 而对于高并发高占用率导致的发热问题,我去bios里调了风扇参数。cpu组由标准调到了高效,排风组触发加速的温度每stage下调2-5度,转速上调5%。进风组触发温度不变,转速上调5%,然后100%转速的stage下调到68度,监控温度由cpu package调整为多温度源,附加了芯片组 由于我的任务三的计算量导致总时长过长,因此无法多次测试采样,所以只能记录过程现象和大致问题。 现象: 1. 修改前功耗100瓦,修改后最高功耗147瓦(nb!) 2. 修改后,8大核+12小核,小核会有来回切换的现象(这个实验中考虑到大核任务会先完成,因此没有锁内核) 3.一部分任务完成后,减少的是小核。大核仍旧全满载 4. 以任务三的文件访问量,ssd的负载在修改前后无变化 5.温度最高见到64度,随后随着风扇提速,迅速回到51度(nb!) 6. 最后剩2进程时,cpu开始睿频,温度低于45度后加速到5.7g,持续了大约20秒后温度上升,一个内核恢复5.4g。 比起功耗,我倒觉得这代的发热是一大改善呀 试验结果: 修改前,10进程耗时2小时6分25。 修改后,20进程耗时1小时24分11 调度的两个问题已解决,实际工作时间也终于比139那台短了
终于,285k实战成绩出来了 本次装机配置如下 cpu: 285k 主板: rog z890 hero 内存: 贼船48gx2 6000 30 散热: 龙神三360 argb extreme 1500转14猫扇x2+1500转12猫扇出 14猫扇x3+12猫扇x2入,负风压 显卡: 影驰4060双扇版(就为了4屏高分辨率响应快,不用于游戏) 存储: 三星990 evo plus1t 系统盘 美光T705 4T,工作盘-碎文件分工,pcie5主盘位 贼船mp600 8t裸条版,工作盘-大文件顺序读写,pcie4主位 机箱:追风者pk620 电源: 贼船1000e 1000瓦 对比平台为2年前装的13900k,这里不占篇幅赘述了。 其实,这次测试对285不太公平。第一是因为系统没激活,有些优化设置无法生效。第二是因为主板用的intel默认设置,所有墙都没关,而139是最高性能设置。第三,139的风险经过微调,达到最佳散热效果,而285是默认(但这点影响不大,全程没超过65度过) 285这台新机io方面是完全碾压139的,内存运行在6000,而139则是4200。285碎文件盘是美光的pcie5,而139的是三星的pcie4(980pro)。所以理论上讲,不撞墙的前提下,正负差异可以看做抵消 说明一下测试项目。总共3个任务 任务一: 单线程单任务(进程)(截图里就一个核忙的那张) 任务二: 多任务高io压力(截图里内存占用60多g那张) 任务三: 多任务高计算压力(截图里一堆cpu忙碌还不怎么占内存那张) 现象: 测试中比较有趣的几个现象如下 第一,当139的排风已经热得能当暖气用的时候,285就没超过65度,风扇就没满转速过。不得不说这代的发热控制得是真好,龙神三也是真的给力 第二,980pro在任务二中最高占用率都接近90%了,美光却压根没超过5%(如果按比例计算的话应该在30-40),而两台机器共同的贼船pcie4在139上占用率几乎高于285上的20%。说明139上io遇到瓶颈,但285的各种总线都还很轻松,压力都积压在cpu上(7年来啊,头一次io够用的我热泪盈眶) 第三,我以为aida里cpu排序是先大核后小核,没想到是错开的 第四,由于我的程序绑了内核,因此任务一旦启动,是不会在调用sleep的时候被系统调度的,只有当其他大核执行完任务时,跑在小核上的任务才会重新绑定大核。但实际运行中,总有小核在莫名其妙的不知道忙些什么 第五,任务三在超过10任务并行时,速度甩139一条街,这代小核不是一般的能打,另外高并发时io和缓存优势极其明显,测试结论的产生是因为后半段大多数进程结束后,单进程进行深度迭代的时候被139的单核优势追上的 最后,最关键的成绩 任务一,139两分4秒,285两分10秒 任务二,139八分57,285九分19 任务三,139一小时十五分56,285一小时十七分30 结论, 单核285毫不意外的输了,这也是为什么游戏性能不行了。只不过从功耗和温度来看,285还有很大潜力。如果不是intel默认设置,谁赢还不好说。但是工作用的机器,稳定第一,拒绝缩肛。所以以后我最多也就是关个墙了。 任务二285居然没打过139,这真是让我大跌眼镜。虽然看到pcie5那个占用率就有预感,但是这也差距太大了吧?现在完全不知道瓶颈在哪,如果知道,优化下程序很容易就能逆转。直觉告诉我关键在于计算量和io请求数。如果大多数时间在排队,那肯定是单核性能高的139优势 任务三285完胜,基本上跑到一半就没有可比性了,这边3个进程算完了,139还一个都没完成呢。如果不是最后有个深度迭代的单线程任务执行了39分20秒的话,285的任务完成时间要早4分多钟 总体结论,这代u,计算能力和io都是实打实的大幅提升,特别是小核,逆了天了。但单核单任务时,默认设置倒吸明显,预期对等设置下285能打平或微胜,但如此作死透支的事我没兴趣,所以没有证据支持这个预期
感觉告别10900k的日子快到了 还记得当年摸个90多分的开心的感觉,看着稳定持续计算而功率发热都不高,那个满足 不过最近也快到极限了。自从把量化回测改成批量处理后,已经不得不关超线程了(io已经超负荷,增加同时运行的实例也只能让数据的吞吐更堵塞而已),基于ddr4的平台已经快要无法满足需求了。看着13代的大缓存和日渐成熟的ddr5内存,感觉换机的日子快到了。已经提前选好了机箱设计好了散热和供电方案,甚至于程序的集群同步优化也改好了,就等intel发力了。 前两天看到吧内有人讨论什么叫生产力。其实我觉得,一个处理器,你纠结它跑分,或者各项技术指标,对于你特定的工作环境特定应用用例是没有意义的。最能说明生产力的,是你的应用获得的实际提升。记得当年升级10900k的时候,原本30分钟完成的计算,变成14分钟完成;同时跑4个实例到极限,到同时跑15个到极限。原本180ms响应完的瞬间爆发的计算,能在30ms响应完……这种生产过程中实质性的提升,对我来说这才叫生产力。 现如今它已经稳定工作了这么久,创造出了巨大的经济收益,但是已经逼到了极限,有那么点伤感。希望下一个平台在稳定持续计算的前提下也能带来飞跃的提升和可以接受的发热量。期待13900k的到来 最后吐槽,intel啥时候能把家用平台的内存支持上到256g……之前迭代计算轻松干掉128g的空间的时候,改代码的成本远高于4条内存……
1 下一页