x265 3.0版本即将发布,300余项AVX-512优化
dwing吧
全部回复
仅看楼主
level 7
前几天发现x265,突然一声不响的把AVX512针对性优化放出来了,一共三百余项优化,涵盖从去年6月份开始的近一年的改进。结果今天居然准备大版本直接跃进到3.0了。发现之前官方出了一篇报告,称xeon scalable上,4K HDR下,"最大"能提升18%的性能。相比前一代(xeon E5 V4)"最大"提升56%。
整篇白皮书读下来,感觉avx512优化真心难。。。白皮书里面对比的应该是同频,而实际avx-512受频率低,TDP限制等,反而可能并没有明显的提升。(比如8180的全核心睿频,avx2最高2.8g,avx-512最高2.3g)。注意到这所谓18%,只是"特定"预设下,"特定"4核心,"特定"同频2.5g低频对比的结果,随着4->8->10,幅度越来越不明显(这里的7900x十核是1.2Ghz下的。。。),甚至还不如avx2。如果实际环境下,频率正常,随着核心数增加,内存带宽的局限会非常明显(6通道下,8核已经区别不大了),我认为几乎不会有任何可观提升。
当年我曾经众测过x265-1.8在不同架构下,有无avx2的表现。“同频”+“同样”4核心下,4代haswell架构相对3代ivybridge架构,性能提升47%;6代skylake架构相对3代ivybridge架构,性能提升73%。希望以后x265和intel能共同努力,提升avx-512在实际应用中的表现吧,虽然这个愿望可能非常渺茫。
2018年04月13日 06点04分 1
level 7
贴一下相关的报告和白皮书吧
2018年04月13日 06点04分 2
level 7
支持avx512的xeon系列的多核cpu,请尽量不要直接开启avx-512,实际性能可能会下降,还请以实际测试结果为标准。
2018年04月13日 06点04分 4
最近测试发现用avx512 的速度和avx2相当,但功耗降20w,温度降10度。可以看我的帖子。
2019年01月05日 03点01分
@埋寇爵神 你是7820x应该不会有明显下降,xeon不一样
2019年01月05日 05点01分
level 3
[阴险]看到未来
2018年04月13日 09点04分 5
level 10
今天看到也是惊了一下
2018年04月13日 10点04分 6
level 13
看来核心多也没那么好呀[滑稽]
2018年04月14日 02点04分 8
然而实际表现,几乎能和核心数和频率成正比。指令集反而可能有负加成[真棒]
2018年04月14日 05点04分
@空之飞翔之春哥 为什么会变成这样呢……第一次有了这么多核心,又有了最新的avx指令集。两件快乐事情重合在一起。但是,为什么,会变成这样呢[乖]
2018年04月14日 07点04分
@焰佐 因为1+1<2
2018年04月15日 02点04分
@i990049 如果按照avx2理论最多能提升35%来算,avx512的极限应该是20%
2018年04月15日 09点04分
level 14
avx512 是从几代U开始支持啊。
2018年04月15日 03点04分 9
xeon scalable sp和skylake的志强系列
2018年04月15日 09点04分
level 13
又需要学习了……
2018年04月15日 11点04分 10
level 13
今天已经到2.7
+3
40了……
2018年04月15日 11点04分 11
level 7
用avx512会降频?那还做这个优化干嘛
2018年04月16日 00点04分 14
level 15
据传9700K 8核16线程 支持AVX512,不知道什么表现.
2018年04月17日 04点04分 15
level 7
周末试下。。。开盖7980xe试了下能3.9跑AVX512,或许有惊喜
2018年04月18日 06点04分 16
据说这次提升的10%是能耗比,doom9上说的是avx512功耗还低一些。提升应该还是有的,毕竟7980x要跑4.4g的avx2应该更难吧
2018年04月18日 14点04分
4.4全核难,4.3左右功耗都很大了
2018年04月18日 15点04分
回复 不科学A文💤 :18核这个规模,同频下还会有提升么
2018年04月21日 22点04分
回复 空之飞翔之春哥 :用cb15看的话,单核4.5能197,多核全4.2能4060左右。但跑265散热压不住,我估计实际能用应该是多核3600水平
2018年04月22日 02点04分
1 2 尾页