level 6
哈哈哈哈🐼
楼主
搞科学计算的自然懂,MKL的负优化,***跟踪调试确认MKL在ZEN上使用SSE指令集!换成OpenBLAS快了两倍,但这不是ZEN的真实水平,OpenBLAS对ZEN的所谓优化只是检测下各级cache大小,内部循环体来自haswell的汇编代码,也就是根本没有针对ZEN架构优化。目前单核心下近似同频下ZEN只有i5 7500的0.6倍矩阵乘法性能,矩阵规模变大后更糟。
ACML已被AMD废弃,AMD推荐的GPUOPEN->ArrayFire里居然是MKL核心。。。
所以,有更好的方案么?![[阴险]](/static/emoticons/u9634u9669.png)
另外说个事,只要内部调用MKL的软件,比如MATLAB,全军覆没。
2018年01月25日 09点01分
1
ACML已被AMD废弃,AMD推荐的GPUOPEN->ArrayFire里居然是MKL核心。。。
所以,有更好的方案么?
另外说个事,只要内部调用MKL的软件,比如MATLAB,全军覆没。
