求ZEN(AMD)下MKL的替代方案
amd吧
全部回复
仅看楼主
level 6
搞科学计算的自然懂,MKL的负优化,***跟踪调试确认MKL在ZEN上使用SSE指令集!换成OpenBLAS快了两倍,但这不是ZEN的真实水平,OpenBLAS对ZEN的所谓优化只是检测下各级cache大小,内部循环体来自haswell的汇编代码,也就是根本没有针对ZEN架构优化。目前单核心下近似同频下ZEN只有i5 7500的0.6倍矩阵乘法性能,矩阵规模变大后更糟。
ACML已被AMD废弃,AMD推荐的GPUOPEN->ArrayFire里居然是MKL核心。。。
所以,有更好的方案么?[阴险]
另外说个事,只要内部调用MKL的软件,比如MATLAB,全军覆没。
2018年01月25日 09点01分 1
level 9
mark 我说锐龙怎么么还没我的笔记本4700mq快[滑稽]
2018年01月25日 10点01分 2
目前MKL是优化最好的库,AMD上找不到替代方案,相当于能力直接被封印了。我试着反汇编了MKL的矩阵乘法代码,虽然还没理清楚但根据部分代码看,MKL里循环展开的丧心病狂
2018年01月25日 11点01分
level 6
听说贴吧里人才多,有大佬指点下么
2018年01月25日 13点01分 3
level 9
MKL 是 Intel 商用库吧,AMD上负优化好不正常么,AMD 在这方面是准备放到 GPU 上吧,我记得AMD有一个基于OpenCL 的 clBLAS 的东西
2018年01月27日 09点01分 4
看来我不该用负优化这个词,intel的MKL包含同一个函数的不同版本,intel故意在非自家处理器上调用较慢的函数,而不是不做优化!游戏GPU的双精度小矩阵渣成狗
2018年01月27日 09点01分
@病丹青 以前想过折腾FPGA,但我们这个方向不是工科出身的,更别谈硬件实现了。。。OpenBLAS目前是唯一可行的选择,可惜优化还不够,mingw下编译出来的使用时会有很多问题,这几天都被折腾疯了。
2018年01月27日 10点01分
@哈哈哈哈🐼 跟自家iCC一个套路,调用较慢函数也是负面优化了吧,不过 iCC 编译的东西有破解补丁,具体有什么问题就不知道了,没试过也试不了[滑稽]
2018年01月27日 10点01分
@MeteoraEsutar 可能大家对负优化理解不一样吧[黑线]我理解的是无意举动或消极反应导致的,比如想着这样写程序会跑的更快实际更慢了,这种事情经常发生。intel是有意为之,具体有大佬分析过。这样导致所有依赖MKL的软件在AMD处理器上表现不佳,大多数人会以为是AMD的锅,其实是intel的银谋
2018年01月27日 13点01分
level 8
Highlights of AMD BLIS 1.3
用这个吧
2019年02月11日 16点02分 5
额,看了下BLIS确实有自己的特色,但BLIS的函数接口与标准BLAS不一样?而且我现在发现最要命的不是BLAS层而是LAPACK。。。非MKL的LAPACK多是用的netlib实现,性能与MKL的差距远大于BLAS的差距。不过BLAS函数也足够覆盖很多应用了~~~
2019年02月12日 04点02分
level 9
请问大佬最后怎么解决的?用matlab算个逆矩阵发现用的时间AMD是intel的三倍左右,很**
2019年03月20日 10点03分 6
暂时无解,换intel八代或九代CPU解决所有问题。
2019年03月20日 14点03分
level 4
老哥,我mkl都调用不了,应该怎么弄呀
2019年10月14日 04点10分 8
level 1
mkl用不了,我这初学者就碰到坑了
2019年10月26日 16点10分 9
level 6
有A家的新库了https://develo[吐舌]per.amd.co[吐舌]m/amd-aocl/
2020年07月20日 06点07分 11
这个不是Windows下的吧
2020年07月29日 07点07分
level 1
现在的amd还会有这种问题吗
2025年01月19日 05点01分 12
1