今天炮神更新了gpugflops1.50,测了下。
@还是那个小新💯荣耀play vec4乘加运算 fp32 277gflops,fp16 412gflops,scalar乘加运算 fp32 239gflops,fp16 229gflops
mate20x vec4乘加运算 fp32 432gflops,fp16 642gflops,scalar乘加运算 fp32 372gflops,fp16 372gflops
米6 vec4乘加运算 fp32 331gflops,fp16 678gflops,scalar乘加运算 fp32 322gflops,fp16 598gflops
8890版s7 vec4乘加运算 fp32 180gflops,fp16 180gflops,scalar乘加运算 fp32 50gflps,fp16 50gflops
adreno的浮点高,scalar和fp16效率极高。bifrost的scalar fp16不能翻倍,scalar的效率也比adreno低,vec4 fp16也没翻倍,1.49倍。至于midgard,本来跑gpugflops只有vec4+scalar+7点积中的vec4起作用,fp16全部不能翻倍,scalar效率也非常低。