手机的GPU跑分是和PC一样跑的单精度么?
gpu吧
全部回复
仅看楼主
level 8
指尖小包子
楼主
目前各家手机GPU的跑分是FP16半精度跑分还是FP32单精度跑分?
2019年06月25日 09点06分
1
level 8
指尖小包子
楼主
@璐村惂鐢ㄦ埛_00075tS馃惥
2019年06月25日 10点06分
2
level 13
独行_追梦
安卓上 都有 但大多数都是半精度 单精度的占比很小
水果 原生从编码上 应该只有半精度
2019年06月25日 14点06分
3
独行_追梦
@指尖小包子
上面写得很清楚了 水果从A8后应该是只有半精度了 不错?画面还不是阉得和狗一样 IOS生化奇兵和PC完全不是一档的。。。没办法 FP16做不出什么好的效果 就只能指望花钱做美工
2019年06月26日 02点06分
斜风细雨💫
@mcayke
“a8以后支持<使用>半精度,之前的不支持”这句话是我对ppt上那句的理解。看PowerVR的系列G6X30,也就是A7,上面FP16/FP32是1.5:1,而之前的都是1:1,可以说不支持FP16。A7到底支不支持,我不确定,至少它在比之后的GT7600系列要差,我认为是过渡的一代,可以用,但是能效不好
2019年07月02日 03点07分
指尖小包子
也就是说移动GPU跑半精度跑分但是不说自己是半精度?
2019年06月26日 00点06分
公子慕白♂
@指尖小包子
是啊
2019年06月26日 02点06分
level 12
zhu3536
用snapdragon profiler测了下540。gfxbench alu2利用fragment shader进行运算,有fp32和fp16指令,比例接近2:3,alu利用率80%,alu工作时间百分比94%。adreno的fp32和fp16是分开的,而且可以同时工作,但同时工作的效率不高。540的alu2数据,80G fp32指令每秒,130G fp16指令每秒。而跑vec4 fp32 madd 167G fp32指令每秒,330.9gflops浮点,跑vec4 fp16 madd 356G fp16指令每秒,675.5gflops浮点。
manhattan3.0和t-rex的读写总带宽在12GB/s左右,两者都有fp32和fp16指令。t-rex的fp16指令最多,占85%左右;manhattan3.0的fp32指令多一些,是fp16的2倍左右,不过有点不太稳定,有时候fp16指令数突然比fp32指令多好多。
以上说的有fp16指令的都是指fragment shader,vertex shader只用fp32不用fp16。
texturing 的读总带宽在8-9GB/s,写总带宽4GB/s头,总共12-13GB/s。linear filtered过滤92%,没分双线性和三线性,最近点采样1.7%,各向异性过滤0。
记得twy_2000测的980总带宽不超过9GB/s,比adreno5系需求的带宽少多了。
2019年07月29日 08点07分
4
zhu3536
@mcayke
960的l2是512KB,960的开发文档里写的。其他mali gpu的l2不知道。
2019年07月29日 11点07分
mcayke
@zhu3536
960是老一代的。同核心g76比g71多了一倍的alu,l2也增大了。
2019年07月29日 11点07分
level 7
香菇滑鸡咖喱饭
那么switch的浮点呢?
2020年04月09日 11点04分
6
1