level 1
数码爱好者✨
楼主
512 FP32 ALU是A630的规格在极客圈里传了也不知多久了,我之前也发过详细数据的帖子https://tieba.baidu.com/p/5838748778 ,这次A640大家也相应的说是768 FP32 ALU,看了一些测试后我也认为是的https://tieba.baidu.com/p/6013948361 ,可实际测下来发现烤机ALU利用率并不是81.6%这个值偏低,zhu神告诉我用SnapdragonProfilerSetup测过高通GPU的ALU利用率通常91%~93%,另外也还有GPU吧吧主的详细测试https://tieba.baidu.com/p/5499887524
那么594GFlops到底是多少规格在710MHz下跑的,这个算了很多发现结果很奇怪,高通GPU的FP32烤机我大部分都是以91.75%的利用率来推算,594÷2÷0.71÷0.9175≈455.9,数值是很奇怪吧,456 FP32 ALU?没错,不出意外就是了,刚好又是4的倍数,A640多了50%应该就是684 FP32ALU,684×0.585×2×0.9175≈734.25刚好也是855烤机Vec4 MAD FP32模式的浮点,同时也刚好是4的倍数。
至于FP16 ALU的个数(Adreno的FP32和FP16是分开的,和大多数PC显卡类似),还未推算出符合官方PPT宣传50% ALU数值,因为现在A640算出FP16 ALU的数量是大于A630的1.5倍的,A630烤机Vec4 MAD FP16模式测出688.5GFlops,按照FP16的利用率93%~95%算大概是512 FP16 ALU,A640测出的FP16是887GFlops,之前的5系测了很多发现FP32和FP16 ALU数比值都是1:2,还不清楚6系的FP32:FP16的关系。









2019年02月04日 10点02分
1
那么594GFlops到底是多少规格在710MHz下跑的,这个算了很多发现结果很奇怪,高通GPU的FP32烤机我大部分都是以91.75%的利用率来推算,594÷2÷0.71÷0.9175≈455.9,数值是很奇怪吧,456 FP32 ALU?没错,不出意外就是了,刚好又是4的倍数,A640多了50%应该就是684 FP32ALU,684×0.585×2×0.9175≈734.25刚好也是855烤机Vec4 MAD FP32模式的浮点,同时也刚好是4的倍数。
至于FP16 ALU的个数(Adreno的FP32和FP16是分开的,和大多数PC显卡类似),还未推算出符合官方PPT宣传50% ALU数值,因为现在A640算出FP16 ALU的数量是大于A630的1.5倍的,A630烤机Vec4 MAD FP16模式测出688.5GFlops,按照FP16的利用率93%~95%算大概是512 FP16 ALU,A640测出的FP16是887GFlops,之前的5系测了很多发现FP32和FP16 ALU数比值都是1:2,还不清楚6系的FP32:FP16的关系。











