level 13
还是那个小新💯
楼主

根据高通的opencl内核模型,以自己所理解的画的部分架构图示Adreno系列似乎从3xx开始就一直是分成4 x Compute unit,官方社区博客直接就叫compute unit了:For example, the Adreno 530 in the Snapdragon™ 820 processor has four compute units, each with its own 32KB of local memory.难怪高通一直不宣传gpu的“核“数。
整体感觉有点类似于amd的vliw,4个alu为一组,fp32操作都是用的矢量float4类型,和vliw如出一辙。一组cu运行一组或多组workgroup,不过不理解为什么不管多少alu都设置成4组cu。















