谈谈shader的效率问题,以及新一代移动GPU所谓的scalar shader
高通吧
全部回复
仅看楼主
level 15
ioncannon 楼主
前期知识请翻精华区
本次探讨的问题:为什么Adreno 305的单元比Adreno 225少,但表现却不比225差太多
唉,本来想写长点的 不过一些东西自己都还不太清楚
大概是这样:
大部分移动GPU的ALU都是vec4的SIMD,有些再带上个scalar单元
比如PowerVR SGX5XT的USSE2, 就是vec4
Adreno系列呢,跟AMD的R600系列差不多,VLIW的,但是不同于桌面的R600,Adreno 2xx的VLIW是把一个vec4的指令和一个scalar的指令打包起来,变成一个96bit的指令
相当于还是vec4+1
而桌面的R600,是VLIW5,可以把任意的指令打包起来,比如5个scalar (1+1+1+1+1)
或者2+1+1, 2+1+2等, 所以明显效率要高的(当然比NV的纯标量和后来的GCN要差)
Adreno 3xx,改成scalar shader,就变成类似于R600的,不再是限制死的vec4+1,可以像R600那样把scalar打包起来去跑,效率自然就高了
同样,新出的PowerVR 6, 也会是scalar的shader架构
而Mali-T6xx,实测下来,也跟Adreno 320的表现类似
当然,T6xx把Load/Store, 纹理拾取 和 ALU计算管线分开,每个都有独立的指令发射端
而传统的VLIW(Adreno)这些指令的发射是共享的,所以足够多的线程跑在核心上时,T6xx的计算、纹理拾取就可以同时执行,而传统的VLIW就不行了
从这个角度讲,相同GFLOPS下效率最高的应该是T6xx。不过这个没啥意义,最重要的还是面积和功耗吧。
T2/T3老掉牙的就不讨论了,T4的白皮书写的是VLIW,也可以把各种指令打包组合,但不知道具体情况
以上说的都是纯FP32 shader指令
如果是FP16的话,Adreno 3xx, Mali-T6xx这些能力还能翻倍的。
2013年06月28日 16点06分 1
level 10
技术!
目前手机上在用的SOC上面估计就高通的GPU最强了
2013年06月28日 16点06分 2
level 12
为什么gpu没有想cpu一样有个统一标准arm 这样一来事情不是少很多?
2013年06月28日 16点06分 4
你见过pc的cpu它们amd 英伟达 英特尔统一过显卡构架吗?
2013年06月28日 22点06分
arm也不是统一标准,只是占有率高。而且垄断不是件好事
2013年07月02日 13点07分
回复 chasemoon6 :PC上有DX11
2013年07月02日 15点07分
level 13
先回再看[真棒]
2013年06月28日 17点06分 5
level 13
原来说了半天的新架构新在这里啊。。。
技术!我和我的小伙伴都惊呆了。。
2013年06月28日 17点06分 6
level 12
炮神来说说604和320实际游戏表现现在什么差距,604现在都没什么人提起
2013年06月28日 21点06分 7
功耗感人体积感人[滑稽]
2013年06月28日 22点06分
320和604有得比吗?[怒][怒][怒]
2013年06月29日 02点06分
虽然说高通现在在努力涂神油
2013年06月29日 02点06分
回复 魔术师LYX :我怎么觉得604很翔,在320没有神油的时候就差不多了
2013年06月29日 02点06分
level 11
挽,
-----褪尽浮华,钢显本色 来自Nokia 6300 天生自信
2013年06月29日 01点06分 8
level 13
移动架构比桌面还是要落后一些
2013年06月29日 02点06分 10
有限制:做成CUDA,GCN这种纯标量理论上可以达到很高的shader alu效率,但实际上需要有大量的寄存器资源配合(包括带宽等)。移动上目前还难以做到,所以没有用这么先进的。。
2013年06月29日 02点06分
回复 ioncannon :带宽只能靠wide io了。另外估计还有功耗吧,gcn最低32shader还好一些,Kepler是192...
2013年06月29日 02点06分
@ioncannon 老黄的核弹手机开普勒呢?
2013年06月29日 04点06分
回复 jerrylzy :果然还是yy下gcn靠谱[滑稽]
2013年07月01日 16点07分
level 10
[阴险]跪舔,继续受教
2013年06月29日 02点06分 11
level 10
[泪]文盲路过
2013年06月29日 02点06分 12
+1,,,,,
2013年07月02日 15点07分
level 13
哈哈哈,坐看i粉自称文盲……
2013年06月29日 02点06分 13
level 5
移动架构比桌面还是要落后一些
2013年06月29日 03点06分 18
level 9
a320功耗怎么样
2013年06月29日 05点06分 19
level 13
面积感人就不去了,发热会很严重吗?
2013年06月29日 13点06分 20
面积感人不说了。。。
2013年06月29日 13点06分
level 11
没看懂。。。。
---对于今年的一本分数线,我只能说:"自其不变者而观之,则物与我皆无尽也"…
2013年07月01日 03点07分 22
level 11
能给个前期知识的链接不啊………
---对于今年的一本分数线,我只能说:"自其不变者而观之,则物与我皆无尽也"…
2013年07月01日 03点07分 23
level 15
r600是4+1吧
2013年07月01日 04点07分 24
1 2 尾页