懒羊羊在吗?我问个问题,vec4的效率为何不如纯scalar
gpu吧
全部回复
仅看楼主
level 9
参考诺基亚说明
楼主
矢量标量区别关系在哪?vec4+scalar和什么纯scalar以及核弹的分离构架麻烦讲详细点吧
,核弹的gpu不也是scala嘛r?@pengzhenxx
2013年09月14日 10点09分
1
level 9
参考诺基亚说明
楼主
@pengzhenxx
2013年09月14日 10点09分
2
level 14
同济翔
mimd不就是每个shader有独立的指令发射端,vec4+scalar是5个一组共享一个指令发射端
2013年09月14日 11点09分
3
level 14
同济翔
效率上mimd更高,但是vec4这种结构也很适合跑游戏,优化充分的情况下vec4性能碉堡。优化主要就是尽量少用条件跳转的函数
2013年09月14日 11点09分
4
贴吧用户_0MND5RW
MIMD貌似很浪费,我觉得还是4simd+1sisd比较靠谱,起码手机上是这么认为,至于跳转函数,cpu占用资源应该会有所增加吧
。I
2013年09月14日 17点09分
同济翔
回复 魔术师LYX :vec4主要的问题是不能拆分,遇到1d,2d,3d的指令效率就低,遇到有跳转函数的指令效率更低,因为得整个vec4一起等待。不过桌面平台很早就实现了1d+3d,2d+2d这种组合。r300的时候就支持了,不知道移动gpu支不支持。mimd其实是更偏向通用计算
2013年09月14日 23点09分
level 14
同济翔
这玩意当年在gcn和开普勒(simt)发布的首发测评应该有所普及
2013年09月14日 11点09分
5
参考诺基亚说明
没懂
2013年09月14日 17点09分
level 14
贴吧用户_0MND5RW
@参考诺基亚说明
所以我就不懂这里,效率应该是scalar高的,但是vec4处理起来很快。
--我发的都是神论,大神请勿吐槽I
2013年09月14日 17点09分
7
pengzhenxx
R600的Shader是VLIW4D+1D,,实际是4个标量ALU+1个SFU,共享了一个指令发射端,VLIW4是6900的架构了,精简了SFU
2013年09月14日 17点09分
参考诺基亚说明
回复 pengzhenxx :核弹的是那种呢
2013年09月14日 17点09分
pengzhenxx
回复 参考诺基亚说明 :核弹??
2013年09月14日 18点09分
参考诺基亚说明
回复 pengzhenxx :Geforce ULP
2013年09月14日 18点09分
level 14
同济翔
回复 魔术师LYX :手机上不做通用计算,要求面积更小,所以simd更加适合
2013年09月14日 23点09分
8
贴吧用户_0MND5RW
那现时的pc端,vliw4和vec4有什么区别?
2013年09月14日 23点09分
同济翔
回复 魔术师LYX :不是一个概念,vliw好像是一种指令,vec是向量的意思,vec4就是4d向量处理器吧。最新的gcn和开普勒都是介于simd和mimd之间的构架,前者可以让vec4的指令全部打散运行,后者是所谓的simt,最大的特色就是可以运行跳转函数
2013年09月15日 02点09分
1