懒羊羊在吗?我问个问题,vec4的效率为何不如纯scalar
gpu吧
全部回复
仅看楼主
level 9
矢量标量区别关系在哪?vec4+scalar和什么纯scalar以及核弹的分离构架麻烦讲详细点吧[乖],核弹的gpu不也是scala嘛r?@pengzhenxx
2013年09月14日 10点09分 1
level 9
2013年09月14日 10点09分 2
level 14
mimd不就是每个shader有独立的指令发射端,vec4+scalar是5个一组共享一个指令发射端
2013年09月14日 11点09分 3
level 14
效率上mimd更高,但是vec4这种结构也很适合跑游戏,优化充分的情况下vec4性能碉堡。优化主要就是尽量少用条件跳转的函数
2013年09月14日 11点09分 4
MIMD貌似很浪费,我觉得还是4simd+1sisd比较靠谱,起码手机上是这么认为,至于跳转函数,cpu占用资源应该会有所增加吧[疑问]。I
2013年09月14日 17点09分
回复 魔术师LYX :vec4主要的问题是不能拆分,遇到1d,2d,3d的指令效率就低,遇到有跳转函数的指令效率更低,因为得整个vec4一起等待。不过桌面平台很早就实现了1d+3d,2d+2d这种组合。r300的时候就支持了,不知道移动gpu支不支持。mimd其实是更偏向通用计算
2013年09月14日 23点09分
level 14
这玩意当年在gcn和开普勒(simt)发布的首发测评应该有所普及
2013年09月14日 11点09分 5
没懂[狂汗]
2013年09月14日 17点09分
level 14
@参考诺基亚说明 所以我就不懂这里,效率应该是scalar高的,但是vec4处理起来很快。
   --我发的都是神论,大神请勿吐槽I
2013年09月14日 17点09分 7
R600的Shader是VLIW4D+1D,,实际是4个标量ALU+1个SFU,共享了一个指令发射端,VLIW4是6900的架构了,精简了SFU
2013年09月14日 17点09分
回复 pengzhenxx :核弹的是那种呢
2013年09月14日 17点09分
回复 参考诺基亚说明 :核弹??
2013年09月14日 18点09分
回复 pengzhenxx :Geforce ULP
2013年09月14日 18点09分
level 14
回复 魔术师LYX :手机上不做通用计算,要求面积更小,所以simd更加适合
2013年09月14日 23点09分 8
那现时的pc端,vliw4和vec4有什么区别?
2013年09月14日 23点09分
回复 魔术师LYX :不是一个概念,vliw好像是一种指令,vec是向量的意思,vec4就是4d向量处理器吧。最新的gcn和开普勒都是介于simd和mimd之间的构架,前者可以让vec4的指令全部打散运行,后者是所谓的simt,最大的特色就是可以运行跳转函数
2013年09月15日 02点09分
1