level 10
其实nvidia一直都在调整这个比例,从g80开始,一个sm有8个流处理器,异步运算,等效16个流处理器的运算能力以上,此时其实是流处理器有瓶颈,1个warp有32threads很明显流处理器无法在一个周期没完成,此时的流处理器效率是很高的,所以96sp的gt630无法完胜9600gt个人认为也有这个原因
到fermi架构,又分为gf100和104,gf100的sm采用双warp,老黄称为dual issue 双发射,流处理器扩充到32个,由于异步频率,等效64个流处理器,双warp刚好可以被32个异步的流处理器在一个周期内处理,此架构感觉就是maxwell的前身,smm看起来不过是4发射的gf100/110而已,然后取消异步频率,功耗大降
至于kepler和gf104/114神似,其实老黄一直都在调整架构,maxwell的这种结果,俺并没感到意外
好啊,说多了,个人观点,仅供参考

