level 12
TX1的shader规模只比TK1增加了1/3,和A8x的GPU规模相同,频率和TK1基本差不多,而性能基本上涨了一倍,连3D mark也增加了差不多2/3的性能。
难道说这一代架构确有很大提升,还是因为LPDDR4 1600高频缓存带来的福利。
2015年01月05日 10点01分
1
level 12
说得再好,没有手机厂商愿意采用也是白搭。还是想想怎么保住目前平板上的份额吧……
2015年01月06日 00点01分
5
level 7
一个是效率 一个是功耗
maxwell对比kepler都有很大进步;
上一代的k1在mipad上,独占游戏2小时半没电
这代x1,同样电池容量的话,续航可能会延长不少;
按发布会的PPT来看,其实x1的gpu部分控制在3w以下是效率功耗最优的,
后期拉频率性能的时候,性能上升幅度并不大;
要是可以上手机就好了,256规模的maxwell确实很强;目前无敌;
———— 村村村村我爱你,就像老鼠爱大米;萌萌哒
2015年01月06日 05点01分
8
level 12
老黄黑科技,性能提升巨大主要来源去麦克斯韦超高的能耗比,
2015年01月09日 17点01分
9
level 12
主要是架构上的,,256sp其实是2个渲染簇【smm】,而192sp的开普勒只有一个渲染簇【smx】,smx和smm都有4个warp和8个指令分派单元,而warp的宽度是32,4warp=128threads,而每个smm刚好128sp,说人话就是smm的流处理器效率比smx高得多,smx虽然多了64sp但会经常空闲,,,所以x1的2个smm有8个warp,16个指令分派单元,而k1只有4warp,8个指令分派单元,,理论上显存带宽都不成瓶颈,同频率时,x1的gpu应该是k1的接近一倍的提升才对
2015年01月10日 10点01分
10
level 12
老黄其实一直都在玩儿warp和流处理器的比例【表面上看】,从G80到目前的maxwell一直都是如此,G80时代一个sm只有8sp,所以8个sp要用4周期完成warp,那时候的流处理器都是2倍以上于核心频率,因为流处理器严重瓶颈了,即使上2.5倍于核心频率,还是会瓶颈,所以那时候的流处理器效率都还很高的,
.
9600GT,9800GT这些经典老卡,虽然流处理器很少,但192sp的GT630和96sp的gt630都不是9600GT 64sp的对手,其实这仨看起来每周斯都只能处理4条warp,gt630频率高很多,但填充率又不如9600GT,总体说来9600GT还是稍微占优,但也拉不开差距
.
其实后来的费米架构都还有异步的流处理器频率都是因为流处理器瓶颈了,需要提高,这时的流处理器效率都还蛮好的,
.
直到开普勒架构,流处理器暴增后,不在瓶颈,所以取消异步shader频率,但前端的控制单元又瓶颈了,maxwell架构看起来是warp和流处理器刚好成1:1的关系,所以效率提升了不少,也不需要异步shader频率
2015年01月10日 10点01分
11
level 12
桌面上的maxwell更是如此,表面上看Maxwell好像不吃带宽,其实核心的渲染簇规模有很大提升,弥补了显存带宽小的缺陷
。
我们看看GTX980,有16个SMM,而完整的开普勒不过15个SMX,,所以980比完整开普勒多了4个warp,每周期也可能要多处理4个warp(GT630可以看做每周期处理4warp),加上980跑高频率,所以50+亿晶体管各项参数落后于完整开普勒,却有如此水平并不足为奇,这是顺理成章的,,,
。
NVIDIA要出的GTX960如果用128bit位宽,也不要惊奇和怀疑,目前的GTX750ti已经是5个SMM了,GTX970是13个SMM,(PS:中间14,15SMM规格可能是GTX970ti,要出的话),个人推测GTX960极有可能是9个或10个SMM的规格,也就是1152sp或1280sp,看起来和HD7870,R9 270x参数很像
2015年01月10日 11点01分
12