其实PS5的GPU反而可能更强
ps5吧
全部回复
仅看楼主
level 1
tonggongzi 楼主
弄到AMD RDNA2的结构示意图
为什么“23T”浮点的RX6900XT可以干翻高达“35T”浮点的RTX 3090(112rops)
简单来说明一下rops在显卡中的地位
6800xt的rops为 128个, 精简掉8个cu,为72cu, 4个单元中每单元精简点2个cu
或者说,PS5就是6800xt的一半
而6800 却不一样,将4个单元中的一个彻底屏蔽,也就是下图的模式,这也是其只有96rops的原因
蓝色的是128M 缓冲, 白色的是IF总线, 这些东西面积很大非常昂贵
主机目前是无缘的,不过下一代或者plus主机肯定会用上
2020年11月05日 12点11分 1
level 13
看表现吧,跟跟当初xboxone吹那个eSRAM一样,我信了,结果骗鬼呢。
2020年11月05日 12点11分 2
当年除了esram,xboxones纹理单元,浮点全部逊色ps4至少35%,rops光栅只有ps4的一半,异步计算单元ps4有8个,xboxone只有2个。此外xboxone是70gb/s不到的带宽的8gb的ddr3加32mb的esram。ps4是带宽180多GB/s的8gb gddr5。
2020年11月05日 12点11分
xboxone除了多边形生成率和cpu频率还有额外地提高处理速度的esram有优势,其他的是完败。
2020年11月05日 12点11分
你如果看过ps5跟xsx的纸面性能你就知道,这跟当时完全不是一回事。除了官宣的。 ps5可以确定是64rops(光要硬件兼容ps4pro这一点就肯定是64个),xsx官方数据可算出也是64rops。
2020年11月05日 12点11分
最新的爆料也说明,ps5的gpu缓存有更好的协调机制,i/o单元之前官方公开有额外的sram,显存的带宽压力会有效降低。
2020年11月05日 12点11分
level 10
关键xsx也是rdna2,你怎么算的
2020年11月05日 12点11分 4
level 1
tonggongzi 楼主
参考RDNA2的示意图,主机GPU如下,同为64rops,同样在完整版上精简4个cu
PS5的示意图
XSX的示意图
很明显可以看出一点, PS5的rops-cu比例更接近于发布的6800xt, 而XSX的比例有些头重脚轻。
6800xt 为每16rops 对比 9cu
ps5 为每16rop 对比 9cu
xsx 为每16rop 对比13cu
更重要的是,rops其实和几何引擎的规模等比,随着频率的提升,几何性能也等比提升。
也就是说ps5的几何性能反而要比xsx强20%+。
2020年11月05日 12点11分 5
说错 头轻脚重不是头重脚轻
2020年11月05日 12点11分
xsx的像素填充率算低了,官宣是118,xsx的gpu频率是1.825ghz,不是1.815ghz。
2020年11月05日 12点11分
@mdzz8895 ps4pro那个rops非常虚,本身芯片就很诡异,更像是在ps4基础上再粘了一个GPU,左边一半和右边一半的大小还不一样,用于屏蔽一半用来模拟兼容旧ps4的模式,当时的amd并不能在256bit的速度下做出64rops的产品。
2020年11月06日 08点11分
原来如此
2020年11月16日 23点11分
level 14

2020年11月05日 12点11分 6
level 9
等解禁一切真相大白等解禁一切真相大白,现在说这些用处不大,说对了没什么影响,你要是说错了到时候啪啪打脸
2020年11月05日 12点11分 7
[睡觉]基本没问题,DF这种吹硬件的都假装不知道rops的重要性? 真是丢脸。
2020年12月06日 11点12分
level 11
xsx很可能是专门给微软定制的rdna2芯片,不仅用在了xsx上,也用在了自家的云服务器上。
泄露的rdna2的显卡没有包括56cu或者52cu的。
40cu的一直泄露是有的。
或者这可能是amd未来的rdna2的apu方案。
2020年11月05日 12点11分 8
@tonggongzi 这不合理。
2020年11月05日 13点11分
微软就是在原来的40cu基础上增加了40%的cu模块变成56cu而已,几何引擎,rops这些都无法等比扩建。L2缓冲因为是绑定内存的,每64bit 1M这个固定而已。
2020年11月05日 13点11分
看不太懂,不过xsx的cu好像小点,ps5感觉大小与rdna2相当
2020年11月05日 13点11分
@tonggongzi 也就是传说xsx跑光追的时候,40个cu渲染,剩下16个专门跑光追计算是可能的?
2020年11月05日 15点11分
level 11
[汗]
2020年11月05日 12点11分 9
level 11
说到明就是安培浮点性能峰值≠游戏可用的的浮点性能[黑线]
2020年11月05日 13点11分 10
安培架构的特殊性,只有纯浮点计算的场景才有峰值浮点。不然压根达不到。尤其是混合cuda去算整数后,只有剩下的去算浮点
2020年11月05日 13点11分
[滑稽]的确如此,安培把可能三分之一或者四分之一的整数计算也加进去了的。但是安培3070就已经96rops, 3090还是只有112rops只多了一层皮,这也是严重的瓶颈。能估计得出这次NV旗舰打不过AMD的次旗舰->猛超频。
2020年11月05日 13点11分
@tonggongzi 不好说
2020年11月05日 13点11分
@tonggongzi 安培用int32模拟fp32性能,使用fp32的时候不能使用int32,打游戏int32占用也就50%,算下来,相比20系同流处理器只多调用25%的fp32,所以对应性能提升也是25%
2020年11月05日 15点11分
level 11
而且amd都不敢说干翻。到你这就是干翻
2020年11月05日 13点11分 11
[冷]的确没干翻,只是稍微强了那么一点点
2020年12月06日 11点12分
@tonggongzi 那么你拿到了?
2020年12月06日 11点12分
@tonggongzi 发个评测看看[捂嘴笑]
2020年12月06日 11点12分
level 11
还有同架构就是比堆料。料越多越强。还扯什么更强[汗]
2020年11月05日 13点11分 12
xsx没有等比堆关键的地方,如果xsx能做出80rops或者96rops,那么自然就全力压制ps5,但是它做不了。而同样64rops的ps5, 超频20%自然反而强了20%。 过去NV的80ti 阉割显卡轻松吊打泰坦旗舰, 后面NV学聪明了,就把rops切掉8个,这样80ti就打不过泰坦旗舰了,可知其重要性。
2020年11月05日 13点11分
@tonggongzi N卡是都砍。
2020年11月05日 13点11分
@tonggongzi Ps5比xsx频率差不多高40%
2020年11月05日 13点11分
@嘉丶樂 不砍rops的话次产品因为规模小更容易超频反而比旗舰猛。
2020年11月05日 13点11分
level 11
PS5有cache的,不过应该不是标准infinity cache,因为PS5主打高模型,估计缓冲作用还要做模型映射。PS5是64M的cache,XSX只有8M?
2020年11月05日 13点11分 13
除非ps5是6nm的, 否则这不太可能64M cache需要30亿晶体管, 做出来芯片比xsx的还大了。
2020年11月05日 13点11分
ps5的gpu没有额外的sram,额外的sram在apu的i/o单元。
2020年11月05日 13点11分
@tonggongzi 我认为PS5芯片面积330到350mm2,剩下的晶体管都是缓存
2020年11月05日 13点11分
b3d大神说是305
2020年11月05日 13点11分
level 8
66666[捂嘴笑][捂嘴笑][捂嘴笑]
2020年11月05日 13点11分 14
level 13
[疑问]
2020年11月05日 13点11分 15
level 13
你怎么知道PS5没有cache?
2020年11月05日 13点11分 16
就新爆料gpu是没有,gdc的官方结构图在i/o单元组有个额外的sram。
2020年11月05日 13点11分
@S77117◎ 有可能是特殊的cache,反正索尼还没正式公开架构图,有些东西会进入RDNA3
2020年11月05日 13点11分
1 2 3 尾页