Blackwell 微架构变化
高通吧
全部回复
仅看楼主
吧务
level 13
Piglin 楼主
现在所有单元都是 FP32/INT32 了
2025年01月15日 16点01分 1
吧务
level 13
Piglin 楼主
架构介绍开头就说摩尔定律已死,暗示这次提升不大
2025年01月15日 17点01分 2
4nm还没到FinFET极限[汗],后面还有nanosheet
2025年01月16日 02点01分
有点汝
2025年01月15日 18点01分
吧务
level 13
Piglin 楼主
设计目标是神经网络、节省显存和提高能效
2025年01月15日 17点01分 3
吧务
level 13
Piglin 楼主
解码器性能提升
2025年01月15日 17点01分 4
一般,速度提升60%,基本上是规格增加50%的结果
2025年01月15日 17点01分
5090是三个解码器?我记得之前pr连两个解码器同时运行的不支持。
2025年01月16日 04点01分
有个冷知识,4080解码器性能约等于intel核显[笑眼] [笑眼] [笑眼]只能说老黄还是会刀的
2025年01月16日 09点01分
@张伯伦-今天挥厕纸吗 但是这图是编码器,4080编码器秒飞核显不成问题
2025年01月16日 12点01分
吧务
level 13
Piglin 楼主
大部分渲染性能提升40%——不多的样子,Apple追起来不难了
2025年01月15日 17点01分 6
这么看blender benchmark估计15000,Apple追起来确实不难了,不过这也是少数水果GPU擅长的东西
2025年01月15日 18点01分
D5渲染器2.3倍的提升是DLSS4插帧而来
2025年01月15日 19点01分
@NPacific 2333
2025年01月15日 19点01分
@NPacific n卡规模大多了
2025年01月16日 10点01分
level 14
alu看起来又回归以前那种cuda core了?
2025年01月15日 18点01分 7
对,一通操作,最后又回归了Fermi-Pascal时代。其实Amepere/Ada的思路我认为没错,早改进也应该是再加一组FP32。。。可能真是一切为了AI妥协了
2025年01月16日 01点01分
@独行_追梦 明显不一样
2025年01月16日 02点01分
@summa3333 就是一样的,不过是现在多塞了一组,外加塞了RT和Tensor,CUDA单元没有变化,回归最初了
2025年01月16日 03点01分
@独行_追梦 原先int float分开的,现在合一起了
2025年01月16日 11点01分
level 14
rt core吞吐翻倍达到每周期16box+8tri,同时支持cluster triangle(土话rt nanite),还支持了硬件curve加速可以更好的实现grass/hair等几何。无敌了nv[笑眼]
2025年01月15日 18点01分 8
level 14
neural shader还是蛮骚的,现在shading越来越复杂,非常不利于gpu的simt架构。通过ai实现brdf直接将复杂效果转换为单一的巨量矩阵运算,特别适合simt/tensor处理,这样一来就只有采样贴图这类的memory/cache压力了。
2025年01月15日 18点01分 9
[真棒][真棒]
2025年01月15日 19点01分
吧务
level 13
Piglin 楼主
GB203和GB205 的晶体管有缩减
2025年01月15日 19点01分 10
[喷][喷][喷]
2025年01月15日 23点01分
降价是有原因的[滑稽],Nvidia赚的钱一点没少
2025年01月16日 00点01分
GB205,比Outel的B770还要小。售价差距是真的离谱
2025年01月16日 01点01分
level 9
5080比4080无帧生成只提升了15%,光栅化是没有活路了,传统渲染也要靠ai吃饭,性能提升不大,新增特性不少
2025年01月16日 01点01分 11
level 12
这一代没什么看头了,等未来换了n3工艺和封装工艺吧
2025年01月16日 02点01分 12
吧务
level 13
Piglin 楼主
游戏性能提升:5090提升30%,5080提升15%,5070Ti提升20%,5070提升20%
2025年01月16日 02点01分 13
渲染提升在20%-40%
2025年01月16日 02点01分
没对比上代super系吗?估计对上上代super这提升就很难看了[呵呵]5080以下的提升我不好说,10%?
2025年01月16日 04点01分
level 9
3060ti估计等6060换了[吐舌]
2025年01月16日 03点01分 14
level 14
有没有提到每GPC的ROP数量变化? 柯基之前准确爆料了GB202的SM数量和位宽 (频率翻车了),但同帖子里暗示的每GPC翻倍ROP数量至今没有任何可验证的消息... (也许是我理解错暗示了?)
2025年01月16日 12点01分 15
不可能提高的,rop很占面积,203面积仅和103相当
2025年01月16日 12点01分
level 14
ALU这么改效率也没比ADA高多少,真是到瓶颈了。
2025年01月16日 16点01分 16
1 2 尾页