tonggongzi tonggongzi
关注数: 29 粉丝数: 758 发帖数: 26,245 关注贴吧数: 7
很多吧友完全被误导的两个东西 ------其一 4k分辨率画质就会变好 PS5 根本目标是在次世代游戏下普及2k纹理,这个官宣过,这其实是最朴素直白的“程序技术”说明。 目前很多3A游戏也不过0.5k纹理, 这个0.5k 是指 游戏中的1m距离有500个像素点,和屏幕分辨率无关。 也就是说这0.5k纹理,榨干了目前主机的8G显存。 那么2k贴图,需要多少显存呢, 数学不是体育老师脚的都能算 =》 8G x 4 x 4 = 128G 显存。 直接翻16倍消耗这可是个大工程 主机只有16G,如何达成这个目标, 基本就是下面两个方案加一起 1,虚拟纹理技术, 降低一半以上显存消耗, 人通常只会看到3D模型的一半,这样实际就只需要64G显存。 2,SSD IO 直连, 将48G作为“虚拟显存" 保留到SSD中, 加上真实显存16G, 一共64G, 2k纹理目标达成。 虚幻5的8k纹理其实是在大幅缩水场景规模,并且大量重复利用资源的情况下才实现的,当个噱头和展望。 NBA和FIFA会更新次世代首发游戏到1k纹理, 估计过一两年后会升级为2k。 ------其二 巨硬才是RDNA2的开发商, PS5不支持这功能不支持那功能。 完全说反, 次世代GPU完全是AMD和索尼在死撑,主要威胁还是移动市场的压力而已。 巨硬就不是做硬件的企业, 它是没有任何”硬件技术“的, 但是它照样能拿到和PS5一模一样的GPU。 巨硬是做接口标准的,接口是啥,说简单点就是"取名字",拥有”命名权“,它不需要任何技术,别人就会把最新的技术送給它, 别人的技术要得到应用,就得等巨硬給这个技术“取名字”,除非AMD不想上windows啦。
RDNA2 7000系列显卡 芯片规模 缓冲 性能 推测 传闻中RDNA2做了3颗芯片, 按mac最近驱动曝光分别是, 整理如下 navi21 面积505mm 5120sp 256bit 128M L2 2.2G 22.5TF(参考2080ti平均16.5TF) navi22 面积340mm 2560sp 192bit 96M L2 2.5G 12.5TF navi23 面积240mm 2048sp 128bit 64M L2 2.0G 8TF 其中navi22 的频率高达2.5G印象深刻, 不过规模却只和5700xt相同。 navi22只有navi21的一半芯片却大了这么多, 大概就是因为做了一大块SRAM当来L2 分别是 96M 和 128M, 而navi23估计也有64m 96M的SRAM大约需要45亿晶体管, 差不多就是多出来100mm的芯片面积 为什么navi21没有变大太多呢,当然是因为省下了显存控制器,因为没有做512bit只做了256bit 表面看navi22核心规模小太多,却浪费了那么大的成本去做L2很亏 不过AMD的目标应该是杀入移动端抢占高性能市场,在低功耗下,高缓冲弥补显存的优势放大 大幅降低显存频率也能维持足够的效率, 甚至说不定可以使用GDDR5显存 xbox360时代,ATI卡没有用显存也是用高速缓冲,不但性能不低还能强化抗锯齿的能力 xbox1也没有用显存,浪费APU面积做了32M SRAM, 对性能也没啥影响,节省显存和内存的差价 Navi21拥有两种芯片,其中一种是HBM2显存, 好像依然只有两颗2048bit,配合缓冲也足够了。 更多的目的估计就是进入移动端, 当然这肯定是在mac拿到了Navi31之后 Mac上50瓦功耗的5700xt核心HBM2显存能效比让人印象深刻,这个提升应该算是300%大致估算一下未来A/N显卡市场的布局和性能天梯图 ------把2080ti沦为计量单位 Navi21------ =>3090 170% =>3080s ?????? 7800xt 505mm 5120sp 128mL2 16G 150% 325w 2.25G ¥5999 =>3080 140% 7800 505mm 4608sp 128mL2 8-16G 130% 250w 2.0G ¥4999 =>3070s ?????? =>3070 105% ¥3999 =>2080ti 100% 计量单位 =>3060ti ?????? Navi22------ 7700xt 340mm 2560sp 96mL2 12G 85% 225w 2.5G ¥2999 =>3060 ?????? =>2080s 80% 7700 340mm 2304sp 96mL2 6-12G 75% 175w 2.25G ¥2499 =>2070s 70% =>5700xt 65% Navi23------ 7600xt 240mm 2048sp 64mL2 8G 65% 130w 2.25G ¥1999 =>2060s 60% 7500xt 240mm 1920sp 64ML2 4-8G 55% 110w 2.0G ¥1499 =>1660s 45% 7300xt 240mm 1920sp 64ML2 4G 45% 70w 1.6G ¥1199 =>5300xt 35% ¥799
navi23估计是5nm小核心, 今年只有bigNavi 大概性能估算 =>3090 24G 2080ti + 80% =>3080s 11G 2080ti + 70% bigNavi 21 7nm 6800xtx 5120sp 16G 2080ti +50% =>3080 10G 2080ti + 45% 6800xt 5120sp 16G 2080ti +40% =>3070s 10G 2080ti + 30% 6800 4608sp 12G 2080ti +20% =>3070 8G 2080ti + 5% mediumNavi 23 5nm 6700xt 3584sp 12G 2080ti -5% =>3060s 8G 2080ti - 10% 6700 3328sp 10G 2080ti -15% 显卡性能15年翻了300倍, 性能无非就是成本的堆砌和投入收益的考虑罢了。 AMD的问题市场布局缺陷,5700的缺点不是性能不够,而是性能过强,导致1.5k这个大市场被1660级别的显卡倾销,持平2070换回了点名声,但是1660席卷市场毫无还手之力 打过3080是没有任何意义的, 老黄还可以继续切。 更小的核心用更低的成本打过3070, 或者摸到3070的屁股, 才可能对用户有更好的性价比 amd明显是没有gddr6x的,只能堆16G显存,不过可以切。 5120sp的规模切一刀,再把显存阉割4G,随随便便打个3070 20%一点问题都没有, 但是12G显存摆明了就是不可能降价的。 有人透露nav23是5nm, 也就是amd的计划还是要用250mm级别的小核心打3070 navi23 如果是7nm很明显不适合市场 理论上如果真超频到2.2G以上,和2080ti的性能是几乎相同的,也和3070相当 ,但是这颗芯片面积可能有330mm, 看看amd的历史,压根就没有卖这种330mm芯片的任何想法, 4850 6850 7850 甚至480 580 全部都是220mm - 250mm以内的小核 HD5870当年也是这样大的核心,amd不是再接再厉,而是后退一步,缩回去砍成250mm的6870 ,而之后的6850也就称为非常划算的产品了。
PS5开发者大会早都说了RDNA2和主机同一时间发布 3A游戏其实是以性能最低的那台主机为基准开发的 游戏厂商不会为PC开发任何高性能游戏,只会开发集成显卡能跑的游戏,除非收到赞助才会加特效 所有过去的游戏,都是无法和新主机上的第一款游戏比画质的 ---简单的解释 主要原因是游戏建模水平,现在的游戏画面大约由300万三角形构成,即使2080ti可以计算5000万三角形,大表哥2还是只有300万三角形,因为这游戏要在xbox1上卖。 而新主机是直接以2000万三角形的模型来开发游戏了,画质就革新了,你只要玩了新游戏再回头看大表哥2就会觉得大表哥2画质烂。 希望2077不要太丢脸,回炉那么久弄了个上时代辣眼睛的水平。 说起光线追踪,很多人都没有概念,7年前,PS4的首发游戏杀戮地带就是“第一款?”光线追踪的游戏,只是后来由于考虑到过度浪费机能没有被众多开发商采用而已。 还有5700也有可能支持硬件光线追踪, 因为其实就是同一核心,现在的光线追踪其实是NV掏钱"请"游戏公司做的,AMD自然不可能运行 等到次世代主机游戏发布,RDNA2自然100%支持 希望AMD补全产品线才是重点,性能高低不重要,差点性能可以降价,可以加显存差异竞争 AMD的问题过去只有大小两颗芯片的策略,导致缺乏中间性能区间的显卡,好比现在面对的1660, 完全丢失这部分市场。 最佳还是高中低三档芯片才能铺完全部主流显卡的价位 按传统猜测大核心big navi 5120sp大约能提供两个2070级别的性能,外加10%的改进超频,也能勉强接近3080(大约2个2080)级别 还可能会比3080贵,因为可能是16G显存的。 小切一刀的big navi 12G显存也会比3070强很多,这也意味着AMD可能不打算大量销售只会高价摆着? 最终还是得看medium navi 和 small navi的具体情况 姑且猜测是3584sp 和 2560sp 其实这些卡3080 3070 甚至3060 同级按传统性能估算都刚好比老黄的弱10%,大概就是早有泄露吧。
50G显存(虚拟)已经离我们不太远 地平线黎明时分发布,有些玩家会发现需要10分钟优化时间,就是在准备这些缓存数据,方便游戏中调用 而且这游戏狂吃内存,16G内存直接榨干 早年Vega发布的HBCC的时候大家都没用在意,用2G显存实现8G显存的效果 还有就是SSG直连计算,这就是为下代游戏机开发的核心技术 原因就是游戏只渲染屏幕 "前方" 的数据 而实际内存显存中要存放 "前后左右" 的数据,而显卡只计算 “前方” 的数据 也就是说原本8G显存,就可能直接浪费了6G(这也是现在的游戏和5年前几乎没区别的原因) 虽然现在6-8G显存普及,但是游戏还是只使用了2G。其他的都是缓冲备用数据而已,不需要直接计算的。 通过HBCC优化后,"后左右" 这些缓冲数据都不需要计算的都放到了内存中 在转身的时候再临时从内存搬到显存中去计算即可未来这些数据可以直接搬到内存上存放起来备用即可 8G显存就能实现过去32G的效果,只是可能对应也得32G内存才行 再放大了看,如果有12G-16G的显存,把内存利用起来?是不是就是可以实现过去50G的效果了, 64G内存标配的时代来临了吗?PCIE4.0看来不是没必要,内存到显存就这一条路。 即将发布的30系显卡会提供NvCache来实现此功能,提升内存和SSD性能 如果没猜错的话,这个3080背面的特制芯片很大可能性就是用来实现虚拟显存的, 类似 DMA 这种芯片(直连芯片,负责把内存中的数据直接拷贝到显存中,不占用CPU和GPU)3070s 3080s也会有16G-20G版本,但是别开心太早 按照这个虚拟显存的方式 8G-10G显存的版本 + 32G内存也是必要的 更高一点16G - 20G显存的情况 没PCIE4.0和64G内存的话估计是无法发挥全部实力的
官方战役x2强化plus,关卡体验详解 首先这不是无脑虐杀游戏, 而是一个+Plus战役, 就是对战役进行修改,带来完全不一样的体验 建议选残酷难度,因为脚本问题,很多关卡没有修改其它难度的数据,敌人会完全变成弱鸡 地图上所有敌军防御力量x2倍,原来有1个坦克的位置,现在是3个坦克, 没有足够兵力是难以推进的 敌人进攻波次部队规模x2倍起(有时会更多),少则50-100人口,多至200+ 所有单位的生命值都x2,这样在大规模作战时不会出现"不是秒杀对方部队就是被对方部队秒杀"的情况 资源更容易获取,基地建设更快,能够迅速积攒出大量部队 作战单位的所有技能都进行了强化,也拥有独特黑科技,多数主要是在原来的基础上加了一倍 但是这不表示寥寥无几的部队就能妥妥的平推,任何时候都是以资源和发展部队和配置比例为核心 人族战役的所有单位和科技全部初始可用,开局就可以砸矿骡,部队全部空投,雇佣兵刷新无上限。 拥有的科技可以在战役中进行二次强化,比如兴奋剂提速50%,购买后就变成了100% 最核心的地方是提供了“一键甩枪兵”的的功能,用来实现机枪兵自动走A 快捷键为D,任何玩家都可以体验一把职业级别的枪兵操作 RPG关进行了优化,否则敌人太多过不去 人族战役第一关,雷诺带着5个MM就敢冲基地 不过一开始就拥有兴奋剂,MM的生命值为110(当然敌人也一样),不那么容易牺牲 敌人的防守力量是原来的3倍,雷诺拥有光环可以为周围单位回血并提升射程中期是个难点,这里大约有20多个敌人,增援部队会空投到敌人中间(送),建议直接扎针跑回雷诺旁边
次世代首发得先看看卡表能玩出什么花来 虽然战地和Cod才是次世代画质的标杆,甚至很多人是买游戏送的机器,甚至可能只有这一个游戏 但无法否认,真正给大众带来画质震撼效果的游戏是生化危机1-2,用2D贴图+3D人物发挥出马赛克画面的极致 生化危机8是回炉重做了的,只是为了体验一把次世代技术的加成,延续IP的进化 生化危机8的开发者下面这句“你甚至可以近看这些细节”,隐藏了无限的可能现在绝大多数游戏都是CG即时演算过场不再做电影动画 为什么过场可以即时运算出如此高画质的画面,在游戏中却不能? 这并不是GPU算力不够,而是显存不够,CG过场就是一个清空显存,全部用来装载高清模型和材质的操作而已 而SSD的速度就解决了显存不够的难题 只要数据能够一瞬间内导入显存,等于任何时候都能实现即时CG级别画面 对于寂静岭类别的游戏甚至可能会发挥出更逆天的效果 其实xsx一开始就输了的,输的是CPU的架构,不过也很有可能趁机把销售重心放到廉价产品xss上 好比加载app速度也能决定手机好坏。 次世代的关键技术-----硬盘和显存之间的IO速度有多快,就决定了能在游戏中使用多少有效显存 EA对次世代的宣传,极品飞车的下一代, 下面演示的这个加载速度快了10倍车速360km, 每秒就能跑100米 如果IO的速度是22G/s, 那么这100米的范围的场景就可以使用22G的显存 而IO的速度只有5G/s, 也意味着这台设备只能使用5G的显存
建议不要急着换太好的CPU和GPU 很多3A游戏开发商已经开始慢慢透露一个信息 次世代主机上的"细节特效",在PC上将无法实现 具体相关可以了解 虚幻引擎5demo 演示,还有白嫖王 linus 误以为30G/s硬盘比主机SSD快的道歉视频 这也表示未来游戏的核心技术是"虚拟几何体" 而不是"光线追踪", PC平台可能会是画质最差的一个 (UE5 靠着不到5700的性能 + SSD直连 实现了16亿三角形的场景画质,堪比电影,而2080ti目前只实现了4800万个, 差距30倍) 用小学数学的水平算算16亿三角形的顶点需要60G内存才装得下。(当然放硬盘中时是可以压缩很多倍的,或许是10倍100倍以上) 很多人还以为主机只是换了个SSD, 误以为PC也能实现 如果我用通俗的话来说, 现在大家知道到不少游戏吃CPU和内存,其实就是CPU的IO在处理硬盘中的数据瓶颈了, 而主机是做了一个类似蚂蚁矿机这样的第三处理器来专门处理(解压)硬盘数据,这个第三处理器比CPU快十倍以上,因为它只有一个功能,就是处理游戏的模型材质数据,CPU别说超5Ghz, 超到50Ghz都可能不如这个第三处理器,就和CPU和GPU的本质区别一样 正是拥有了这样的速度,游戏也完全不用Loading读图过程, 在拉近镜头的时候一瞬间加载屏幕前的高清模型,拉远镜头后又可以立刻删除, 因为随时随地可以临时加载,也就实现了处处都是高清模型,等效于实现了CG电影级别画面 PC难以实现的原因就是因为这个协处理器需要放在CPU的北桥IO上才能发挥速度,除非来次大改。 下图就是大家觉得搞笑的主机SSD吹图,但仔细看清楚,这和SSD无关,是一整个CPU + GPU + IO的组成, 这个IO如同zen2一样的重要,它其实是下个世代CPU,GPU外的第三处理器
谈谈“流式显存”对PC硬件发起的挑战 吹嘘SSD的PS5就要正式发布演示了,某图形硬件行业大佬将面临地位的危机,大佬自然是要面临挑战的 白嫖王linus 拿了一块30G/s的SSD去对比 PS5的 SSD, 最终发现不是那么一回事,专门做了一期道歉视 人们总是以为数字大就是好, 数字小就是差简单来说就是我们以为SSD往显存里面传数据是一个复杂粘贴的过程, SSD 有5G/s速度1秒就能往显存里面传5G, 有30G/s速度就能传30G 这就是一个错误,在PC平台上,无论你的SSD有多块,达到1G/s速度的时候八核CPU很可能已经爆了 大概这也就是传说中的星际公民,就算把游戏放到内存,也还是悲剧速度的原因。 因为这不是复制粘贴 最少也是下面这样的,需要把原图切块,缩放,然后再拼接这个工作一直都是交给CPU来完成,因为过去对显存的读入要求不高,都是按HDD硬盘来设计,所以大家都没有感觉到速度不够, 而当这个工作量突然提升了10倍,50倍,甚至100倍的时候,CPU就无能为力了。 这也是很多人吐槽的 ---用了500m/s的SSD游戏加载变快 ---用了3000m/s的SSD加载却没有快上6倍,甚至可能和上者一样,因为CPU已经极限了, Loading的加载过程,就是一个往显存里面加载纹理材质的过程 举例来说更像是仓库发货 需要从挑货,贴单,打包,装箱等流程 这100倍的速度可不是Ctrl + C, Ctrl + V就完成了的8个CPU再怎么强也还是8个人,8个人能打一个房间的包就极限了主机干脆直接定制一个IO处理器, 用来绕过CPU,专门干打包这活,别的都不用 这个IO相当于有十几个 八核CPU的效率, 也就相当于是请了100个打包工人做出了这样的代价,在北桥定制ASIC(如果你不懂可以把它想象成蚂蚁矿机,专门挖矿的那种效率) 才实现了8-9G(最高22G)/s的显存传输速度 PS5的SSD就是一块普普通通的硬盘, 而这个硬盘的IO对应的芯片,是一个相当于十几个CPU级别的“蚂蚁矿机”,这才是核心之处。 PC在没有建立这个“打包仓库”的情况下,是永远无法实现同样效果的,除非用上几十核心的产品。 等到下一代产品才有可能, 并且需要AMD Intel和微软一起合作实现,因为IO只能装在CPU的北桥才行,软件和驱动需要windows才能开放通道。
首页 1 2 下一页