Seagate2008 Seagate2008
关注数: 37 粉丝数: 673 发帖数: 13,937 关注贴吧数: 9
聊聊A卡,为何在高分辨率高负载还有DX12游戏中与N卡差距缩小 有一些看过我写Zen的分析贴的朋友希望我写一篇分析显卡的贴子。可是很抱歉,我没那个能力,我对显卡没什么研究,我甚至从来不玩游戏,我对显卡一无所知。 我搜罗了一些各种说法或答案,我把其中我认为相对靠谱一点的说法搬过来,再加上一点我自己的思考,仅供大家参考。 所以这篇帖子的信息,基本上就是道听途说和自己想当然的内容,完全没有经过真实性的求证,更没有基于理论上的分析,甚至逻辑上是否正确都是未知数,大家随便看看热闹水个贴,也希望大家多多发表自己的见解。 1.先说A卡在高分辨率高负载的情况下,为何与N卡性能差距缩小 在相同性能级别的A卡和N卡对比评测中,在同个游戏测试中,我们往往能够看到,遇见高分辨率时A卡容易领先一些,在低分辨率时N卡容易领先一些。为啥会这样呢? A卡往往在同级别的显卡中,显存带宽方面比N卡更为激进,更高的显存带宽容易在高分辨率中获得优势。但这这其实并不是主要的原因。 现在的游戏为了提升画面效果,使游戏更有观感,让玩家能获得更好的游戏体验,使得曲面细分这个东西在画面生成所需计算量中占的比重越来越大。 这些游戏又在银威大的威逼利诱之下,进一步激进的在几乎没必要使用曲面细分的地方增加曲面细分的计算。比如有的游戏在方方正正的水泥墩子,和一些本来就是平面的东西中使用曲面细分计算。银威大为何要这么做呢? A卡有专用的曲面细分计算单元,一定数量的流处理器配置一定数量的曲面细分计算单元。一旦曲面细分计算过多,曲面细分单元满载,那么就会导致相对应的流处理器闲置,等待曲面细分计算单元计算完毕。所以,这导致了A卡流处理器利用效率低下,成为了流处理器比N卡多,实际性能却不如N卡的状况的部分原因。 然而随着分辨率设定和画面特效设定的提升,曲面细分在计算量中所占的比例会有所下降,这导致了流处理器闲置的机会减小,流处理器的利用效率获得较大提升,于是就看见了A卡在高分辨率高负载的情况下容易表现更好的状况。 为何N卡没有这种问题? 因为N卡没有专用的曲面细分单元,曲面细分的计算是由流处理器完成的,可以根据曲面细分的需求来为其分配流处理器资源,如此一来,流处理器在任何时候都是满载状态,流处理器利用效率非常高。所以无论在高分辨率还是低分辨率情况中,流处理器的利用效率没有变化,整卡总的性能是固定的,所以高分辨率高负载时的帧数下降就会比A卡更明显。 有的游戏不符合这样的规律,说明那个游戏商没有被银威大强行啪啪啪 所以商业竞争永远都是最污的和最无耻的,内幕多到你无法想象 未完待续...
Zen的新消息+我个人观点的【解读】 此【解读】仅代表我个人的理解和看法,并不代表实际情况。Zen处理器被命名为RYZEN。 Zen是禅宗的意思。 RYZEN同时又是一个谐音词,大概可能是有升起和地平线的意思。按照我们东方文化去理解,这个词的意思可能是旭日东升,朝气蓬勃,信心满满的含义。 8C16T和20M缓存是此前反复曝光过的了。每核心512K(0.5M)二级缓存,每4个核心共享一组8M三级缓存,二级+三级缓存共20M。 AMD SenseMI技术是啥不知道。我猜测可能指的是基于功耗环路控制的智能睿频。 主频3.4G+,按照正常人的理解应该是基频3.4G的意思。 不过我的看法有点不同,我猜测3.4G+极有可能说的是低端8C16T的最大睿频3.4G。 主频方面可能会继续令大家失望。精准睿频。 在相同功耗下可以获得更高性能。 通过串行的纯功耗闭环控制处理器频率来提高性能。 直接调整时钟,不会造成计算停顿或流水线队列增加。 以25MHz为步进,高精度调节频率。(大概应该是0.25X倍频。此前的爆料似乎是0.5X,现在居然是0.25X,呵呵,这回玩超频可有意思了,也算是一个小惊喜)纯净动力。 更加智慧的节能。 同等性能可以获得更低能耗。 监测温度、速度、电压。 低功耗运行状态下,实时自适应管理功耗。 闭环控制,无限Fabric(抱歉,不知道啥意思)。智能指令预取。 通过应用程序的指令预测即将被使用到的数据。 反正罗里吧嗦说了一堆就是能使从缓存到处理器内核的数据传输延迟降低,提高性能。扩展的频率范围。 允许频率高于最大睿频上限,但完全自动无需人为干预。 时钟速度可用于风冷、水冷、液氮的冷却方案。(这个到底想说啥没整明白)。 估计说了半天就是想说全面放开超频,并且不影响通过动态频率节能的功能。估计可能是具备broadwell-E那样的比较高级的调节睿频,但更加智能。这个是歪果仁网友做的图,不过我认为达不到这么高。 我的英语太烂了,不知道理解的对不对,有没有英语达人替我翻译一下。
请大家理智面对近期媒体对Zen的捧杀 距离Zen上市的时间越来越近了,媒体上面对Zen的报道和小道消息也越来越多了。有些消息看起来似乎靠谱,但有些消息看起来就有点胡扯了。 我就说其中的一个,那就是关于Zen的价格,有报道说只要300美金,而且是8核16线程性能最高的那款。 我不相信这个价格,我认为价格是低了。 我为什么认为300美金是偏低了呢? 因为我还是很看好Zen的性能,Zen不可能反杀Intel,但是大幅度的进步是可以期待的。 我在先前发的分析贴《你们都不信Zen对标i7 6900K是真的,我来理性分析一下,数据说话》这篇帖子中的分析结果认为,Zen的整数多线程同频性能可能略好于Intel的Haswell,浮点性能应该稍弱于Intel的Haswell,但是Zen的主频很低,所以 8C16T的Zen基本上可以对位的就是6C12T的i7-6850K,又或者比预期更弱一些对位i7-6800K,我现在仍然坚持这个观点不变。 尽管AMD向来都是主打性价比风格,但性价比都是有限度的,毕竟一家企业他不是慈善家,企业都是要以盈利为目的的。 我们可以换位思考一下,目前市面上正在销售的6800K盒装约为2999左右,6850K盒装约为4299左右,那么假如你是AMD,你新推出来一款处理器,性能介于6800K与6850K之间的话,要主打性价比的话你怎么定价? 假如届时Intel不降价的话,那么我认为能与6800K的价格相同就算是超级便宜了 ,甚至 如果是我定价的话,也许会定3699元国内首发 ,毕竟到时候X370的主板会比X99便宜不少,而且也不需要4通道内存,并且Zen只有95W而6850K要140W,这样一来整个Zen平台的性价比就已经凸显出来了。 假如到那个时候Intel降价了,那么这个Zen的价格当然也应该相应的做出调整,但是我认为,如果性能介于6800K与6850K之间,首发价格就介于6800K与6850K之间,这是一定的。至于后期价格会如何调整,那就取决于双方的竞争程度了。 除此以外,Zen据说还会有官方特调体质版,主频更高,功耗不变。估计首发不会出来,要是首发就有的话估计首发定价会高过6850K,性能也打平或者反杀6850K。 总之首发300美金下不来。 以上仅代表我个人观点,欢迎大家参与讨论!
Zen架构性能预测(二):我来告诉你为何Zen性能是推土机的2倍 此贴是一篇YY贴,毕竟消息有限。只能大单畅想,所以请持有不同观点的盆友不要太认真,请大家轻喷 第一部分:回顾 我之前发过一篇Zen性能预测的帖子《AMD Zen架构性能粗略目测:superpi 有望飙进10s大关》,地址http://tieba.baidu.com/p/4574358104?pid=90494669048#90494669048 或 http://tieba.baidu.com/p/4451709341 有兴趣的朋友可以去看,没兴趣可以无视。我想在这里对先前这篇贴子的观点加以修正,毕竟先前消息有限,难免出现偏差,随着消息不断明朗,我也将不断的修正我的观点。 先前我以为Zen会像服务器版本一样推出4通道内存控制器用来与淫特二的高端2011对标。但现在显然农企还是有点心虚,为了控制成本只出了双通道内存控制器。这意味着Zen并不会超级强大,因为如果Zen超级强大,那么双通道内存会成为性能的严重瓶颈,吉姆凯勒(Jim Keller)是不会犯这种愚蠢错误的。所以仅内存带宽就已经决定了Zen性能是绝对无法与5960X对标的,至少不能全面对标,可能只有功耗是优于5960X的,毕竟已经是14nm工艺了。 但我依旧认为Zen会有非常不错的性能,这个性能依然会超出不少人的预期。上图为Zen的核心照片 观点修正之一:先前是预期收紧内存参数后4C8T的Pi为10s以内,现在预期修正为8C16T的Pi为12.5s以内(与此前一样是在收紧内存参数的情况下)。 修正原因:从Zen的核心照可以看到每模块附带1个单通道内存控制器,这是否意味着Zen将不会推出4核心单通道内存的产品?还是说出4核心的产品会单独为其设计一个双通道内存控制器?还是用8C16T的芯片屏蔽核心数量得到4C8T双通道内存?难道还能开核?我原来对Pi成绩的预期在10秒以内是以4C8T为基础的。现在我放弃对4C8T做预测,因为我甚至不知道会不会有4C8T的产品,如果有也不知道是何种形式。所以现在我重新对8C16T的Pi成绩做一个预期:鉴于8C16T的主频会比4C8T的主频有所降低,再加上内存控制器只有双通道,而且是每模块1个单通道的形式(这种形式对跑pi非常不利),所以预期修正为12.5s以内。 大家可能会说,多核时代讨论Pi成绩无意义,的确如此,我也不认为Pi的成绩本身有多大意义,我之所以选择Pi的成绩作为标的,是因为它比较简单,很容易成为一个好的参照物,有了这个参照物,你大概就能够对其他方面的性能有所衡量和猜测。 观点修正之二:要等到7nm工艺节点再去讨论Zen能否挑战Intel的2011平台的地位了。 修正原因:此前的贴子提到台积电和三星的10nm工艺抢先Intel,但后来有消息称台积电的10nm专供移动设备,三星方面的10nm暂无什么消息。所以,未来对Zen的后续升级架构抢先使用10纳米不再抱有希望。有消息表示台积电的7nm将共同提供移动设备与高性能计算设备,而这个时间节点依然卡在Intel的7nm前面。所以未来Zen的升级架构有希望在7nm节点与Intel的10nm同台竞争,这将给Zen架构带来更多优势,即便仍然没有Intel的架构先进,但凭借工艺的领先也有可能打平甚至击败Intel。 尽管Intel在同代工艺上面是最先进的,无论台积电、三星、格罗方德还是中芯国际等都无法在同代工艺上面领先Intel,但7nm整整领先10nm一代工艺,台积电7nm再烂那也是7nm,Intel的10nm再先进那也是10nm,10nm的尺寸比7nm的尺寸大了43%,所以7nm工艺注定要优于10nm工艺。现在不知道台积电能否如愿以偿的抢在Intel前面,如果真的能够抢先,那么农企就有希望真正崛起了。有关于工艺的尺寸到底是怎么一回事,它为何以及如何影响性能,为何同代工艺也会有不同表现,等我有时间另外写一篇贴子来讨论这个问题,本文不再赘述。 补充:至于为什么Zen每个模块只有1个单通道内存控制器,我猜想,原因只有1个,那就是为服务器优化。毕竟服务器平台的利润更高,无论Intel还是农企第一意识都会是向服务器优化,桌面平台只是附带产品而已。服务器平台一般都是以堆核心数量为主,为了控制功耗而大幅降低主频,这样一来,低主频的4个核心使用一个单通道内存基本上不会受到带宽瓶颈(而且负载不是特别重的时候还可以通过模块间的通信去获得其他通道内存的带宽),而这样做成本又能控制的不错。推土机系列架构为什么让大家觉得性能辣么烂?原因也在于此,他是为服务器优化的。你会说服务器版本还不是照样被至强吊打?盆友,那是因为工艺落后太多了啊,如果不这样做会被吊打得更惨。我从不认为推土机系列架构是辣鸡,这个架构虽算不上优秀,但也绝对不是辣鸡。至于为什么,推土机是如何为服务器优化的,推土机系列架构为何表现如此不尽如人意,工艺到底落后了多少,工艺落后到底造成了多大影响,我们以后有机会另写一篇贴子再来讨论,不在本文赘述。 第一部分结束 未完待续。。。。 今晚或明晚继续在此贴更新,感谢大家关注。 ——岔气牛 于中国东北时间2016.05.27晚 ————装别人的B,让别人无B可装
AMD Zen架构性能粗略目测:superpi 有望飙进10s大关 此贴原来在2016.04.02发表于AMD吧,现在由于陷入AMD吧吧务的法力无边、无法无天、罪恶滔天、乱删我帖子、随意封号而投诉无门的窘境,为避免这篇贴子被进一步删除,只好把这边贴子移植至CPU吧。 此贴由于是较早的时候写的,尽管现在看起来部分内容有些荒谬,但就当时有限的信息来看,做到这样已实属不易。我将随着新消息的不断放出,不断修正我的观点并发表更新帖。 毕竟此贴仅是一篇YY贴,所以请持有不同观点的盆友不要太认真,请大家轻喷 以下是原贴正文,一字未改: 1.挖掘机 目前桌面版挖掘机架构4.2G主频时 Pi 约14.7s,同频性能已经超越K10.5,这有点令我惊讶不已。 2.ALU数量 肥龙II K10.5架构同频pi性能比推土机架构高约25%,主要原因是单核心ALU数量从3个下降至2个所致,淫特二从Haswell开始已经是每核心4个ALU。Zen架构单核心ALU数量将是3个或4个,个人认为4个可能性较大。不过按照淫特二的经验看,ALU从3个增加至4个,对Pi成绩影响不明显,仅对超线程性能有所提升。所以预测Zen的Pi性能就按3个ALU计算即可。按照肥龙与推土机的经验,如果3个ALU能比2个ALU的挖掘机同频提高25%,那么Zen的4.2G时的 Pi 应该是约11.76s 3.主频 45nm的肥龙可以轻松超4.0G,32nm的打桩机可以做出5G,28nm压路机可以轻飘飘超4.5G,淫特二的22nm i7 4790K可以睿频4.4G,所以我认为14nm的Zen如果出现最大睿频至4.6G并不应该感到惊讶,毕竟农企现在走的是高主频路线。那么Zen在4.6G时的 Pi 约为10.74s 4.三级缓存 我们一直在与挖掘机对比,可挖掘机是不带L3缓存的,Zen是带L3缓存的,尽管农企这些年来缓存性能一直不给力,但我认为8M的L3缓存对于Pi性能还是应当有提升的,暂且保守的认为能提高2%,那么此时Zen的 Pi 应该是10.53s 5.内存带宽 从已泄露的AM4资料来看,针脚数量有1331之多,相比于AM3和FM2+有非常大的增加。我个人认为,唯一的解释就是提供了4通道内存。你可能会说,不是早有消息表示Zen会支持4通道了吗?其实不然,农企自推土机架构就支持4通道内存了,而且内存控制器性能还很不错,但只特供服务器版本,桌面版却不支持4通道,所以在得知AM4针脚数量之前,还真是难下定论。这次Zen架构我认为将是服务器版胶水32核支持2个4通道(可以认为这是8通道),桌面版没有胶水,最多16核1个4通道。AM4支持DDR4 2933,这样一来,4通道DDR4 2933相比于挖掘机2通道DDR3 2133,内存带宽提升175%,也就是原来的2.75倍。如此巨幅提高内存带宽,我认为可以提高Pi性能至少5%,如此一来Zen的 Pi 应该是10.03s 6.内存稍微收紧一下参数就可以飙进10秒大关了。 7.综合性能 我对Jim Keller很有信心(如果你不知道他是谁,请去问度娘),所以我相信10s大关不是梦。Pi 的成绩向来都是农企的弱项,所以如果Pi能飙进10s,那么相比于8s多的Skylake而言,单个核心的综合加权平均性能不会有太明显的落后。得益于4通道内存的优势,4C8T的Zen与Skylake的多核心多线程加权平均性能差距会更小甚至反超Skylake,因为多线程高强度的计算时,内存带宽很容易成为瓶颈。然而定位于FX系列的Zen处理器将至少有8C16T,根本不会有4C8T的版本。这意味着FX系列最低端款也将吊打淫特二的LGA11xx系列全家,FX系列最低端默秒全 FX系列真正的对手是淫特二的2011系列。理性的说,Zen要想胜过淫特二的2011基本没有可能,只有等待先于淫特二用上10nm工艺的时候才有机会了。 台积电和三星的10nm工艺领先淫特二的10nm半年以上基本上是板上钉钉了。 8.退一万步讲,即便Zen只是老肥龙或挖掘机用上14nm的工艺,而架构本身没有任何优化和改进,那也可以比目前的28nm压路机、挖掘机有太大的提升了。无论如何Zen的到来将给广大玩家带来福音,不只是 A 粉的福音,也是中低端 i 粉的福音,因为他将有实力迫使中低端的奔腾、赛扬、i3降价,甚至导致奔腾赛扬直接绝种。如果你现在还在以为农企依然在搞 马克*纸大师(Mark Papermaster)的人如其名的PPT,那你就大错特错了,醒醒吧,“狼来了”的故事不会一直重演。 9.我只是一个普通玩家,发烧友都算不上标准一枚,更不是神马技术砖家叫兽,所以讲的如果有错误还望大家多多批评与指导,第一次发帖不懂规矩,请大家多多关照。 ——岔气牛 于中国东北时间2016.04.02上午 ————装别人的B,让别人无B可装
AMD Zen架构性能粗略目测:superpi 有望飙进10s大关 1.挖掘机 目前桌面版挖掘机架构4.2G主频时 Pi 约14.7s,同频性能已经超越K10.5,这有点令我惊讶不已。 2.ALU数量 从肥龙II K10.5架构同频pi性能比推土机架构高约25%,主要原因是单核心ALU数量从3个下降至2个所致,淫特二从Haswell开始已经是每核心4个ALU。Zen架构单核心ALU数量将是3个或4个,个人认为4个可能性较大。不过按照淫特二的经验看,ALU从3个增加至4个,对Pi成绩影响不明显,仅对超线程性能有所提升。所以预测Zen的Pi性能就按3个ALU计算即可。按照肥龙与推土机的经验,如果3个ALU能比2个ALU的挖掘机同频提高25%,那么Zen的4.2G时的 Pi 应该是约11.76s 3.主频 45nm的肥龙可以轻松超4.0G,32nm的打桩机可以做出5G,28nm压路机可以轻飘飘超4.5G,淫特二的22nm i7 4790K可以睿频4.4G,所以我认为14nm的Zen如果出现最大睿频至4.6G并不应该感到惊讶,毕竟农企现在走的是高主频路线。那么Zen在4.6G时的 Pi 约为10.74s 4.三级缓存 我们一直在与挖掘机对比,可挖掘机是不带L3缓存的,Zen是带L3缓存的,尽管农企这些年来缓存性能一直不给力,但我认为8M的L3缓存对于Pi性能还是应当有提升的,暂且保守的认为能提高2%,那么此时Zen的 Pi 应该是10.53s 5.内存带宽 从已泄露的AM4资料来看,针脚数量有1331之多,相比于AM3和FM2+有非常大的增加。我个人认为,唯一的解释就是提供了4通道内存。你可能会说,不是早有消息表示Zen会支持4通道了吗?其实不然,农企自推土机架构就支持4通道内存了,而且内存控制器性能还很不错,但只特供服务器版本,桌面版却不支持4通道,所以在得知AM4针脚数量之前,还真是难下定论。这次Zen架构我认为将是服务器版胶水32核支持2个4通道(可以认为这是8通道),桌面版没有胶水,最多16核1个4通道。AM4支持DDR4 2933,这样一来,4通道DDR4 2933相比于挖掘机2通道DDR3 2133,内存带宽提升175%,也就是原来的2.75倍。如此巨幅提高内存带宽,我认为可以提高Pi性能至少5%,如此一来Zen的 Pi 应该是10.03s 6.内存稍微收紧一下参数就可以飙进10秒大关了。 7.综合性能 我对Jim Keller很有信心(如果你不知道他是谁,请去问度娘),所以我相信10s大关不是梦。Pi 的成绩向来都是农企的弱项,所以如果Pi能飙进10s,那么相比于8s多的Skylake而言,单个核心的综合加权平均性能不会有太明显的落后。得益于4通道内存的优势,4C8T的Zen与Skylake的多核心多线程加权平均性能差距会更小甚至反超Skylake,因为多线程高强度的计算时,内存带宽很容易成为瓶颈。然而定位于FX系列的Zen处理器将至少有8C16T,根本不会有4C8T的版本。这意味着FX系列最低端款也将吊打淫特二的LGA11xx系列全家,FX系列最低端默秒全 FX系列真正的对手是淫特二的2011系列。理性的说,Zen要想胜过淫特二的2011基本没有可能,只有等待先于淫特二用上10nm工艺的时候才有机会了。 台积电和三星的10nm工艺领先淫特二的10nm半年以上基本上是板上钉钉了。 8.退一万步讲,即便Zen只是老肥龙或挖掘机用上14nm的工艺,而架构本身没有任何优化和改进,那也可以比目前的28nm压路机、挖掘机有太大的提升了。无论如何Zen的到来将给广大玩家带来福音,不只是 A 粉的福音,也是中低端 i 粉的福音,因为他将有实力迫使中低端的奔腾、赛扬、i3降价,甚至导致奔腾赛扬直接绝种。如果你现在还在以为农企依然在搞 马克*纸大师(Mark Papermaster)的人如其名的PPT,那你就大错特错了,醒醒吧,“狼来了”的故事不会一直重演。 9.我只是一个普通玩家,发烧友都算不上标准一枚,更不是神马技术砖家叫兽,所以讲的如果有错误还望大家多多批评与指导,第一次发帖不懂规矩,请大家多多关照。 ——岔气牛 于中国东北时间2016.04.02上午 ————装别人的B,让别人无B可装
首页 1 2 下一页