lwyx2014 lwyx2014
关注数: 8 粉丝数: 474 发帖数: 19,108 关注贴吧数: 8
【求助】关于显卡像素填充率的一些问题 首先楼主知道像素填充率指的是GPU每秒内可以渲染到屏幕并写入显存的像素数量, 像素填充率以百万像素每秒或千兆像素每秒为单位,通过GPU的时钟频率乘以光栅单元的数量就可以获得像素填充率的理论值。 但这样计算出来的只是理论值,实际上会有其他因素限制显卡ROPS性能的发挥和像素填充率吗? 例如N卡GPC单元的数量我听说就会限制ROPS性能和像素填充率的发挥,这种情况好像在开普勒架构就有出现过,例如开普勒架构的每个GPC单元在每个时钟频率可以输出8个像素,GK104核心是4组GPC单元,所以32个光栅单元就可以全部发挥出来。 而GK110核心虽然最大可以有48个光栅单元,但是它的GPC单元只有5组,那样就会将GPU限制为每个时钟40个像素,也就是GPC单元的限制可能会导致GK110核心的光栅单元以40+8的模式来进行工作,多出来的8个光栅单元虽然有时候可能会起不到作用,但还是可以起到辅助作用的,例如MSAA多重采样抗锯齿,因为MSAA不需要光栅化的附加数据。 如果这种情况是真的的话,那么1060是不是也存在这种情况?因为GP106的GPC单元只有2组,帕斯卡架构的GPC单元每个时钟可以输出16个像素,2组GPC单元就只能让32个ROPS发挥出性能,另外16个只能在不需要光栅化的附加数据的情况下才能起到作用吗?
【不是大神的科普】关于ECC内存和REG内存的一些科普 之前有朋友问我关于ECC内存和REG内存的一些东西,所以我就想通过之前学到的东西做一些科普,其中如果有错误的话就请大家指正,谢谢。 常见的内存类型有这几种:Non-ECC内存,Un-buffered-ECC内存和Register内存。 其中Non-ECC内存为最常见的消费级内存,这种内存不带缓存,也没有寄存器,延迟更小,通常用于台式机。 Un-buffered-ECC内存为带错误检查和纠正的无缓冲内存,这种内存也俗称为纯ECC内存,它可以提供单一错误纠正和检测,常用于NAS,小型服务器以及可以支持的平台上。Intel的平台的E3,四代以上的i3以及AMD平台的锐龙系列其实也是可以支持这种内存的。 Register内存则为带缓存,寄存器和ECC功能的内存,这种内存也分为RDIMM,LRDIMM两种,这两种内存都有用于优化时钟、命令和控制信号的寄存器,通常用于大型服务器上。 RDIMM为带存储器的DIMM,通过添加8位的奇偶校验信号来实现错误纠正,LRDIMM则为低负载双列的DIMM,通过放置数据在缓冲区来优化数据信号。 而且Register内存的区块组织和普通内存的不一样,例如Register内存就有1Rx4,1Rx8,2Rx4,2Rx8,4Rx4,8Rx4等规格,不同规格的内存颗粒数量是不一样的,例如1Rx4的有18个内存颗粒,2Rx4的有36个内存颗粒,而且兼容性对于不同主板也是不一样的,例如有些主板可以支持1Rx8的,但不一定能支持2Rx4的。 Register内存的支持条件则需要满足这几个,其中一个没有满足的话就可能会用不了。 1.CPU支持,例如支持Reg内存的X79和X99主板使用i7就不能支持,要使用E5才能支持Reg内存。 2.芯片组支持,这个是老平台的条件,因为老平台的内存控制器还没有集成到CPU里面,例如X58芯片组就不一定能支持Reg内存,而服务器的5500,5520芯片组就可以支持,但X79平台开始因为内存控制器集成到CPU里面了,所以就和芯片组的关系不大了。 3.主板BIOS支持,主板BIOS如果不支持Reg内存的话可能也无法启动。 4.主板内存到CPU的电路布局支持,因为Reg内存和普通内存的走线是不一样的,所以主板电路也是需要支持的。 最后总结一下,Non-ECC内存、Un-buffered-ECC都属于无缓冲内存,无缓冲内存其中的内存控制器和RAM芯片之间不存在硬件寄存器。Register内存称为寄存内存,也称为缓冲内存,也就是DRAM模块和内存控制器中间有一个寄存器。 缓冲内存比无缓冲内存更稳定,也就是Reg内存相比普通内存和纯ECC内存来说是更稳定的。
【求助和讨论】关于显存位宽的问题 楼主之前认识到了虽然显存位宽是显存就是一次能传递的数据宽度,但现在打算思考一下显存位宽和显卡使用了几颗显存有关,还有等效频率这些问题。 先说GDDR显存的话,1080Ti的显存位宽是352bit,那么就应该由11颗1G的GDDR5X显存组成,一颗显存应该能提供32bit的显存位宽,BGA封装的显存一般情况下也是32bit每颗的,这个我之前查资料也有看过。 那1060 6G版的显存位宽是192bit,我就认为应该是有6颗GDDR5显存,1060 3G版的话虽然显存只有3G,但显存位宽也是192bit,显存应该也是有6块组成,只是一块显存只有512M的容量。1060 3G版和6G版的差距我认为主要在流处理器上,6G版的有1280个流处理器,3G版的有1152个流处理器。 GDDR显存的等效频率应该是固定来算的,例如GDDR5显存叠了四层,GDDR5X叠了八层,就应该是分别按乘4和乘8来算的。例如1050Ti的显存频率是1752,那么乘4就是7008。1070的显存频率是2002,那么等效频率就是8002。1080的显存频率是1251,那么乘以8的等效频率就是10008,1080Ti的显存频率是1376,那么等效频率就是11008。 再谈HBM显存的话,其中我知道HBM显存是和核心封装在一起的,一颗核心可以提供1024bit的位宽,这几张图分别是R9 FURY X,Vega64,Quadro GP100,TITAN V的核心。FURY X使用的是HBM显存,其他使用的是HBM2显存。那么FURY X有四颗显存就是4096的位宽,Vega64有两颗就是2048的位宽,Quadro GP100有四颗就是4096的位宽,那TITAN V看上去有4颗显存为什么只有3072的位宽呢? 我也知道HBM显存的带宽和显存频率有关,有几块的话等效频率就是多少,例如FURY X的显存频率是500,有四块显存等效频率就是2000,显存带宽是512G/s。Vega56的显存频率是800,有两块显存等效频率是1600,显存带宽是410G/s。Vega64的显存频率是945,有两块显存等效频率是1890,显存带宽是484G/s,Quadro GP100的显存频率是715,有四块显存等效频率应该就是2860,内存带宽732GB/s。 之前让我感到疑惑的是TITAN V的显存频率是850,四块显存的话等效频率应该是3400,但显存带宽只有652GB/s,再加上显存位宽实际上只有3072bit的原因,是不是就应该只有三块HBM2显存呢? 我认为有可能是这样的,TITAN V虽然核心图看起来是四颗HBM2显存,但实际上只有三颗,例如完整核心的Quadro GV100的显存是32G,由四颗8G的HBM2显存组成。TITAN V的显存只有12G,会不会泰坦V真的只是由三颗4G的HBM2显存组成的呢? 因为楼主在这些方面还是有点才疏学浅,所以希望大家看一下我对显存等效频率和位宽的一些思考,有什么不对的地方也希望大家指出。
【不是大神的科普】关于固态硬盘原厂,白片和黑片的闪存颗粒 之前有人问过我关于固态颗粒的问题,楼主之前查过资料和看过一些东西,所以就打算总结和科普一下。 大家都知道无论是MLC还是TLC的固态,都是由晶圆切割而来的闪存颗粒,在生产工艺越先进的情况下,从晶圆上可以切割出来的闪存颗粒就越多,成本也就越低。这个时候问题就来了,晶圆这种硅半导体集成电路的生产就会出现良品和次品的概念,每一块晶圆片都可能会存在差距(就像CPU存在超频的体质差距一样),有些时候并非每一块晶圆片都是完美合格的(因为工艺实在是太复杂了),往往还是会出现次品和不良品。 首先是被称作黑片的闪存颗粒,黑片就是没有通过任何检测的晶圆片,也是晶圆上最差和故障率最高的废片,这种颗粒很多时候也会被晶圆厂放弃,在通过一些渠道进入市场的时候一般会被用作山寨缓存盘,如果用来做SSD的话就会对售后这些造成不少麻烦,所以黑片的SSD应该还是比较少的,但也不排除一些较非常差的SSD会使用这种颗粒。 然后就是白片,白片就是虽然经历过了晶圆厂的筛选,但不一定或者没有通过原厂的故障检测,这种颗粒一般会被二线或者三线的硬盘厂商采购,例如你拆开某个SSD看见闪存颗粒没有晶圆厂的标记(例如英特尔,三星,海力士,东芝等),那么这种颗粒采用的闪存颗粒很有可能就是白片。不过硬盘厂商也会对这些白片进行筛选,检测合格可以用的这种就被称为白片,虽然硬盘厂商对晶圆的检测不如晶圆厂那么严格,但白片至少是硬盘厂商检测过的,质量还是有一些保障的。 最后是原厂颗粒,原厂颗粒一般都是顺利通过了晶圆厂原厂的筛选和故障检测,一般会在芯片表面印上晶圆厂原厂的信息,正品比较贵的固态一般就会采用原厂的颗粒,一些比较好的颗粒也会用在一些比较高端的固态上,例如英特尔的企业级固态。 有些颗粒较差的固态就会这个问题,例如读取速度虽然还行,但写入和4K性能就会非常的低,这里给大家普及一下4K随机读写性能。4K随机读写性能代表了硬盘对数据的吞吐能力,有些时候硬盘在进行数据读写能从一个位置顺序读写的几率并不高,这样就会根据需要从磁盘的某个扇区抽取或者往其中写入数据,这样的性能指标就用4K随机读写性能表示。随机读写性能的好坏就直接反应了硬盘的瞬间响应能力(我们在使用固态硬盘传输文件的时候出现传输一个大文件虽然速度很快,但在传输很多零碎的小文件速度很低的话,这就是固态硬盘4K性能不高的原因),所以持续读写只是固态硬盘的其中一个性能指标,4K随机读写性能也是反映磁盘的读写的性能指标之一。 因为楼主也才疏学浅和学艺不精,其中可能会有错误和不准确的地方,如果有的话就希望大家指出。
【讨论】VEGA56的HBM2显存在某些方面真的还是有优势的 话说Vega56的HBM2显存的超大位宽我个人认为在某些方面相比GDDR5显存的1070和1070Ti还是有优势的,下面发表一下我的一些想法,如果说的不好的话请轻喷,楼主在这些方面懂得也不是太多。 首先HBM2显存的位宽是很高的,像VEGA56和64都有2048的位宽,这也是GDDR显存达不到的,位宽指的就是显存一次能传输的数据量,位宽越大的话一次能传送的数据就越多,显存位宽有时候也会决定显存带宽的大小。 从显存之间会来回传输贴图数据的情况就拿3DS模拟器Citra来说,Citra模拟器在运行时就需要经常在主内存和显存之间来回传输贴图数据,虽然大多数电脑游戏不需要反复传送贴图数据,通常是初始化时一次把所有贴图都传送至显存就完事了,但3DS实机允许主内存和显存间反复传输,Citra模拟器为了支持3DS游戏也必须要这样不断的来进行传输,于是在这里HBM2显存高位宽能传送更多数据的优势就显现出来了。 今天用模拟器玩游戏的时候,把分辨率开到最高的时候我也关注了一下显卡占用,在玩游戏的时候显卡占用也有40到50以上,玩了一个多小时温度也只有50度不到,这里让我感到惊讶的就是昨年我拿RX580玩的时候,玩的时间不长,但RX580发热却非常厉害,有时候温度也会到60度到70度,用手去摸也会感到非常的烫,当时的功耗我记得也有点高,有些地方的稳定性也会受到影响和有点卡,现在用显存位宽高的Vega56玩完全没有这种问题(有可能也是模拟器有了优化的原因),虽然显卡的占用比较高,但功耗也不怎么高才20来瓦(Vega在满载的时候功耗还是很高的),这里我就觉得是HBM2显存带来的优势。 同样Vega56多一些的流处理器(Vega56有3584个流处理器和1080Ti一样),HBM2显存的大位宽在某些专业应用中也更有优势,例如深度学习,3D渲染等。在高分辨率的情况下也有很大优势,例如1920x1080的分辨率就要至少需要128位的显存位宽才可以。 另外还有一个要求助的地方就是请问HBM2显存的频率是怎么算的呢?像1070的GPUZ参数显存频率那里的2000,我知道乘以4得到的8000就是GDDR5的显存频率,那Vega这里800的显存频率实际上是多少呢?还是HBM2显存本身频率就不高呢?这里还是有点不懂所以请教一下,谢谢大家。
【讨论】关于X99平台使用了一段时间以后的一些想法 楼主年初入了X99和E5 V3想着后面等好U用,因为听说过之前在E5 2670和3960X性价比特别突出的那段时间,就是X79最火的时候,再加上还没有玩过旗舰平台,X58和X79的话因为我个人经验不多所以还是先玩了X99,目前X99平台使用了一段时间还是有了一点自己的想法,如果说的不好希望大佬轻喷。 感觉X99目前来说还是缺少性价比,核心多主频低的E5相比锐龙和高频的8700K在来说,感觉还是并没有太大的优势,尤其是比较吃单核的游戏或者程序。而且目前来说好一些的E5也还是非常贵,并没有什么性价比,便宜的大多数也是ES版的CPU,而且是不显的那种,ES版的CPU如果步进相比正式版相差太大的话还是有一定风险的,没有经验和很贵的情况下我个人也不太推荐选择,E5 V3也因为睿频鸡血的原因不降反涨,例如2683 V3我听说以前2000不到就可以拿下,但目前也涨到四五千了。 不过X99平台的i7情况还好,四年前的旗舰5960X目前3000左右就能买到了,前年首发价1W4还是1W6的6950X,目前散片只要4000到5000就能拿下了,i7 6800K的话刚上市的时候好像也要三四千,目前1200左右就能买到了,6核心12线程,15M三级缓存,在睿频加速3.0下单核在可以到3.8,不过6800k美中不足的就是PCIE通道只支持28条,完整的是40条,但不组多卡和使用很多PCIE设备的话,看起来还是不错的。如果后面6950X像3960X那样1000就能拿下的话,我还是会搞个玩玩的。 主板的话目前还面临的一些问题的话,就是预算不高的情况下很难买到好板子,便宜的高端板大多数也是官翻货或者洋垃圾,条码一般被撕或者被涂的那种,这种板子厂家也不会再为质保和售后买单,存在的问题就是质量良莠不齐,也可能会有打孔或者修补过的板子,因为X99平台也算是小众的产物,尤其是高端板国内淘汰下来的肯定不多,所以大多数还是来自洋垃圾拆机。 X99平台的优势的话还是在于内存可以支持四通道,上多核的E5也能数框框,也是最后可以支持至强的家用主板,Intel在6代开始似乎就不再让至强上家用主板了,例如E3 V5系列就必须搭配C230系列的主板使用,不支持100和200系列的主板,LGA2066平台的至强W好像也只能上C422芯片组的板子,不支持X299。 最后在预算高和有折腾能力的情况下我个人认为觉得X99还是值得一玩的(个人观点),不过以玩游戏为主的话我个人就不太推荐上E5,E5 1600系列虽然有些单核性能很强,但还是比较贵。2600系列单核看样子主频比较高的E5在多核心占用和满载的情况下还是会降频,例如我现在使用的2618L V3单核看样子能到3.4很高,但全核满载只有2.5,而且因为TDP设计只有75W的原因,再加上我做一些东西对稳定要求还是比较高,所以之前弄的睿频鸡血补丁还是失败了,我还是把主板最新的BIOS刷回去了。2699 V4也是这样,虽然单核最高可以到3.6,但全核满载我听说只有2.8,应该有TDP限制的原因,2699 V4的TDP设计是145W,2679 V4的TDP设计是200W,2679 V4应该也是E5 V4中TDP设计最高的吧(为工作站设计的2687 W系列好像是150到160W) 关于X99平台的一些东西目前先说这么多吧,后面有想到的话再补充,挤在一起内容比较多希望大家谅解,因为分开发还是容易被吞,同样欢迎大家补充。
【总结】笔记本CPU温度和功耗的限制对性能造成的影响 由于笔记本受限于身材和便携的属性,不可能配备非常好的散热和功率比较高的电源适配器。为了兼顾散热和续航时间,就会存在温度和功耗的限制了。 首先是温度的限制,我们知道CPU的发热量和它们的负载有关,越高端和性能越强的处理器在高负载运行的情况下温度就会越高。 为了避免CPU因为高温导致死机或者损坏硬件,因此每一款笔记本的CPU和显卡都有温度限制。 以Intel的CPU举例,每一个CPU都存在过热保护的设计,这就可以理解为CPU核心和所在的电路板之间能容许的最大温度,如果CPU核心突破了这个温度就会有烧毁的危险。 而温度限制也是笔记本厂商可以配置的,举几个例子 当CPU温度小于60度时,不做功耗限制。 当温度大于60度时,加大风扇的转速和风量进行降温。 当温度大于70度的时候强制CPU降频(大多数应该是这样的),温度大于80度的时候强制重启或关机… 这时候就和笔记本厂商做的配置有关了。 举个例子,同型号CPU的笔记本,如果笔记本A的CPU温度限制设置到50度就开始降频,而笔记本B的温度限制设置到70度才开始降频,这样看来笔记本B的CPU在高负载下就能可以占优势了,因为它可以更长时间运行在较高的频率上。 不过同样和散热有关系,如果笔记本A的散热非常好的话,也能减少CPU因为温度限制而导致降频的几率,如果笔记本B的散热比较差的话,即使温度限制配置的再高也逃不了降频的宿命。 但还有另外一种可能,散热明明可以承受70度的考验,但CPU温度限制却被设置到60度,这便是笔记本厂商对CPU的保护机制。 笔记本的CPU因过热降频很好理解,但还有个问题,为什么笔记本在玩游戏和做CPU烤机的时候中途会突然降频呢?原因很简单,笔记本对CPU除了温度限制以外,还有一个限制便是功耗限制。 举个例子,i5 7200U的最大睿频明明可以到3.1,可是有时候在实际应用中却很少能保持最大睿频运行,甚至实际能达到的最高主频和睿频还有一些差距。是什么原因呢? 还有低功耗版的处理器在长时间玩游戏的时候突然变卡,打开任务管理器发现了降频,但此时CPU的温度并不高,在高负载下运行总是导致降频,以上这就是功耗限制对笔记本CPU造成的性能影响。 要注意功耗和温度是相辅相成的,性能决定功耗,功耗决定发热,功耗越低所带来的温度越低,功耗越高所带来的温度越高。 笔记本CPU无论是超过了所配置的温度限制或者功耗限制,都逃不了降频的宿命。 首先是热设计功耗TDP的介绍,TDP的是Thermal Design Power的简称,简单来说就是以瓦特为单位的热设计功耗,表示CPU所有活动核心在英特尔定义的工作负载下,以基本频率运行时消耗的平均功率。 除了温度限制以外,移动版处理器的功耗(TDP)也是可以限制的,同样也和厂商的配置有关。 拿i5 7200U举例,标准TDP设计为15W,最大可以配置为25W,最小可以配置为7.5W,另外M3 7Y30最大TDP可以配置到7W,最小可以配置到3.75W。 这样厂商便可以针对散热的设计和续航时间的考虑来对i5 7200U进行7.5W到25W之间的TDP配置。 如果厂商把i5 7200U的TDP配置到最高25W,那么这颗TDP配置为25W的7200U已经超过了TDP配置为15W的7500U,便可以更长时间的保持高性能运行,但同样散热也是很重要的,否则因为温度限制的原因也会降频的。 如果把7200U的TDP配置到最低7.5W,那么这颗TDP配置为7.5W的7200U相比配置为最高7W的M3 7Y30就差不了多少了,此时TDP配置为7.5W的7200U并不能强于7Y30多少。 这就是TDP的原因导致了性能的影响,更高的TDP配置可以提升CPU的基础频率,可以让CPU更长时间运行在睿频加速的最高频率上,以增加了功耗和耗电换取了更高的性能,更低的TDP配置则是反过来,降低CPU的基础频率和峰值睿频,以降低功耗来换取更低的发热量和更长的续航时间。 另外低压版处理器的核心电压设计只有0.7V,要注意如果自己将TDP调高的话,是可能要调整核心电压的(Core Voltage Offset),给CPU调整核心电压是可能存在一定风险的。 总之TDP也决定了CPU对散热的需求,功耗设计越低的低压版处理器性能也会变低,4.5W的超低压版酷睿M无疑要落后于15W低压版和45W的标压版CPU。 英特尔移动版处理器带Y的为超低电压版(Extremely Low Power,TDP设计为4.5W),例如Core m3-7Y30/6Y30等。 带U的为低电压版(Ultra Low Power,TDP设计为15W),例如i5 7200U,i7 7500U等。 带HQ的为标准电压版(TDP设计为45W),例如i5 6300HQ,i7 7700HQ等。 带U或者Y的低压版处理器比较适合长时间的续航和轻度办公,对性能要求比较高的任务还是要交给标压版的处理器或者台式机处理。
1 下一页