145721767XS
145721767XS
签名是一种态度,我想我可以更酷...
关注数: 21
粉丝数: 262
发帖数: 19,425
关注贴吧数: 11
给无脑吹捧DLSS2.0的人泼一盆冷水 最近几天,各路水军纷纷出动,大吹特吹几个过气游戏用上了DLSS2.0后多么的**, 画面清晰度吊打原生分辨率,帧率比原生分辨率高一大截。然而,DLSS2.0并没有那么神奇。 先看看德军总部新血脉的2个截图,注意看右侧纸箱的纹理细节,细节好的是游戏自带SMAA+外挂reshade FXAA, 其实还有细节更好的游戏自带SMAA+外挂reshade SMAA,但是抗锯齿效果稍差一点。细节差的是游戏自带的TSSAA(8TX),也就是TAA,可见TAA对解析力的影响很明显。某些人就是拿TSSAA对比DLSS2.0质量模式,然后吹捧DLSS2.0比原生分辨率更清晰。事实上,开了TSSAA(TAA)后已经不能代表原生分辨率,都加上了模糊的后置抗锯齿,有效分辨率已经大幅度缩水。
给无脑吹捧DLSS2.0的人泼一盆冷水 最近几天,各路水军纷纷出动,大吹特吹几个过气游戏用上了DLSS2.0后多么的**, 画面清晰度吊打原生分辨率,帧率比原生分辨率高一大截。然而,DLSS2.0并没有那么神奇。 先看看德军总部新血脉的2个截图,注意看右侧纸箱的纹理细节,细节好的是游戏自带SMAA+外挂reshade FXAA, 其实还有细节更好的游戏自带SMAA+外挂reshade SMAA,但是抗锯齿效果稍差一点。细节差的是游戏自带的TSSAA(8TX),也就是TAA,可见TAA对解析力的影响很明显。某些人就是拿TSSAA对比DLSS2.0质量模式,然后吹捧DLSS2.0比原生分辨率更清晰。事实上,开了TSSAA(TAA)后已经不能代表原生分辨率,都加上了模糊的后置抗锯齿,有效分辨率已经大幅度缩水。
从XBOX Series X的300W电源分析RDNA2架构能效比 游戏机的GPU没有睿频,固定1825MHz,比公版RX5700XT的实际频率还高一些,而公版RX5700XT仅仅 显卡就已经225W!
RDNA架构白皮书翻译
RDNA架构白皮书翻译
推荐一个极致能效比的显卡电压频率设置方案 相比
[email protected]
设置方案,
[email protected]
设置方案的GPU功率下降了37%! 对于游戏帧率的影响,同场景从36帧下降到31帧,可以接受。如果你对显卡温度和功耗非常敏感,那么 非常推荐这个设置方案
双卡交火已废,但是做科学运算还不错 近3年的新3A游戏大多是不支持双卡的,可以说用双卡交火玩近3年的大多数3A跟单卡一样帧率,那么 有什么办法发挥副卡的作用?Folding@home作为一个古老的分布式公益计算项目,还是不错的。 考虑到是公益项目,因此提升显卡能效比是首先要考虑的目标,把电压调到尽可能低是最好的途径。
RX5600XT越级吊打GTX1660TI 2A 3A游戏部分,9个主流游戏平均领先20%,而6个网游平均领先11%,需要注意的是全部都是特效全开的表现。如果特效设置最优化,那么领先幅度进一步拉开
1399元的非公版5500XT比起1650super 4G那是真的OK 1650super真是质检卡,卖1200到1500块钱却才4G显存,老黄的刀功真是恶心用户。而5500XT 8G首发价1399,性能极为接近GTX1660
RX5700M笔记本性能预测 RX5700的功耗墙-33%~-38%就是RX5700M的功耗墙,TDP是120W,那么GPU功率限制大概90多W。 在-38%功耗墙后,RX5700跑分9500,如果是-33%功耗墙跑分9900。作为比较,RTX2070移动版的跑分是8900分。20系FSE跑分稍微低点,真实性能是FSE跑分*1.06左右。这样计算,可知RX5700M性能介于RTX2070移动版到RTX2080移动版之间
傲慢与偏见之涡轮散热显卡 说起涡轮散热显卡,貌似舆论对于N卡与A卡的态度完全不同,对于N卡就各种赞美,对于A卡就各种“直升机”“大火炉”,这么明显的双标,暴露了舆论思考问题的方式:用屁股而不是用脑子对于A卡的公版涡轮散热方案,认为是“乞丐版”,却直接无视N卡售价过万的TTXP TTV RTX8000用的也是涡轮散热,难道这些显卡也能称为“乞丐版”?RTX8000售价10000美元,TDP250W以上,显卡满载运行触发温控降频是肯定的,然而还是有不少人对其垂涎三尺
教你提升【战争机器5】游戏画质 先上截图,建议用电脑观看,你拿着手机小屏幕看是不太明显的2560*1440屏幕分辨率,画质是“极高”,可见很清晰,基本消除了游戏强制TAA带来的模糊和失真
禁用曲面细分的RX5700跑3DMARK11 X分有多猛 有经验的玩家就知道3DMARK11 X模式绝对是A黑,HD7970都打不过GTX660TI。距离3DMARK11发布已经到现在快9年了,虽然AMD在曲面细分方面做出了很大的努力,RX5700曲面细分性能相比HD7970提升了几十倍,但是实测结果却让我感到意外
AMD炮轰英伟达:《巫师3》“海飞丝”特效毁了A卡性能 NVIDIA的Hairworks特效看起来效果不错,但对A卡来说是个陷阱
玩家请愿:《巫师3》请支持A卡的“海飞丝” 《巫师3》支持NVIDIA HairWorks头发特效技术,N卡可以跑得很流畅,A卡却被严重拖累。对此,NVIDIA自然会很得意,AMD则无奈地表示玩家们可以降低曲面细分倍数来救急,稍后他们也会发布优化驱动。 其实,AMD更早地提出了一个类似的技术TressFX Hair,并用于《古墓丽影》等游戏,“杀出重围”系列新游戏的新引擎也会支持它,而且该技术已经完全开放源代码,对任何显卡都是公平的。 NVIDIA HairWorks则是封闭技术,只对自家显卡优化,而且非常依赖自家架构擅长的高倍曲面细分,就导致了这种局面。《巫师3》这款游戏上,NVIDIA又通过GameWorks合作项目与游戏开发商CD Projekt Red走到了一起,为自己的硬件进一步优化。 其实这事儿也不好说谁对谁错,毕竟自己的技术,自己有权选择为自己的产品服务,但玩家们可无法接受了,尤其是A卡用户感觉被NVIDIA和CD Projekt Red给联合歧视了,纷纷抗议。 Reddit网站上,著名的游戏社区PC Master Race放出话来:“记住我的话。如果我们不拦住NVIDIA GameWorks这种反竞争行为,终究有一天,大家玩的游戏就只能在一种GPU上运行!” 这个帖子迅速被顶上天,95%的玩家都表示赞成此观点,希望CD Projekt Red能够公平对待厂商和玩家,加入对AMD TressFX Hair技术的支持。 不过时至今日,CD Projekt Red并没有做任何表态,看来大家抗议得再强烈,人家也是有合作在先,不会轻易改变的。 还是等AMD的新驱动吧,或者就别开那么高的曲面细分,或者干脆关了这个技术就是了。TressFX Hair上两家显卡效率持平,HairWoks上A卡惨不忍睹
分享一个几乎所有游戏可用的Reshade SMAA RIS补丁 效果图,这是用了补丁之后,关掉了游戏自带的MSAA和后置处理抗锯齿以及锐化。SMAA默认开启,RIS默认关闭,需要RIS锐化的话,在游戏中按一下home键,然后在左侧弹出的菜单里勾选RIS即可,建议只勾选一个RIS,如果2个都勾选就锐化过度画面有些失真。SMAA取代MSAA是必须的,帧数损失只有5%到8%,而且可以处理树叶和草丛的锯齿。相比MSAA4X动辄30%以上的帧率损失,SMAA简直是无敌。SMAA画面清晰,采用的是边缘侦测机制抗锯齿,不像FXAA TAA那样造成画面细节丢失模糊。
分享一个几乎所有游戏可用的Reshade SMAA RIS补丁 效果图,这是用了补丁之后,关掉了游戏自带的MSAA和后置处理抗锯齿以及锐化。SMAA默认开启,RIS默认关闭,需要RIS锐化的话,在游戏中按一下home键,然后在左侧弹出的菜单里勾选RIS即可,建议只勾选一个RIS,如果2个都勾选就锐化过度画面有些失真。SMAA取代MSAA是必须的,帧数损失只有5%到8%,而且可以处理树叶和草丛的锯齿。相比MSAA4X动辄30%以上的帧率损失,SMAA简直是无敌。SMAA画面清晰,采用的是边缘侦测机制抗锯齿,不像FXAA TAA那样造成画面细节丢失模糊。
9102年居然有这么垃圾画质却高配置需求的游戏,虚幻4垃圾! 图一是最高画质1440P,图二是三高(纹理 视觉 树叶)其他低。讲真,这画质被2007年的孤岛危机1捶爆!画面太模糊了,TAA强制开启而且找不到方法关闭。关键这虚幻4引擎打造的游戏配置需求贼高,RX5700高画质经常掉到50帧以下。虚幻4游戏引擎的游戏,除了微软的战争机器5,其他的真是一无是处,全是渣优化,尤其是对A卡极度不友好
实测RX5700在地铁离去游戏中开启曲面细分损失多少帧率 先看看隔壁N卡的情况,开启曲面细分损失不到10%帧率
用录制视频实测告诉你地铁离乡的曲面细分有多影响帧率 显卡是RX5700公版,帧率80的是关闭曲面细分(不包括曲面细分毛发),帧率66是开启曲面细分。可见,帧率影响高达20%!!
解析为何AMD PPT与媒体测评差距很大 上个月的E3发布会,ryzen3000系列给我们留下不错的印象,3900X在PUBG中帧率比9900K还高, 而3800X又比9700K帧率高。
GTA5的抗锯齿有毒 以上为测试情况,显卡是RX470 8G。可见1440P开MSAA2X帧率跟1800P差不多,相比不开抗锯齿的帧率, MSAA2X帧率只有70%!如果是MSAA4X,那么帧率只有不开抗锯齿的55%! 正是因为GTA5这个游戏A卡开MSAA帧率损失大,不少别有用心的媒体测评就有意开MSAA2X甚至4X,由于A卡 帧率损失百分比远大于N卡,因此就可以达到他们的目的,比如b站转的一个油管视频6471817
荣耀8x和红米note7 同为1399价位的手机,看看去年9月开售与今年1月开售的两款机子啥情况。京东评价数量,荣耀8x是红米note7的6倍。
王者荣耀2.0优化真不错 b站这个视频
RX470交火测古墓丽影暗影最高画质
RX470交火玩古墓丽影暗影真不错
年度驱动注意事项 8)Auto-GPU,Memory Overclock和Auto-GPU Undervolt兼容:AMD Radeon™RX Vega dGPU系列产品。支持:Windows®7/ 10。Fan Curve,Zero RPM和Memory Tuning兼容:AMD RX系列dGPU产品。支持:Windows®7/ 10。解锁的Radeon™RX Vega系列DPM状态兼容:AMD Radeon™RX Vega dGPU系列产品。支持:Windows®7/ 10。超频AMD处理器,包括但不限于改变时钟频率/乘法器或存储器时序/电压,超出其库存规格运行将使任何适用的AMD产品保修失效,即使通过AMD硬件和/或软件启用此类超频也是如此。这也可能使系统制造商或零售商提供的保修失效。用户承担超频AMD处理器可能产生的所有风险和责任,包括:
貌似解锁温控的MTK X20M刺激战场流畅加极限帧率开车比骁龙820强 同样解锁温控,MTK X20M手机比骁龙820,在同样流畅画质极限帧率,普通场景可能骁龙820凭借GPU优势而强点,但是开车时候就不一样了,受限于渣渣CPU,骁龙820开车掉帧很厉害。
20系显卡其实类似AMD Vega在重蹈覆辙 AMD Vega64系列显卡,原来是为专业用途设计,加入25T浮点的FP16运算单元,以及IF总线,并且采用HBM2显存,导致晶体管数量从FIJI的89亿膨胀到125亿,然而跟游戏性能息息相关的流处理器和ROPs数量却没有任何添加,于是Vega64的游戏性能就只相当于8G显存版Fury X超频到1400+MHz频率。
RTX2080《最终幻想15》benchmark 这是benchmark程序统计的平均值(也就是跑完后上传给官网的分数)。可见同为1440p标准画质下(基本上Gameworks特效不开),RTX2080与GTX1080ti几乎没差距。而1440p高画质(其实就是最高画质,开所有gameworks特效)会拉开点差距,可以RTX2080开启gameworks特效后帧数损失百分比较小。这个benchmark基本代表了传统游戏的表现情况
RTX2080游戏测试偷跑 先来看看没有特殊加成(对老卡是负优化的特效)的游戏
[08-14]讨论☆小米该改名红米了 1299元以下的产品占比已经高达77%,对应的就是红米子品牌。
Mate10 pro这跑分如何
讲真,荣耀play和小米8se杠上了
什么?发哥的X20M也能吃鸡了(滑稽) 625代码镇楼
X20m表示只开9核都能追平骁龙636 跑安兔兔时候只能关掉一个A53,而且是中频率的那个,否则必定在多线程测试环节重启,原因未知。
吹死婊活?农药10已经破100万销量 尽管贴吧、数码软文和视频网站有大量贬低这款手机的消息,但是发售至今才20多天就出货超过100万台。没有十全十美的手机,只有适合自己的,你们说是不是
吹死婊活?农药10已经破100万销量 尽管贴吧、数码软文和视频网站有大量贬低这款手机的消息,但是发售至今才20多天就出货超过100万台。没有十全十美的手机,只有适合自己的,你们说是不是
腾讯已经部分做出妥协 看图吧,新加一批o2t模式机型支持,应该是腾讯被骂多了,不得不做出一定的妥协,就跟去年收钱才给“高帧率模式”,今年全面放开“高帧率模式”那样。这次,所有麒麟970机型更新后默认就是o2t模式,需要注意的是更新后需要重启游戏才生效。以后,黑麒麟970不适合玩游戏的难度又提高了!
7核版X20对比9核版X20跑分 7核心版X20,已手动关闭3个A53小核,得分11万!
大米测评的严重错误 美女镇楼
625的游戏性能差的根本原因已找到 极为感人的单通道32位DDR3 1866内存,带宽只有7.46G/s,结果就是王者荣耀开不开描边的帧数有巨大差别。
老子打儿子?实测王者荣耀MTK X20对骁龙626 MTK X25跑分镇楼
打GT1030只需要2200G而已
国外网站爆料相关信息 采用AMD Navi架构 多玩游戏网04-04 11:40 国外SemiAccurate日前爆料了索尼PS5的相关消息,这家网站曾经爆料过NX(如今为NS,但确实是任天堂和英伟达合作),在2012年爆料了PS4的配置,2013年爆料这款主机会有升级版本,如今爆料PS5难免让人在意。 不过由于详细内容要花1000美元订阅才能看,所以我们来看看resetera上id为Jawbreacher的用户对于这个消息的汇总: -PS5用AMD's Navi作为基本结构. -CPU是Zen -大量的开发用机已经送到开发者手中 -考虑到开发机发出的数量,2018年发售并非没有可能 -VR并没有被索尼放弃
纠正关于TTV才能玩光线追踪的传言 近几天,光线追踪特效加入实时渲染游戏的消息引起了我的关注。这里引用一部分消息:然而其实AMD并没有花太多的笔墨介绍太多,在公布的两款视频当中,首先是介绍加入实时光线追踪的ProRender将会融合目前光栅化渲染的快速、高帧率的优点,还有光线追踪带来的照片级别的画面合为一体,最后就是基于Vulkan API,当然面向GPUOpen开源计划还是比较让人欣慰的。至于新版的Radeon GPU Profiler,则内置逐帧性能分析工具RenderDoc,不过你应该会轧线,其实AMD并没有就光线追踪方面公布太多内容,大家还是继续等待GDC 2018的后续吧。
1080P+Gameworks on VS 1440P+Gameworks off Gameworks on就是开启图上4个选项,off自然是关闭。 先看看开关的效果对比,上为off,下为on,比较明显的区别是草到的建模了,开了Turfeffects后会 对草丛进行暴力曲面细分,负作用是严重的锯齿,除非开TXAA,但是TXAA的模糊感很重帧数情况就是这样了,这里拿GTX1080作为比较对象,1080P开Gameworks是69fps平均帧数, 1440p关Gameworks是68fps平均帧数,两者几乎一样帧数。从视觉效果来说,1440P不开 Gameworks毫无疑问完爆1080p开Gameworks,显得Gameworks特效非常鸡肋。不过Gameworks 特效还是可以选择性开启的,Hairworks特效对帧数的影响不大,可以开启,其他的特效就没意思了, 远不如用在更高的分辨率对视觉体验提升来的明显。 如果是AMD显卡,那就乖乖把特效选“高”等级,Gameworks特效开个Hairworks即可,把节省出来的资源 用来获取高帧率或者高分辨率,更有意义
1080P+Gameworks on VS 1440P+Gameworks off Gameworks on就是开启图上4个选项,off自然是关闭。 先看看开关的效果对比,上为off,下为on,比较明显的区别是草到的建模了,开了Turfeffects后会 对草丛进行暴力曲面细分,负作用是严重的锯齿,除非开TXAA,但是TXAA的模糊感很重帧数情况就是这样了,这里拿GTX1080作为比较对象,1080P开Gameworks是69fps平均帧数, 1440p关Gameworks是68fps平均帧数,两者几乎一样帧数。从视觉效果来说,1440P不开 Gameworks毫无疑问完爆1080p开Gameworks,显得Gameworks特效非常鸡肋。不过Gameworks 特效还是可以选择性开启的,Hairworks特效对帧数的影响不大,可以开启,其他的特效就没意思了, 远不如用在更高的分辨率对视觉体验提升来的明显。
NV要搞事情了!ROG牌AMD显卡或许不再有
探索AMD Vega深度学习 AMD最新发布的Vega架构具有几项独特功能,可用于深度学习培训和推理工作负载。 第一个值得注意的功能是FP16的速度是FP32的两倍,INT8的速度是FP32的四倍。这意味着FP16的峰值性能达到24 teraflops,INT8的性能达到每秒48万亿次。深度学习工作负载已知可以在较低精度的算法下正常工作。就好像AMD建筑师意识到这一点,并设计了VEGA来利用这一特性。 Vega的第二个值得注意的特性是其新的内存架构,可以实现高达512GB内存的寻址能力。第三个好处是与AMD的ThreadRipper和EPYC系列微处理器有良好的结合。 深度学习(DL)技术与之前的互联网和移动计算一样具有革命性意义。目前人们对“人工智能”(AI)兴趣的复兴是通过深度学习取得的惊人成果推动的。还有其他AI技术,如专家系统,语义知识库,逻辑编程和贝叶斯系统。在过去的5年中,大多数经典AI的变化不大(如果有的话)。深度学习的进步推动了最近的跨越式发展。
震惊啊,免费版吃鸡完爆收钱版吃鸡 平底锅镇楼
免费版吃鸡美滋滋啊,锐龙APU无压力 平底锅镇楼
完全搞不懂8100有什么资格跟2400G相提并论 买了i3 8100的就不要出来秀智商了,你的8100只能跟默认频率的2200G比比CPU性能, 被超频后的2200G秒出翔,想要跟2400G比CPU性能就把i7 7700叫出来OK?
拒绝画面撕裂 游戏机支持Freesync有多大意义 发布时间:2017/07/24 来源:本站编译 作者:佚名 在去年PS4 PRO推出的时候,就有一部分发烧友在讨论今后游戏机与电视支持Freesync的可能性。根据今年4月eurogamer对XBOX ONE X的爆料,微软新主机将支持AMD的Freesync 2,主要来说就是可变刷新率,还有低延迟HDR。Freesync这个功能会给大家带来什么样的变化呢? ▲Freesync的功能示意 效果 画面表现是游戏机换代时大家最关心的部分之一。15年登台的Freesync是和画质,视觉体验联系非常紧密的新技术。像在PS3和XBOX 360的末期,许多游戏都出现了严重的画面撕裂,卡顿和抖动,这会带来明显的不适感,《忍龙3》《暗黑血统》的表现就让人记忆犹新。设备性能不足和显示器刷新屏幕的机制是产生这种现象的原因。Freesync的可变刷新率,能让显示器刷新的频率和GPU输出的帧率保持动态一致,从而消除撕裂,带来明显的游戏体验提升,这是单纯提升性能之外强化游戏体验的一个途径。 ▲Freesync的小年表 关于每秒帧率,显示设备刷新率,还有垂直同步的关联,我们可以通过这个表格来了解。 过去液晶显示器屏幕的垂直刷新率大多是固定60Hz的,这时候如果游戏运行的帧数高于60帧或者低于30帧,不开垂直同步的话,画面就会撕裂。撕裂并不是只发生在帧数不足的时候,性能过高帧数太多,不开垂直同步也会撕裂。虽然垂直同步会增加输入延迟,降低性能表现,但两害相衡,人们往往还是会打开这个功能。 支持Freesync的显示器会有一个刷新率范围,比如AOC的G2770PF,它的刷新率范围是35-144Hz,35就是最低刷新率,144是最高刷新率。当GPU输出的帧率大于等于显示器支持的最高刷新率,打开垂直同步的时候,我们能或得完美的画面表现。如果关掉垂直同步,画面会出现撕裂。当GPU输出的帧率完全落在范围当中的时候,开不开垂直同步都会有完美的表现。当帧率小于最低刷新率的时候,打开垂直同步能消除撕裂,但是画面会抖动,也就是每一帧的持续时间并不等长。关闭垂直同步,画面会撕裂,抖动会缓和。即便是支持Freesync的环境,官方推荐还是把垂直同步打开。Freesync当中还有一个叫低帧率补偿,Low Framerate Compensation (LFC)的子功能,显示器和GPU,程序,驱动都支持LFC的时候,即便游戏帧数低于30帧,通过补偿,画面抖动也会减轻。GPU性能不很强,帧数不太够的时候,体验也能有部分改善。 直观一点的效果可以看视频演示。 视频原址 至于低延迟HDR,简单来说就是,现在的HDR电视显示器,有部分需要设备自己完成的色调映射工序,这加大了输入延迟,对玩家而言并不是好消息。Freesync 2会让GPU完成这部分的工作,如此一来,只要游戏开发者使用AMD的API,显示器和GPU支持Freesync 2,HDR GAMING的输入延迟就会降低,新世代游戏的体验也会更好。 ▲低延迟HDR的原理示意图 意义 13年之后的AMD GPU都支持Freesync,搭配市面上支持Freesync的显示器,PC玩家已经可以在游戏中感受到Freesync,主要是可变刷新率这一条的好处。目前来说,这项技术主要还是面向中高端PC市场,普及速度不算很快。长远的看,DP1.2a规范中已经采用了Freesync的技术,HDMI 2.1规范中已经确定了Game Mode VRR,可变刷新率这个功能未来注定会成为电视游戏的标配。至于HDR,XBOX ONE S和PS4 PRO都已经提供了支持。今年的《地平线》中,我们就能感受到这个功能的魅力,像《战争机器4》等老作品也会通过更新支持。它的确能带来显著的观感提升,游戏机玩家从今年开始慢慢接受这个功能。低延迟的HDR算是HDR相关的进一步发展。 未来会普及,问题就是,这个未来离我们还有多远。据称,XBOX ONE X支持通过HDMI实现的Freesync,今后的游戏机不出意外微软和索尼会继续和AMD合作,也就是两家未来的游戏机都应该会支持Freesync,PS4 PRO也可能通过系统更新提供支持。游戏机作为消费电子产品,支持可变刷新率这项功能还是有些超前的,因为当下并没有什么支持它的大屏电视。显示器产品倒是已经比较丰富了。至于同时支持可变刷新率,和Freesync 2当中低延迟HDR的显示产品,目前只有三星预计将要推出的显示器CHG70和CHG90,这几款都还不是4K分辨率的。也就是说,4K分辨率,同时支持可变刷新率,以及低延迟HDR的显示设备,我们很要等上一段时间,选择才会丰富,价格才会变得更合理。 虽说超前了一些,但游戏机这种大众产品支持Freesync,还是很有价值的事情。如果新一代的XBOX和Playstation都支持它,Freesync在未来几年中就会新增数千万的用户基数,可以预料,这些用户的规模,他们获得更好视觉体验的需求,会有效拉动技术和新显示设备的普及。PC领域面向中高端市场的技术,会从这里变成造福大众玩家的普及技术。
深度学习的硬件之争关键年:NVIDIA, AMD, Inte 深度学习的硬件之争关键年:NVIDIA, AMD, Intel鹿死谁手? 搜狐科技01-11 14:26 大数据文摘作品 编译:新知之路、党晓芊、吴双、Aileen 随着英伟达Titan V的发布,我们迈入了深度学习硬件发展的动荡期。NVIDIA能否在2018年保住深度学习硬件首要供应商的地位还未可知,AMD和Intel Nervana都仍有机会。 所以对于想买硬件的消费者,最精明的选择就是等上3至9个月,到这种不确定的状态过去之后再决定。 深度学习芯片领域的竞争从未停止过。 NVIDIA决定在竞争初现端倪之前,先将自己的垄断地位变现。通过这种方式,他们希望在未来1-2年内确保行业领先,所以他们的Titan V的售价高达3000美元! 虽然Titan V的深度学习专用核心Tensor Core有着独特的性能,但性价比实在太糟,使其市场吸引力不足,只是现阶段除此之外又没有别的选择,所以至少当前就有什么用什么吧。 AMD的硬件水平已经赶超NVIDIA了,而且他们计划再开发出相匹配的深度学习软件。如果这一步实现的话,其性价比会轻松超越NVIDIA,并在此领域成为新的标杆。而届时NVIDIA就会凭借着雄厚的资金实力来拼市场,所以我们或许会在未来看到非常便宜的NVIDIA产品。注意这种情况是建立在AMD推出高质量软件的基础上——如果AMD跳票,则丧失了抢走桂冠的机会,而NVIDIA的产品将仍停留在高价位。 市场上还有另一位新晋竞争者:Intel Nervana的神经网络处理器(NNP)。凭借着几种迎合CUDA开发者需求的独特性能,它表现得还比较有竞争力。NNP处理器可以解决优化深度学习的CUDA内核中绝大多数的问题,这款芯片才真正称得上第一枚深度学习芯片。 通常意义上,对于单一芯片之间的排名,我们会按照Nervana > AMD > NVIDIA的顺序来排,因为NVIDIA的芯片不得不在游戏、深度学习和高性能运算中维持平衡,AMD也需要同时考虑游戏和深度学习,只有Nervana可以聚焦于深度学习,这是一个巨大的优势,使得他们的芯片较其他两家少了很多无用的结构设计。 然而,获胜者往往不是取决于纯粹的性能或者性价比,而是要综合考虑性价比+周边生态+深度学习框架。 让我们来仔细了解一下这三家公司产品的优劣,看看它们到底处于什么位置。 Nervana的神经网络处理器(NNP) 图:当前并没有专门为AI所设计的硬件产品,而Intel Nervana NNP帮我们摆脱了这种限制。 Nervana芯片的独特之处在于它为计算扩展出大空间的缓存(类似CUDA共享内存),相当于GPU的10倍,而单个计算单元的缓存是GPU的50倍。有了这种设计,其运算速度会提升至少一个量级,就可以在缓存内完成算法与模型计算并轻松地训练TB字节的数据(如一个带有200个单元的多层LSTM)。 得益于Flexpoint这个特殊的数据类型,Nervana的芯片能够在缓存/RAM内存储更多的数据并计算得更快。所有这些创新都意味着其比当前NVIDIA的GPU提速了10倍。这已经获得了初创公司以及一些大公司的关注。但是,所有这些的前提是他们能克服主要的问题:周边生态以及软件。 普通的用户和研究人员几乎完全依赖于芯片周边的生态系统。如果没有了这些,我们将无法使用缓存内的算法以及好的软件框架,从而无法更好的利用芯片。 所有人都希望使用可靠过硬的深度学习框架,而Nervana的深度学习框架Neon是否给力是值得怀疑的。软件使用优先于硬件支持,如果Nervana仅仅出品良好的芯片而不在软件以及周边生态系统上发力的话,他们将输掉这场竞争。 软件以及生态系统与价格紧密相关。如果Nervana 家的NNP价格定得太高,学生根本负担不起。虽然行业内的各种企业客户为硬件公司支付了绝大部分的收入,但仅凭产业化的应用是无法构建繁荣的生态环境的,学生群体才是促使硬件周边生态环境繁荣的主要驱动者。 只有当广大学生们可以支付得起之后,才会有众多配套软件得以涌现。任何超过3000美金的产品想都不要想;超过2000美金而且对学生有额外折扣的产品还凑合,没准会让人用用,一个2000美金的NNP还是会有一些接受度的;而如果产品低于1500美金,Nervana在2-3年内将会成为市场的主导者。 如果把价钱定在1000美金左右,那另两家竞争者将会非常痛苦,而配套的软件就会如雨后春笋,不再是个问题。 如果NNP的价格低于2500美金,我是肯定会买的。它的性能比GPU好太多,我可以用它来做好多原来无法在NVIDIA产品上实现的事。但如果它超过了2500美元,这是我能承受的上限,我看还是把钱省下来吧,虽然好的硬件非常重要,但我还需要钱来干别的呢。 对于一般的消费者来说,价格不是他们考虑的唯一因素,他们还会考虑到产品的相对应的周边生态。 如果Intel没有快速的将尽可能多的资源投入到该产品的周边生态并打造一个可靠的软件组成,那么NNP (The Neural Network Processor) 的发展就会停滞不前并且最终消亡。不幸的是,Intel 曾经因为对周边生态的管理不善而犯过这样的错误。如果发生了,这将非常让人失望,因为我真的很希望Nervana获得成功。 总体来说, 如果Nervana开发的NNP 可以把价格控制在2000美金以下,并且在这个产品发布之后的短短几个月内快速生成一个强大的周边生态和软件开发环境,那么这款产品将会击败它的同类竞争者而胜出。如果NNP的价格稍高同时周边生态略差,那它依然还是个不错的产品,只是就性价比和方便程度来说,它不能完胜它的竞争者们。当它的价格高于$4000美金或是不具备一个基本的产品周边生态的话,NNP甚至会完败。 对于高于$2000美金的NNP来说,如果希望它能对于一般学生有很好的新引力,那么该产品需要对学生有着相当程度的折扣才可以。 AMD:便宜又强大,软件方面还需努力 AMD的显卡非常的棒。Vega Frontier Edition 系列明显的要优于NVIDIA的相应产品,通过一项类似于对Volta和Pascal所做的无偏差标准测试,在使用液态冷却的前提下,Vega Frontier 的性能要持平甚至优于Titan V。值得注意的是,Vega是基于传统的图形处理芯片架构,而Titan V是全新的。这样,在2018第三季度即将发布的新一代AMD架构,将会有更加出彩的表现。 AMD希望仅仅通过把32-bit 浮点数运算的图形处理芯片换成16-bit,从而在深度学习硬件开发上取得成功。这是一个既简单又有效的策略。这样设计的GPU,虽然对于高性能计算没有什么用处,但是对于游戏玩家以及深度学习社群来说,这样的改变会获得更稳定的表现,同时由于16-bit浮点数运算显卡的运算非常直接,芯片的开发成本也会相应降低。 当然,如果单纯依靠性能指标来说,这样的改变不可能优于Nervana的NNP,但是就性价比来说,市场上所有的产品都无出其右。你可以仅仅花费$700美元就买到一款液态冷却的Vega Frontier 显卡,而它的性能比起$3000美金的Titan V仅仅差了一点而已。 然而最大的问题是软件。即使你拥有了这么强大的AMD GPU,你却很难使用它-因为目前没有一款主流的软件框架能够很好支持AMD GPU。 AMD自身也处于这个发展过渡期,关于软件的发展过渡期。目前来看,他们打算放弃OpenCL而转向HIP。但是他们现在官方依然支持OpenCL这种方法。 如果他们想推动HIP而且在未来九个月内投放一些很好的深度学习软件于市场(不仅仅是用来计算卷积和矩阵相乘的软件包而是一个完整的深度学习框架,比如说HIP可以支持PyTorch),那么,他们在2018第三季度即将发布的新一代GPU会获得巨大的潜力并且击败所有竞争者。 总体来说,如果AMD能够把它在软件方面所有棘手的问题处理好,那么毫无疑问它会成为深度学习硬件领域的主导力量。 NVIDIA: 地位坚固的硬件界大佬 NVIDIA 的江湖大佬地位毋庸置疑。他们拥有最棒的软件系统,最好的工具,他们的硬件很棒并且产品具备一个庞大,强壮并且完整的生态圈。 NVIDIA 的主要问题在于他们需要服务于多种使用者:高性能计算需求者,深度学习从业者,还有游戏玩家。这对于他们的硬件是一个巨大的压力。设计这些客户定制的图形处理芯片是非常昂贵的,因此NVIDIA的策略是设计一款多用途,适合所有框架的芯片,这项任务几乎很难完成。因此Titan V只是一个很中庸的产品。 伴随竞争者的出现,NVIDIA有两种选择。(1)不停的压低价格,直到拖垮对手,或者是(2)开发出属于自己的专有深度学习图形处理芯片。NVIDIA拥有足够的资源去打价格战,并且它也拥有足够数量的专家去执行第二套方案。然而,设计新型的芯片需要一定的时间,NVIDIA有可能在此间失去王者的宝座。所以,我们很有可能看到它会同时执行两套方案:打价格战拖垮推手,从而为自己设计出专属的深度学习芯片赢得时间。 总体来说,NVIDIA的王座受到了一定的威胁,但是它有足够的经验和资源去击败出现的竞争对手。我们很有可能在未来看到一个便宜的NVIDIA 显卡和专为深度学习打造的产品。不过如果NVIDIA 不去降价打价格战的话,它是可能(暂时地)失去王者的地位的。 深度学习硬件的混战意味着目前不是一个投资该领域的最好时机,但是这也同时意味着更便宜的NVIDIA 卡,可用性更高的AMD卡,以及超快的Nervana卡会很快出现。这是一个激动人心的时代,我们消费者将会从这样的竞争当中获得巨大的利益。但是目前,我们必须耐心等待。
首页
1
2
下一页