阳光炫斓 阳光炫斓
关注数: 6 粉丝数: 443 发帖数: 39,170 关注贴吧数: 14
AMD、微软甜蜜携手:一起搞加速计算 AMD、微软今天联合发布了“C++ AMP 1.2”,一个开源的C++编译器,主要用于异构架构的并行加速计算编程,而且首次同时支持Windows、Linux两大平台(之前仅支持Windows)。 2011年中,微软在AMD举办的融聚开发者峰会上首次宣布了C++ AMP,主要用来对抗开放性的行业标准OpenCL,通过利用Clang、LLVM加速和简化异构平台的开发工作,支持服务器、PC、移动设备。 C++ AMP 1.2的最大变化就是支持共享物理内存,而这正是AMD最新一代APU Kaveri的核心优势。支持该技术后,异构平台的CPU、GPU之间就可以畅通无阻,轻松共享数据。 C++ AMP 1.2支持大量的软硬件平台,并支持三种输出方式: - Khronos Group OpenCL:行业性质、应用最广泛的加速计算标准,支持AMD CPU/APU/GPU、Intel CPU、NVIDIA GPU以及苹果Mac OS X等任何兼容平台。 - Khronos Group SPIR:标准可移植中间件表示法,是业界第一个基于LLVM IR用于可移植异构并行计算的开放、跨平台中间件表示法标准,支持AMD CPU/APU/GPU、Intel CPU和未来兼容平台。 - HSA Foundation HSAIL:AMD引导HSA异构基金会提出的编程规范,支持AMD APU和未来兼容平台。 Open C++ AMP 1.2标准: http://blogs.msdn.com/b/nativeconcurrency/archive/2013/12/12/c-amp-open-spec-v1-2-published.aspx C++ AMP编译器最新源代码: https://bitbucket.org/multicoreware/cppamp-driver-ng/wiki/Home
HGST展示PCM相变技术SSD:300万IOPS,延迟低至1.5微秒 目前实测的IOPS性能不过70万左右,不过这是QD-1队列下的,高队列下IOPS性能还会提升 70万~ 在前几天的FMS全球闪存会议上,HGST除了发布2.7GB/s性能的PCI-E 3.0接口的FlashMAX III硬盘之外,还宣布了世界上最快的SSD,使用的虽然是PCI-E 2.0 x4接口,但是随机IOPS性能高达300万IOPS,而延迟更是低至1.5微秒,已经远远超过了普通的NAND闪存的SSD性能,因为HGST这次使用的是45nm工艺的PCM相变闪存。先来说说HGST的这个硬盘性能到底有多强大,首先是300万IOPS,目前主流的桌面SSD的随机性能普通在10万IOPS以内,PCI-E接口的可以达到十几万到几十万IOPS,比如Intel的750系列SSD就可以达到18万IOPS,企业级的PCI-E硬盘则能达到五六十万甚至更多,此前见诸报道的IOPS性能最高的SSD是源科的麒麟III PCI-E硬盘,512B数据随机性能最高也是300万IOPS。300万随机IOPS性能其实并不是HGST最自豪的地方,1.5微秒(µs)的延迟时间才是更关键的,普通SSD的延迟多在30-40微妙或更高,SLC规格的企业级PCI-E硬盘通常也要10微妙多,这还是随机写入的,随机读取延迟则要更高了,而HGST的硬盘只要1.5微妙,这在今天的NAND闪存技术上是不可能实现的。HGST依靠的就新一代的PCM相变存储技术,对于PCM相变技术我们之前也介绍过一些,PCM不仅性能更快,而且写入次数限制也堪比SLC,是未来最有竞争力的存储技术标准之一,IBM、三星、美光、Intel等公司都在开发PCM技术。 此外,为了降低延迟,HGST还与加州大学圣地亚哥分校联合开发了DC Express通讯协议。 HGST之前的媒体新闻中没有提供图片,不过PCper网站在FMS闪存会议上拍到了这个硬盘的实物图,它使用的是PCI-E 2.0 x4接口,目前的原型是全高尺寸,每个PCM模块容量是1Gb,45nm工艺制造。原文没有说PCM来自哪家公司,不过美光之前公告说已经开始出货45nm工艺的1Gb PCM闪存,HGST十有八九使用的是美光的PCM颗粒。
DP1.2a动态帧同步显示器有戏? http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.hardware.fr%2Fnews%2F13640%2Famd-freesync-proposition-adoptee-par-vesa.html&urlrefer=5599ac1037f127ddfd20ace19966ddd3 Il y a un peu plus de 2 mois, nous vous dévoilions que l'initiative 'FreeSync' d'AMD, réponse standardisée auG-Sync de Nvidia, était en bonne voie de se transformer en option pour le standard DisplayPort 1.2a actuel. Pour rappel, alors que le silence semble être la règle du côté de VESA, un lecteur bien informé nous avait alors indiqué qu'une demande de type SCR (Specification Change Request) avait été déposée de manière à intégrer le support optionnel de la fréquence de rafraîchissement variable au standard DisplayPort 1.2a. Cette proposition, représentée par un document daté du 25 novembre et intitulé DP1.2a Extend MSA Tmg Para AMD SCR, avait de toute évidence été soumise par AMD. Fin janvier, elle était au stade GMR (General Member Review) et donc en bonne voie d'être finalisée et ratifiée. Selon notre source, que nous remercions à nouveau, différentes discussions concernant cette proposition ont eu lieu dans le courant du mois de février entre les différents membres concernés de VESA et, bonne nouvelle, elle a bien été adoptée comme prévu. Depuis le 1er avril, et ce n'est pas un poisson, la liste des demandes SCR adoptées en mentionne une nouvelle : DP1.2a Extend MSA Tmg Param Ignore Option AMD. VESA et/ou AMD ne devraient donc plus tarder à annoncer officiellement l'arrivée de la fréquence de rafraîchissement variable pour le standard DisplayPort 1.2a. Reste bien entendu de nombreuses questions quant à son support en pratique puisqu'il sera optionnel. AMD a indiqué à plusieurs reprises que des écrans déjà sur le marché pourraient potentiellement supporter ce mode d'affichage, mais nous ne savons toujours pas si ce sera réellement le cas. Quand de nouveaux écrans pourront-ils être proposés ? Nvidia et Intel feront-ils en sorte de supporter rapidement et activement ce mode d'affichage standardisé ? Compte tenu de l'intérêt de la chose, nous ne pouvons qu'espérer que ces questions trouvent rapidement des réponses !
现有显卡都支持DX12?且慢…… http://tieba.baidu.com/p/2936153336 微软昨天发布了DirectX 12,在开发者最为关心的CPU限制问题上做了深入改进,同时还改善了移动平台的图形性能及续航时间。最关键的一点就是,微软宣称DX12几乎可以运行在目前80%的电脑上,AMD的GCN架构、NVIDIA的所有DX11显卡及Intel的Iris核显都能支持,但是新规范还没有完全定型,硬件支持上依然有很多不确定性,完全支持所有DX12特性恐怕还是得靠新一代硬件了。 目前发布的DX12规范可以看作两部分,第一部分也是最重要的部分就是底层硬件优化,提升了CPU的多线程能力,减少了驱动层的性能瓶颈,跟AMD的Mantle API目标是一样的。不管微软是否直接使用了AMD的Mantle API,这部分功能涉及的GPU硬件其实不多,此前Mantle的新闻也证实了NVIDIA的显卡一样能支持,所以才有如此多的显卡都能在第一时间支持。 DX12其实还有更多升级,提供了12个新的渲染特效,但是微软还没有完全公布这部分细节,这就有可能导致三家厂商的GPU支持发生分歧了。 首先是NVIDIA,虽然他们宣称包括费米、开普勒、麦克斯韦架构在内的DX11显卡都能支持DX12,但是跟之前的DX11.1/DX11.2一样,NVIDIA现有的DX11显卡都只支持到DX11 Feature Level 11_0,支持DX12的12个新功能依然有很大的不确定性。 因此,NVIDIA也在官方声明中表示由于微软还没有公布更多的细节,他们现在不便评论。 再看AMD,AMD宣称的是GCN架构也就是HD 7000及之后的显卡都支持DX12,而且AMD GCN架构的显卡也是一直完整支持DX11.1的,Hawaii核心的GCN 1.1架构还能完整支持DX11.2。这些显卡支持DX12的底层优化也是没问题的,但是对其中的12个新功能支持也是不确定状态。AMD表示也在等微软的详细消息,之后会公布一份支持DX12的显卡名单。 Intel方面暂时也没什么消息,不过对Intel核显的性能也没什么期待,下一代的Broadwell再说吧。 现在能确定的就是大多数显卡都能支持DX12中最重要的一个升级,类似Mantle的底层优化可以显著提升游戏性能。DX12还有许多3D特效更新,但是目前微软还没有公布细节,厂商也在等待消息,这就有很多的不确定性了。 考虑到DX12真正上市要等到2015年底,时间上还早,期间AMD、NVIDIA肯定还会有新架构产品发布,明年的产品完整支持DX12应该没问题了。至于现在的产品,能支持DX12关键性升级已经很有用了,12个3D特效对游戏画质及性能不见得比底层优化更有效。
[综合] 进击的Maxwell:VS GCN架构性能演进测试及展望 PCEVA论坛的1篇文章 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fbbs.pceva.com.cn%2Fthread-112599-1-1.html&urlrefer=d063a95d15c1b6a74d9fa50217883a29 前言: 首先要声明下:本篇测试的目的,只是讨论Maxwell架构带来的一些预期,方便我们展望后期拥有更高规模的Maxwell芯片及其对应的产品,而不是拿着7750/7770和750/750ti比来比去。 nVIDIA于今年2月18日发布了全新的Maxwell架构GPU,和以往不同的是,这次是低端核芯先行,也就是GM107芯片,同时也没有使用TSMC更新的20nm晶圆,还是和上代Kepler架构的芯片一样使用TSMC的28nm晶圆;这次Maxwell的架构相比Kepler又带来了一些的变化。 本次GM107芯片比较有趣的地方在于,一些基本的图形结构和数目和AMD早期的Cape Verde芯片非常相似,这也是触发本次测试的初衷,在上来Kepler和GCN的对比中,SP数目上和R7-260一模一样的GTX650ti被击败了,但由于频率和功能单元不一致,也不好比较,不过也能侧面佐证Kepler架构相比GCN也捞不着多少便宜(Tahiti和GK104之间由于GK104精简架构的区别,相对比较特殊,Hawaii和GK110芯片则比较类似),由于Kepler没有类似GM107架构的芯片,故选择GCN来比较,也能窥探出Maxwell架构在性能上提升的给力之处以及GCN后续性能跟进的落脚之处。 本次测试的样品:Maxwell和Kepler架构的比较: 这个是GM107的芯片。如果有了解的朋友,看到这张结构图,就应该知道和Kepler架构有了一些变化。Maxwell架构的SMM和Kepler架构的SMX的区别,直接看也许还有点凌乱,所以我整理成了对比图如下:从SMM和SMX的比较中,可以看出: 1、集群的SP数量下降了33%,配置的纹理单元下降了50%,每SP对应的纹理单元也下降了25%; 2、LD/ST、SFUs单元规模不变,FP64双精度运算单元再次下降; 3、逻辑控制器扩增了300%,每SP对应也大增450%; 4、SMM集群提供的单位性能下降10%,但每SP对应的效能大增35%;0006.png (60.61 KB, 下载次数: 419) 下载附件 保存到相册 2014-3-19 23:55 上传 架构对比中: 1、Raster引擎的吞吐量大增100%; 2、二级缓存容量大增700%;
游戏性能会暴涨!DirectX 11.2新特性2014年02月07日 00:24 出处:泡泡网 【原创】 作者:卓克 编辑:卓克    泡泡网显卡频道2月7日 简而言之,Windows 8.1用户将有望迎来更好的游戏性能。当然,实际细节比这句话略复杂,并且与DirectX 11.2中的TiLED Resource特性有关。而在一篇新的文章中,Matt Sandy从Direct3D团队那里稍微了解到了该特性如何工作的细节。   本质上来讲,就是TiLED Resources能够更好地分配内存、并带来更高效的数据流。理论上听起来很不错,但这一切意味着什么?"更好的帧速率、以及更身临其境的游戏世界"。Matt说到。    游戏中的每一幅画面,都用到了"纹理"(texture)。它们可以被认为是变形的多边形,当被拼凑到一起的时候,就组成了最终用户们看到的物体的样子。    而兼容Tiled Resource的显卡和游戏,只需要处理它有需要的纹理——而不是不管它们看得见、还是看不见,就一股脑儿的(傻呵呵地)全去做一遍。    通过减少纹理生成的工作量,处理器就能够释放出更多的时间和资源,最终带来的就是更流畅的画面。在博客中,团队还解释了在某些场景中的工作原理。 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.tudou.com%2Fv%2FCWEqxRrTf54%2F%26resourceId%3D0_04_02_99%26tid%3D0%2Fv.swf&urlrefer=6f77210def4a9c0c4170e7a89f0fbb8e    使用该技术之后,意味着仅有1%不到的纹理数据会需要实际处理——很难想象游戏性能会迎来如何爆发性地增长。    当然,微软在BUILD 2013大会上就介绍过该技术,感兴趣的网友可以重温下上面这段视频(时长46分11秒)。
AMD不学NVIDIA开放授权,更愿意走半定制化之路 http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.expreview.com%2F26255.html&urlrefer=dc4fc1cdf3f6033d9b15268a3b62fa0c  NVIDIA昨天宣布将开放Kepler GPU及图形专利授权给第三方Android厂商,只要交钱厂商也能获得类似ARM及Imagination那样的GPU集成解决方案。NVIDIA走向开放之路,那么AMD呢?后者尚未涉足移动处理器市场,似乎有更多的理由开放IP授权,不过AMD官方并不这么认为,他们不太可能开放GPU授权,更愿意走目前的半定制化路线。   Xbitlabs也就此事询问了AMD的意见,AMD嵌入式暨半定制业务部门发言人Travis William表示“目前我们对GCN架构以及图像IP授权一事无可奉告。此外,我们采取的是双管齐下的战略,(用户既可以购买AMD的成品)我们的半定制化业务部门可以向用户提供包括X86、ARM、多媒体以及我们领先的图形技术在内的各种IP产权组合,这种策略使确保用户获得业界独一无二的设计能力和定制化能力,我们有专门的工程师团队与客户联合设计基于AMD IP产权及半定制化IP的解决方案。”PS4和Xbox One主机是AMD半定制化业务成功的代表 他还说道AMD目前正致力于一系列传统PC之外的市场,包括智能电视、机顶盒、基础设施建设等等。正是这种策略驱使AMD为下一代主机PS4、Xbox One提供处理器。   简单来说AMD和NVIDIA的不同在于,后者提供计划允许其他厂商将NVIDIA的GPU架构集成到厂商自己的应用处理器中,AMD的做法是与第三方IP厂商针对各种市场联合设计芯片。   虽然AMD目前集中精力在半定制半导体业务上,不过收购来的ATI部门过去也是有IP授权业务的,微软以及任天堂之前及现在的主机上都使用了ATI的图形技术授权,所以AMD就算官方表态暂不考虑开放技术授权,但是他们也不会关上技术授权的大门的。
首页 1 2 3 下一页