腋穢黣 腋穢黣
关注数: 5 粉丝数: 77 发帖数: 3,218 关注贴吧数: 81
Intel 14nm高性能计算处理器预览:下代PHi Intel今天官方公布了代号“Knights Landing”的下一代Xeon Phi高性能计算处理器的一些细节,无论工艺、技术还是性能都比现在有了质的飞跃。x86做高性能计算完全不逊色于GPU。Knights Landing将首次采用14nm新工艺,而且不再必须搭配Xeon、作为协处理器,完全可以独立运行系统、软件,因而不存在CPU、PCI-E总线方面的瓶颈。它将整合下一代光纤网络“Omni Scale”,弹性极高,编程模型丰富,可以灵活配置。未来的14nm Xeon处理器同样会支持它。内存/显存也会整合封装进去,并且采用与美光合作开发的超高带宽立体存储,首发容量最高16GB,占用面积是GDDR5的三分之一,带宽是DDR4的五倍,能效是GDDR5的五倍。 Knights Landing CPU将采用专为高性能计算优化增强的Silvermont架构,没错就是现在Atom里使用的,加入了AVX512指令集。核心数量没有公布(怎么也得几十个),但是双精度浮点性能可超过3TFlops,是现在的三倍多。Knights Landing系统将在2015年下半年问世。美国国家能源研究科学计算中心(NERSC)就正在开发一套“Cori”,拥有9300多个节点,2016年上线,可为5000多名用户、700多个大规模科学项目服务话说Intel在高性能计算上真是很无敌,比如说这次的TOP500超级计算机,Intel就占了85%的系统,新上榜的更是97%都是Intel平台。
Intel 14nm高性能计算处理器预览:下代PHi Intel今天官方公布了代号“Knights Landing”的下一代Xeon Phi高性能计算处理器的一些细节,无论工艺、技术还是性能都比现在有了质的飞跃。x86做高性能计算完全不逊色于GPU。Knights Landing将首次采用14nm新工艺,而且不再必须搭配Xeon、作为协处理器,完全可以独立运行系统、软件,因而不存在CPU、PCI-E总线方面的瓶颈。它将整合下一代光纤网络“Omni Scale”,弹性极高,编程模型丰富,可以灵活配置。未来的14nm Xeon处理器同样会支持它。内存/显存也会整合封装进去,并且采用与美光合作开发的超高带宽立体存储,首发容量最高16GB,占用面积是GDDR5的三分之一,带宽是DDR4的五倍,能效是GDDR5的五倍。 Knights Landing CPU将采用专为高性能计算优化增强的Silvermont架构,没错就是现在Atom里使用的,加入了AVX512指令集。核心数量没有公布(怎么也得几十个),但是双精度浮点性能可超过3TFlops,是现在的三倍多。Knights Landing系统将在2015年下半年问世。美国国家能源研究科学计算中心(NERSC)就正在开发一套“Cori”,拥有9300多个节点,2016年上线,可为5000多名用户、700多个大规模科学项目服务话说Intel在高性能计算上真是很无敌,比如说这次的TOP500超级计算机,Intel就占了85%的系统,新上榜的更是97%都是Intel平台。
Intel哭死了:又被罚89个亿! 2009年5月份,欧盟反垄断委员会向芯片业巨头Intel开出一纸10.6亿欧元的巨额罚单,甚至超过了2004年对微软的8.89亿欧元反垄断罚款,创下了欧盟历史新纪录。 整整五年来,Intel一直在寻求上诉驳回,但最终还是失败了:欧洲第二最高法院今天判定,欧盟反垄断委员会的罚款很恰当。 10.6亿欧元,按照如今的汇率相当于89.25亿元人民币。 欧盟之所以要如此重罚Intel,主要是因为Intel通过向戴尔、惠普、NEC、联想等众多PC合作伙伴提供优惠折扣,让他们购买自己的芯片,从而排斥打压竞争对手AMD。 欧盟还称,Intel还掏钱收买德国零售供应商Media Saturn Holding,令其仅销售采用Intel处理器的电脑。 欧洲第二最高法院在将近300页的判决书中说:“(欧盟反垄断)委员会展示了必要的法律证据,Intel确实试图隐瞒其行为的反垄断性质,并通过长期的通盘战略,在大多数重要的销售渠道上排挤AMD。” 尽管这次绝对看成重罚,但是法官表示,欧盟下手已经很轻了,10.6亿欧元只相当于Intel 2008年总收入的区区4.15%,而按照有关法律,最高是可以处罚10%的,那就是23.5亿欧元。 法官称:“法院认为,Intel的辩护无一可以证明处罚不当。相反,考虑到该案件的事实,这样的处罚是非常恰当的。” Intel发言人Sophie Jacobs表示:“我们对此决定非常失望。这是一个很复杂的官司。我们会对判决进行评估。” Intel其实还有机会,可以继续向最顶级的欧盟法院上诉,但没有说是否会这么做,但是在欧洲自己人的地盘上,Intel再挣扎估计也没戏。新闻标签:英特尔
AMD图谋东山再起:重整高性能 放弃模块架构 本月1日AMD迎来了45周年纪念日,作为仅剩的X86双雄之一(先无视VIA吧,份额太小了),AMD在处理器上也曾辉煌过,但是现在AMD一门心思都放在了APU上,高性能处理器门庭冷落,第三代模块化架构Steamroller也只用了APU上,FX系列依然看不到升级的希望。 如此低调背后传闻AMD在憋大招,准备在2015年东山再起,重整高性能处理器,放弃“推土机”以来的模块化CMT多核架构,回归传统的SMT多线程架构。 AMD在2012年8月迎回了一个老员工——Jim Keller(吉姆·凯勒),他在苹果公司担任移动处理器架构设计师,参与了A4、A5、A5X处理器的开发,但在更早之前他是AMD公司的员工,与AMD前任CEO德克·梅尔一起创造了AMD最辉煌的历史——Athlon XP处理器,彼时的XP处理器甚至比后来的Athon 64还要火。 Jim Keller现在领导着AMD的处理器业务,正在开发新一代处理器架构。根据华尔街的消息,新架构预计在2015年末问世,所以相关的产品可能要等2016年甚至2017年才能正式上市。 至于具体的架构、性能如何,目前只知道AMD会回归传统的SMT(同步多线程)设计,放弃始于“推土机”的CMT(Cluster Multithreading)多线程,也就是我们常说的物理多线程。 PS:这是一则有关AMD新一代处理器的传闻,是否真有其事还不好说,但是目前的路线图中AMD的FX及皓龙的高端产品线确实在2015年前都没什么升级计划。至于“推土机”模块化架构,目前是第三代Steamroller,已知的还有Excavator挖掘机架构,预计产品将在2015年上市,当然还是用在APU中。 结合这个传闻来看,第四代推土机架构与新一代处理器架构在时间点上还是能衔接上的,2015年再推一次模块化架构,2015年底推出新一代架构,放弃毁誉参半的模块化设计,回归传统设计。 至于AMD能否真的在性能上重新与Intel一战甚至胜出,这就难说了,我们都希望如此,这样Intel的CPU和芯片组升级也会更有诚意了,不再像这样挤牙膏了。新闻标签:AMD CPU处理器
AMD图谋东山再起:重整高性能 放弃模块架构 本月1日AMD迎来了45周年纪念日,作为仅剩的X86双雄之一(先无视VIA吧,份额太小了),AMD在处理器上也曾辉煌过,但是现在AMD一门心思都放在了APU上,高性能处理器门庭冷落,第三代模块化架构Steamroller也只用了APU上,FX系列依然看不到升级的希望。 如此低调背后传闻AMD在憋大招,准备在2015年东山再起,重整高性能处理器,放弃“推土机”以来的模块化CMT多核架构,回归传统的SMT多线程架构。 AMD在2012年8月迎回了一个老员工——Jim Keller(吉姆·凯勒),他在苹果公司担任移动处理器架构设计师,参与了A4、A5、A5X处理器的开发,但在更早之前他是AMD公司的员工,与AMD前任CEO德克·梅尔一起创造了AMD最辉煌的历史——Athlon XP处理器,彼时的XP处理器甚至比后来的Athon 64还要火。 Jim Keller现在领导着AMD的处理器业务,正在开发新一代处理器架构。根据华尔街的消息,新架构预计在2015年末问世,所以相关的产品可能要等2016年甚至2017年才能正式上市。 至于具体的架构、性能如何,目前只知道AMD会回归传统的SMT(同步多线程)设计,放弃始于“推土机”的CMT(Cluster Multithreading)多线程,也就是我们常说的物理多线程。 PS:这是一则有关AMD新一代处理器的传闻,是否真有其事还不好说,但是目前的路线图中AMD的FX及皓龙的高端产品线确实在2015年前都没什么升级计划。至于“推土机”模块化架构,目前是第三代Steamroller,已知的还有Excavator挖掘机架构,预计产品将在2015年上市,当然还是用在APU中。 结合这个传闻来看,第四代推土机架构与新一代处理器架构在时间点上还是能衔接上的,2015年再推一次模块化架构,2015年底推出新一代架构,放弃毁誉参半的模块化设计,回归传统设计。 至于AMD能否真的在性能上重新与Intel一战甚至胜出,这就难说了,我们都希望如此,这样Intel的CPU和芯片组升级也会更有诚意了,不再像这样挤牙膏了。新闻标签:AMD CPU处理器
14nm Braswell架构首曝:其实还是Atom Intel昨日首次公开介绍了未来的新处理器“Braswell”,按照命名规则它应该排在Haswell、Broadwell之后成为第六代酷睿家族,但是根据其定位和架构,似乎不完全是这么回事儿。 在官方路线图上,Braswell被安排在Bay Trail的后边,主打500美元以下价位的入门级低端桌面和移动市场,操作系统全面支持Windows、Android、Chrome OS、Linux,制造工艺升级成14nm,并且还是SoC片上系统设计。 Chrome OS系统支持是上代所没有的,这表明Intel已经盯上了Chromebook。 同时,Intel还现场展示了基于Android 4.4 KitKat自己开发的64位版本核心,并正在针对Braswell进行优化。 VR-Zone贴出了一张据称是Braswell的架构简图,其中赫然可以看到四个Atom核心,以及没两个核心搭配的1MB二级缓存(共计2MB),还有第八代图形核心,以及各种各样的输入输出。 从这样的设计看,Braswell应该是延续了目前的Silvermont架构体系,本质上和目前的奔腾/赛扬J/N系列、Atom Z3000系列并无不同,只是工艺计划而已,那在性能上恐怕也很难有什么惊喜了。 这就意味着,它和Haswell、Broadwell将完全不是一个级别的,事实上Intel在路线图上也将它列在了Broadwell之下,二者的关系就像现在Bay Trail、Haswell那样高低互补。 如此看来,Braswell将不会是主打高性能的酷睿,而第六代酷睿这个使命会交给谁呢?Skylake?——之前的说法是Braswell、Skylake其实是一回事儿,分别是处理器、平台代号。新闻标签:英特尔 CPU处理器
RISC的优势是容易6发射,如今A7架构用上6发射的RISC了 根据这份文档,A6、A7的架构规格对比如下:之前猜测和推测的不少规格都是正确的。A7 Cyclone的确是一个很宽的架构,每个时钟周期最多可以同时解码、发射、执行、收回6个指令/微操作,A6 Swift则最多不超过3个。 A7的重排序缓冲达到了惊人的192,是上代的四倍多,同时巧合的是正好与Intel Haswell架构一样。分支预测错误惩罚也增加了,但幅度不大,而且又正好与Intel Sandy Bridge及其后的架构在同样范围内。 换句话说,苹果的架构已经在某些方面和Intel桌面产品架构处于同一级别了。 一级缓存容量的翻番可以理解,而在执行端,整数ALU单元、载入/存储单元、分支单元也都翻了一番,并首次加入了一个间接分支单元和至少一条浮点流水线,能够并行执行三个浮点操作,但注意第三条浮点/NEON流水线是用来做除法、开方的,乘法只能最多并行两个。 每个单元对应的缓冲尺寸也基本明晰,应该对应每个单元的微操作数,但在所有执行单元之前应该不会有统一调度器,而是每个端口前安置静态分区缓冲。 根据这些信息,A7 CPU架构简图是这个样子的(很可惜A6的还是没有足够数据无法直观对比):六个解码器、九个执行单元端口,A7 CPU的确很“大”,比其他任何移动处理器都要大,已经完全超越了高通Krait、Intel Silvermont,足以媲美Intel Core酷睿架构。 事实上,iPhone 5S发布的时候苹果就宣称A7是“桌面级别架构”(desktop-class architecture)——库克并没有夸张。A7是苹果勇敢卖出的一大步,但正因为步子太大,应用还跟不上,至今没有一款能完全发挥其潜力,即便是苹果自己家的应用也做不到。A7 CPU就像一头沉睡的猛狮,等待唤醒怒吼。 另外,A7 CPU架构上很超前,但在内存上却很“吝啬”,iPhone 5S、iPad Air都只有区区1GB。尽管苹果可以做到只需少量内存就能把系统性能发挥到极致,但是1GB毕竟太少了,是不可能完全发挥A7 CPU潜力的。或许苹果意识到大家短期内做不到所以干脆就不浪费更多内存? 最后说一句,苹果起代号也不是即兴而为,看起来颇有深意:Swift的意思是快速敏捷,A6 CPU的确符合这个特点;Cyclone是旋风、飓风,A7 CPU确实很庞大。 接下来的问题是:苹果下一步会何去何从?A8又要冲击怎样的高度? 再做得更宽显然意义不大,但是性能改进仍有巨大的空间,尤其是提升频率和效率。A7的频率其实很低,iPhone 5S/iPad mini 1.3GHz,iPad 1.4GHz,相比于高通骁龙最高已达2.5GHz有点相形见绌。 A8会用上新的20nm工艺,完全可以在不增加功耗的情况下明显提高频率,就看苹果愿意不愿意了。
浦大地:至强比Power7和马尼库尔更强 在今年的英特尔信息技术峰会(IDF)上,有媒体记者面对英特尔公司执行副总裁兼英特尔架构事业部联合总经理浦大地时曾问出了这样的一个问题:“英特尔在前不久发布了至强5600和至强7500系列处理器,而竞争对手AMD推出了马尼库尔处理器,IBM推出了Power7处理器,可以说今年是企业级计算竞争非常激烈的年份。英特尔如何看待这种竞争格局?”   浦大地的回答出人意料,“与IBM Power7相比,面向高端服务器市场的至强7500处理器,在可靠性、扩展性、安全性等方面的特性都有很大提升,它还继承安腾处理器上面的RAS特性。”这位在帕特基辛格之后直接管理英特尔平台架构事业部的副总裁表示,如今的X86早已经是成为“企业计算市场上面的绝对主流”,拥有极强的市场竞争能力。   事实上,在浦大地的眼中,不仅AMD的马尼库尔并不具备竞争力——最多也就是价格上可能会将英特尔暂时拉入泥沼——英特尔至强7500,也就是被媒体多次提及是否会冲击安腾市场的Nehalem-EX,甚至要比IBM的POWER7还要强。   让人不得不心生怀疑的是,在回答媒体提问的时候,浦大地是不是忘记了英特尔还有面向RISC替换市场以及UNIX服务器市场的安腾9300?虽然比至强双雄的发布日期早了那么一个月,但这样的遗忘速度是否也太快了?还是浦大地根本就了解,英特尔在安腾9300的宣传上基本上就是“寥寥几笔”,干脆就当没这么一回事? 或许,下次再谈起至强,浦大地应该记得安腾   虽然浦大地看起来对安腾有些视而不见,但是媒体记者们对于安腾确实十分的感兴趣,尤其是感兴趣安腾和英特尔自家的至强7500的竞争关系,尤其是在英特尔为至强系列加入RAS特性,以及将安腾与至强置于统一的研发平台之下以后,这种好奇心所引发的对两个关系的问题就更加络绎不绝。   不过,简单的想一想,既然至强比Power7和马尼库尔更强,那浦大地将安腾置于何处?
4万多一颗!全球首款15核心处理器正式发布 Intel今天宣布推出Xeon E7 v2系列处理器,成为全球第一款采用原生15核心设计的产品,也是Intel历史上核心数量最多的。——AMD Opteron 6300虽然有最多16个核心,但并非每个都是完整核心,且非原生设计。 该处理器有三条QPI 1.1总线,支持双路(2800 v2)、四路(4800 v2)、八路(8800 v2)并行,最多可在一套系统内拥有120个物理核心、240个逻辑核心。如果搭配第三方控制节点,则可以扩展到32路。 Xeon E7 v2同时也是迄今为止速度最快的服务器处理器,号称比上代产品Xeon E7性能快一倍、IO带宽快三倍,并支持行业内最大容量的内存,比对手多出一半。 它支持四通道DDR3-1600 RDIMM ECC,每路最多24条,单条容量64GB的话每路就高达1.5TB,四路就是6TB,八路就是12TB。 缓存方面,每个核心32KB一级指令缓存、32KB一级数据缓存、256KB二级缓存、2.5MB三级缓存,也就是三级缓存最多37.5MB,一套八路系统内可达300MB。 架构方面基于Ivy Bridge-EX,所以很多技术特性都是相通的,包括超线程、睿频加速、PCI-E 3.0总线(32条信道)、AVX/AES-NI指令集等等(不支持TSX-NI),还有很多针对服务器应用的,比如RAS、VT-x EPT、Secure Key等等。制造工艺也是22nm,封装接口是标准的LGA2011。 Intel宣称,它相比于RISC架构竞品(主要是IBM Power)性能可以超出最多80%,成本也可以节约最多80%。 Xeon E7 v2面向需要服务器长时间稳定运行,并需要通过大数据辅助决策的金融和石化等行业,适合大型企业级应用,例如数据库、分析工具、企业资源规划(ERP)软件。 具体型号规格和此前曝光的完全一致,不再赘述,但注意看价格:上代最贵的4616美元,是一款10核心/2.4GHz/130W,而如今这个价钱能买到15核心,而且除了频率略降之外其他各项指标都有全面提升,同时保持功耗不变。这就是进步。 而更高级的型号就需要大放血了:超过4616美元的就有八款之多。八路系列的三款顶级型号都达到了恐怖的6841美元,约合人民币4.16万元,顶级四路和双路也分别要6619美元、6451美元。这些都是155W TDP的牛逼玩意儿,要么核心多(最多15个),要么频率高(最高3.4GHz)。 延伸阅读—— Intel 15核心处理器细节大曝光:真凶残! Intel 15核心竟然是原生的!内核照首曝Xeon E7 v2双路四路八路型号、规格表型号、价格表两代价格对比表庞大的生态系统支持
Intel重操旧业:晶体管级别看其eDRAM缓存 可能很多同学不知道,Intel成立初期不是做微处理器的,而是主营SRAM、DRAM等存储芯片,只不过后来受到日本厂商的冲击,才果断转型,成就了一番霸业。 不过,Intel现在又有点重操旧业的架势,Haswell处理器中有部分集成了多达128MB eDRAM嵌入式缓存,既能辅助核显,也能作为系统四级缓存。与它相关的资料正在陆续披露,ISSCC大会上又进一步公开了更深入的细节。 芯片专家ChipWorks则从底层晶体管的角度,分析对比了Intel的这种eDRAM,发现其架构和其他同类技术有很大不同。 IBM已经使用eDRAM很多年了,45nm时代后更是成为Power处理器的标配,现在已经进入了22nm,但尚未有实际产品问世。IBM 32nm Power7+里边集成的eDRAM 台积电、瑞萨(NEC)也在为游戏机打造的芯片里使用eDRAM,比如微软Xbox、任天堂Wii,都是更传统的DRAM堆栈加玻璃杯形电容。 不同的是,台积电采用了CUB(cell-under-bit)堆栈,位线(bitline)在电容之上,瑞萨则是反过来的COB(cell-over-bit)。台积电65nm eDRAM(微软Xbox GPU)瑞萨45nm eDRAM(任天堂Wii GPU) Intel的也是COB,但在金属电介质堆栈底层内以凹洞形式做了一个MIM电容。这部分的工艺是22nm,九个金属层。放大看电容阵列的边缘,可见M2、M3、M4三个金属层堆栈构成了电容的外层。继续放大,可以看到与三栅极鳍片中部接触的子线(worldline)晶体管,以及末端的两个传递子线(passing wordlines)。电容部分顶视图,显然都是矩形的,但具体材料还在分析中。Intel表示,每一个单元单荣的容量是13fF,面积0.029平方微米,大致相当于其22nm SRAM单元面积(0.09平方微米)的三分之一,略大于IBM同类的0.026平方微米。 Intel退出DRAM行业已经几乎三十年了,现在有点借机重返的意味,但绝对不会大规模重来,指望Intel牌内存更是天方夜谭。 不过,下一代Knights Landing Xeon Phi高性能计算处理器倒是会搭配16GB eDRAM,等于128颗Haswell所用芯片,因此未来的主攻方向应该还是游戏、高性能计算。 新闻标签:英特尔 CPU处理器
AMD:引入ARM将是自64位以来的最大变革 Google宣布将基于ARM技术自行设计处理器,AMD也趁热打铁地预告了自己的第一款ARM架构产品,并号称这将是服务器领域自AMD 2003年发布首款64位架构Opteron处理器以来最大的转折和变革。 AMD表示,十年前很多人都认为x86架构只适合个人电脑,服务器需要SPARC、Power这样的特殊架构,AMD Opteron则不仅提供了新的选择,更使得x86架构成为服务器领域强有力的竞争者,,证明它完全可以高效地胜任服务器工作,现在更是占领了绝大部分服务器市场。 明年,AMD将会推出自己首款基于ARM ARMv8 64位架构自行设计的处理器,代号“西雅图”(Seattle),为高速发展的高密度服务器提供低功耗的计算方案,将再一次改变数据中心的格局。 AMD同时首次证实,其ARM架构处理器仍将延续Opteron皓龙的品牌命名。 西雅图将整合四个、八个ARM Cortex-A57架构的CPU核心,支持众多服务器级别特性,比如最多128GB ECC内存、整合10Gbps以太网连接、集成AMD Freedom高速光纤互连、拥有ARM TrustZone安全模块,并且还会延伸进入嵌入式领域。 AMD也清醒地意识到,推出硬件只完成了一半工作,还需要软件生态系统的配合,从底层的UEFI到中间的操作系统再到顶层的应用框架、开发工具,都得做好做备。 Linux系统内核自3.7版本开始已经支持64位ARMv8架构,很多流行的Linux发行版也准备加入支持,包括Ubuntu、Fedora、Debian(已经可下载可启动了)。开源的GCC编译器、GNU C库(Glibc)已经导入支持ARMv8,并可以下载使用。虚拟机方面,KVM已经跟上,Xen也支持了32位的ARM并计划导入64位。 AMD对开源的支持也是一贯比较积极的,比如是Linux基金会的金牌成员、Apache基金会的金牌赞助商、OpenJDK项目的贡献厂商,等等,更有利于推动开源软件对ARM的支持。 下个月初的CES 2014上应该会看到更多消息。
1 下一页