FF6618 FF6618
关注数: 25 粉丝数: 221 发帖数: 12,432 关注贴吧数: 16
飞腾携手百度、长城推出全国产AI计算平台解决方案 记者7月10日获悉,来自新区的飞腾公司将联合百度和长城共同推出全国产AI计算平台解决方案,面向机器学习、视频识别、图像识别、语音识别等场景提供多样化算力支撑。该全国产AI计算平台解决方案可广泛应用于智慧城市、智慧交通、智慧能源、智慧金融等相关领域,全面助力新基建。图为飞腾高性能服务器CPU 此次全国产AI计算平台解决方案搭载飞腾CPU芯片和昆仑AI芯片,基于长城全国产AI服务器进行架构,通过docker开源的应用容器引擎实现对深度学习框架的管理。这次全国产AI计算平台解决方案中搭载的飞腾FT-2000+/64 处理器,是飞腾面向高性能服务器领域的产品,集成64个自主研发的处理器核心FTC662、主频 2.0~2.3GHz,典型功耗100W。该款处理器设计了数据亲和的多核处理器体系架构,突破了高效乱序超标量流水线、层次化片上并行存储结构、多级异构片上互连网络、高可用处理器设计等关键技术,实测性能达到了国际主流服务器 CPU 同等水平,填补了国产高端通用 CPU 领域的空白,为百度昆仑 AI 芯片提供了高效完整的 AI 计算流程支撑。图为长城智擎 ZQ2200 自主 AI 服务器 据了解,目前飞腾 CPU 已经与国内主流的 AI 加速卡如百度昆仑、云天励飞、比特大陆等完成适配,同时已展开和国内外通用高端 GPU 显卡的适配。飞腾 CPU 支持 PaddlePaddle(飞桨)、TensorFlow、Caffe等主流学习框架,支持训练和推理的应用,可以快捷帮助用户进行模型服务与整合。基于飞腾芯片的 AI 服务器生态已初具规模。 飞腾公司相关负责人表示,飞腾非常重视人工智能的产业规划和落地牵引,与人工智能头部企业达成了深度合作,加速部署 AI 生态,通过开放共赢的方式构筑 AI 生态圈,打造新基建的计算“合力”。
Peak和Base,看看啥意思 引用自:SPEC CPU2006 Run and Reporting Rules 1.5 Peak and base builds "Peak" metrics may be produced by building each benchmark in the suite with a set of optimizations individually selected for that benchmark. The optimizations selected must adhere to the set of general benchmark optimization rules described in section 2.1 below. This may also be referred to as "aggressive compilation". "Base" metrics must be produced by building all the benchmarks in the suite with a common set of optimizations. In addition to the general benchmark optimization rules (section 2.1), base optimizations must adhere to a stricter set of rules described in section 2.2. These additional rules serve to form a "baseline" of performance that can be obtained with a single set of compiler switches, single-pass make process, and a high degree of portability, safety, and performance. The choice of a single set of switches and single-pass make process is intended to reflect the performance that may be attained by a user who is interested in performance, but who prefers not to invest the time required for tuning of individual programs, development of training workloads, and development of multi-pass Makefiles. SPEC allows base builds to assume that the program follows the relevant language standard (i.e. it is portable). But this assumption may be made only where it does not interfere with getting the expected answer. For all testing, SPEC requires that benchmark outputs match an expected set of outputs, typically within a benchmark-defined tolerance to allow for implementation differences among systems. Because the SPEC CPU benchmarks are drawn from the compute intensive portion of real applications, some of them use popular practices that compilers must commonly cater for, even if those practices are nonstandard. In particular, some of the programs (and, therefore, all of base) may have to be compiled with settings that do not exploit all optimization possibilities that would be possible for programs with perfect standards compliance. In base, the compiler may not make unsafe assumptions that are more aggressive than what the language standard allows. Finally, though, as a performance suite, SPEC CPU has throughout its history allowed certain common optimizations to nevertheless be included in base, such as reordering of operands in accordance with algebraic identities.
评论龙芯小吧主的所谓答疑 因为被封,所以发在这里,我认为我还是比较客观公允,欢迎转载辩论。 他说: 1、龙芯交钱的性质根据龙芯官方的说法就是要交“兼容 MIPS”这个商标费; 2、龙芯购买 R5 是不成立的。龙芯给 MIPS 交钱有两种方式,一种就是每5年续费,另一种就是在每颗卖出去的芯片中提成(顺便一提君正也是如此)。“龙芯购买 R5 ”最早的说法来自前吧宠 386 ,后经过别人继续加工。至于是否购买,龙芯官方以前(大概2010至2017年左右)就有文章进行说明,且从龙芯3A2000开始就已经集成了 R5 的 DSP AES,拿龙芯3A4000来说龙芯重新买了 R5 是不成立的。 评: 1 MIPS指令集申请了一系列专利,即使有老专利到期,这些年一直在申请新专利,龙芯要实现MIPS指令集就需要使用这些专利,龙芯交的钱必然包括这些专利的使用权,绝对不是仅仅所谓商标费。 他这么说的目的估计是让人感觉龙芯可以很轻易的抛开MIPS指令 2 从来不是强调龙芯购买R5,强调的是龙芯在3A4000大量使用原先没有采用的R5指令集,帮助其在虚拟化和向量计算方面取得提升,同时加深了对MIPS的依赖,放弃了一些自创的一些不成熟的指令扩展,从4000看龙芯指令架构设计水平或生态影响力仍然不足。 当然龙芯绝对不会这样宣传,他们只会说它的指令集叫LoongISA,创造了上千条指令,而MIPS原始指令只有几百条(现在这已经不成立了),所以实现了指令集自主之类的话术。 重要的是4000用r5指令表明其自创指令路线的不顺利,至于R5指令的授权费是在原有授权协议框架订阅续费取得,下还是单独谈的,根本不重要。龙芯小吧这么强调重新购买R5是避重就轻转移话题。
RISC-V董事长摊牌了:RISC-V不是开源处理器 2月18日,RISC-V基金会董事长Krste Asanovic在其官网上出人意料地发布了一篇博客《RISC-V不是开源处理器》(RISC-V is not an “open-source processor”),看到标题小编一惊,“哈?你们在全世界和中国吹了好几年的开源,现在居然自己主动跑出来打脸了???” 为了搞清楚这到底是什么神仙操作,小编仔仔细细把这篇文章阅读了3遍,算是弄明白了这个标题到底要表达什么:RISC-V开源的是指令集架构,简称ISA,仅此而已。这位大佬特别指出:“RISC-V内核”这个东西是不存在的,准确的说法应该是“由各个公司或者团队设计出来的的基于RISC-V指令集架构的处理器”,他称之为“implementation”,并且指出,这种implementation有开源的和商用的。 好了,看起来,这篇文章很短,200字出头,但细细读来,却发现意味深长: 一、 过去几年,诸多国内和国际的RISC-V厂商在国内大肆宣扬“RISC-V是开源的”,但是现在RISC-V基金会董事长却专门撰文澄清,可想而知过去相关厂商在他们的营销和公关中,打了多少擦边球、蒙了多少不明就里的群众。现在好了,老大特地跑出来发声明,显然是无法继续对这些厂商的行径视而不见。 二、文章特意指出:在基金会网站上,列出了一些“开源的RISC-V处理器implementation”,但是,(更值得关注的是),商业化RISC-V处理器供应商“能够像其它专有ISA供应商”(虽然你没说,但我们都知道你在说Arm)一样,可以向付了授权费(连跟Arm的商业模式都一样)的客户提供内核设计和技术支持。啥意思呢?意思就是说:开源的不是内核,只是那个小小的ISA,如果你想要内核,请付钱啦。再说得直白一些,董事长的意思是说:各位,不好意思,之前误导大家了,事实是,想用RISC-V的内核,你们还是得掏钱的,我们可不是开源哈! 为什么在这个时间节点,RISC-V基金会的董事长会主动跳出来发表这样的文章?小编觉得有三个可能: 1、之前RISC-V厂商在全球、在中国,忽悠得有点大了,董事长作为当家人看不下去了,跳出来拨乱反正一下; 2、那些提供RISC-V内核的商业公司的日子可能不太好过,董事长赶紧跳出来帮着吆喝吆喝; 3、说到追捧RISC-V,现在中国说自己排第二,可没有人敢说自己是第一。但大家不要忘了,RISC-V归根结底是made in USA的,如果中国成了它最大的热土,有人会不高兴的。谁?川普啊!RISC-V在中国最大的卖点是啥?开源。现在基金会派最高领导人出来辟谣,我们不是开源,我们一样是卖的,这会不会是在向美国政府表清白表忠心呢?小编觉得,这种可能性,还是很大的。 有消息称美国政府正在考虑加大对华企业(尤其是华为)的技术禁售,在这个节骨眼儿上,这篇博客的发表值得我们密切关注啊。
我对国产芯片的一些看法(转载) icbank 2020-03-02 最近几年,国产芯片突飞猛进,2019年国产芯片产值超过3000亿人民币,首次超过全球芯片产值的10%。芯片行业,遇到了千载难逢的机会。芯片企业,如雨后春笋般涌现,到2019年底国内芯片企业数量已有1780家。先有数量再有质量,中国走这样的芯片成长之路,也无可厚非。但做芯片很烧钱,必须有持续的资金支持,成功往往需要十年。在企业融资和风险投资的互动过程中,一些问题也因此出现。有人说,是做投资的带偏了做芯片的;有人说,是做芯片的带偏了做投资的;也有人说,是周瑜打黄盖愿打愿挨。不管怎么说,芯片创业企业都会有一个初心,是自我成就?还是产业报国?抑或是借机发财致富?这些我认为都不是,芯片企业的初心就是做好芯片。做不好芯片,其他无从谈起。国产芯片要更好地发展,作为行业人,我的看法是:芯片企业要不忘初心,芯片产品要体现价值,芯片投资要正向引导。 芯片企业要不忘初心 不忘初心,方得始终。芯片企业的初心是做好芯片。每个芯片创业者最初选择这条路都有自己的理由和出发点,无论他们当初为何走上创业之路,最后都将成为他们一生中最难忘和骄傲的事情。芯片之路,艰辛之路。创业路上,芯片企业不忘初心才可能走的更远。不要想着走捷径,捷径的终点可能是断崖;不要想着快速成功,短平快就做不了芯片。初心,也有抵不过现实的时候。一些芯片企业开始偏离轨道,变成出产品是为了融资,哪里热就往哪里蹭,静不下心来钻研技术和打磨产品。要想真正成功,做芯片还得回归初心。
英特尔和AMD迎来CPU劲敌 来源:内容由半导体行业观察(icbank)编译自「mashviral」,作者:Pierce Koter,谢谢。 到目前为止,我们还没有讨论过Nuvia(与Nvidia没有关系),但自从去年年底它走出隐身模式以来,我一直关注着这家初创公司。Nuvia是一个新的CPU设计公司,有着令人印象深刻的行业背景,它打算挑战英特尔和AMD的部分整体服务器市场,使用自己的定制的基于arm的架构。 这是一个令人震惊的声明,因为基于arm的公司很难做到这一点。自从2013年Calxeda崩溃以来,我们已经看到许多公司声称他们将把基于arm的服务器推向市场。并非所有这些公司都是初创公司。2015年,当时的amd首席执行官Rory Read自信地预测,到2018年ARM将拥有15%的服务器市场份额。高通(Qualcomm)、博通(Broadcom)和Applied Micro都曾在ARM服务器市场出手,此外还有Cavium、Ampere正在这个领域做出自己的努力。因此Nuvia进入的市场非常拥挤。 然而,该公司相信,它的血统和商业计划将使它成功,甚至在这个领域蓬勃发展。该公司由总裁兼首席执行官Gerard Williams领导,他的职业生涯始于英特尔,随后是ARM。他领导了Cortex-A8和A15的CPU架构团队,之后转到苹果,在A7、A8、A9、A10、A11和A12中设计了一个或多个核心。考虑到苹果在ARM的表现上已经引领了整个行业,这可不是一个小问题。 NextPlatform发布了对营销副总裁John Carvill的采访,讨论了Nuvia希望实现什么,以及它希望如何实现。在该公司工作的其他著名工程师包括Manu Gulati,他在原来的K7上设计了FPU,并为K8建造了超运系统和北桥设计。K7 FPU是一个值得注意的亮点,因为它标志着这么多年来除了英特尔之外,第一次有公司用顶尖的浮点单元构建了x86芯片。以下是Paul Hsieh在1999年对它的描述: K7的大多数特性实际上只是K6(和P6)中存在的超级增强的特性。但它的不同之处在于它的无序浮点单元。通过组合88个(!!)重命名寄存器,并在完全超标量的FPU上对堆栈和依赖项进行重命名,AMD可能创建了21264,这可能是我见过的最先进的体系结构,可能是例外。尽管有些持怀疑态度的高端微处理器审阅者声称,它也肯定比K6和P6架构都具有显着的性能水平。 历史证明Hsieh在这一点上是正确的。强大的FPU性能是AMD cpu多年来的一个特殊优势。在他职业生涯的后期,Gulati随后领导了一些苹果公司的SoC建筑设计。团队中另一位熟悉的老ATI粉丝是系统工程副总裁John Bruno。Bruno领导了多个ATI移动GPU的设计团队,然后是第一个Trinity Fusion apu,它结合了Llano硅和基于Radeon HD 5000s VLIW5 GPU的GPU。在那之后,他在苹果公司担任了六年的系统架构师,设计了多款iPhone。总的来说,这个团队的工程能力很强。
NVIDIA将推氢弹级7nm安培GPU 性能提升100%不是梦 2020-02-01 15:24 NVIDIA什么时候发布新一代7nm安培显卡?这件事让很多玩家极为关注,3月份的GTC大会是最有可能的,不过首发的基本上确定是数据中心级安培显卡了。日前美国印第安纳大学的新一代超算Big Red 200中揭示了下代NVIDIA GPU的性能,据说能提升70-75%的性能 。 根据印第安纳大学提供的数据,Big Red 200超算最初规划计算性能为5.9PFlops(5.9千万亿次浮点计算每秒),使用的是Tesla V100加速卡,但是升级下代NVIDIA GPU后可达8PFlops,而所需的GPU数量更少,因为新架构GPU(也就是7nm安培)可带来70-75%的性能提升! 70%的性能提升已经很强大了,但这可能还不是7nm安培的真实实力,推特用户dylan522p计算出来的结果更让人吃惊,因为7nm安培GPU的性能提升超过100%。根据他的结果,7nm安培GPU的FP64性能可达18TFLOPS ,作为对比的是Tesla V100加速卡是7-7.8TFLOPS,最新的Tesla V100s是8.2TFLOPS。在Tesla系列的加速卡中,FP32:FP64是2:1的,也就是说7nm安培显卡的FP32性能可达36TFLOPS,是目前我Tesla V100系列的2倍还多,后者最强也不过16TFLOPS。 从这些信息来看,NVIDIA下一代GPU——7nm安培的性能提升会非常大,100%以上的增幅远超Pascal到Volta那一代50%的性能提升,后者不过是从21TFLOPS提升到30TFLOPS,2000年代后成倍性能提升到GPU已经非常罕见了。当然,游戏级的7nm安培最终如何还不好说,因为NVIDIA最近几代GPU中Tesla与GeForce系列都是分开的,RTX显卡用的12nm图灵GPU完整版也只有4608个CUDA核心,Volta是5120个,而且游戏GPU的FP64性能阉割到了1:32,可比的只有FP32性能,TU102核心跟GV100核心的FP32性能差不多,都在14-16TFLOPS左右。 总的来说,如果Big Red 200超算上的性能泄露是准确的,而且NVIDIA在游戏GPU上也没有大刀阉割,那么下一代的7nm安培游戏卡性能也会有明显提升,伴随而来的还会有RTX光追性能大涨,这样的性能优势显然会让AMD的big Navi旗舰卡再追一阵子。 快科技 责编:黎晓珊
转:ARM-GPU将在高性能计算中脱颖而出 2020-01-30 09:51:52 来源:EETOP GPU已经成为加速高性能计算工作负载的标准平台,至少对于那些已经对其代码进行了调整以完全支持加速的工作而言。但是直到最近,大部分加速还是发生在使用Intel Xeon或IBM Power处理器的主机系统上。但是随着Nvidia兑现了支持Arm作为X86和Power的对等产品的承诺,由Arm-GPU组合提供支持的HPC的前景已大大增加。 从Nvidia的角度来看,考虑到Arm将在未来的HPC部署中取代X86,特别是在欧盟和英国,这当然很有意义。在美国和其它地方,Arm被视为向高性能计算生态系统注入更多多样性和竞争的一种方式。此外,Arm在超大规模、云计算和企业设置方面还具有更广泛的地理可能性。 三大知名超级计算中心正在帮助Nvidia将这种Arm-GPU计算模型实现为HPC:日本的RIKEN,英国的布里斯托大学和美国的橡树岭国家实验室。 以橡树岭为例,实验室已通过为基于ThunderX2的Wombat测试平台群集配备NvidiaV100 GPU并使用该设置移植和基准化一系列加速的HPC代码来着手这项工作。Wombat由16个预制的HPE Apollo70节点组成,每个节点都配备了一对28核的ThunderX2CPU,256 GB RAM和100 Gb / sec EDRInfiniBand网络接口。其中四个节点已配备Nvidia V100 GPU,每个节点两个,每个GPU都挂接到32 GB的HBM2内存中。与橡树岭的“ Summit”超级计算机上设置的V100 GPU相比,Wombat的HBM2内存是其两倍,但接口要慢得多,因为这些GPU使用PCI-Express 3.0链接而不是Nvidia专门构建的NVLink2互连。 在软件方面,为Wombat用户提供了Arm增强的CUDA 10.1(预发行版)以及一系列Arm支持的编译器,包括gcc v8.2,gcc v9.2,用于HPC v19的Arm编译器。 3,以及具有CUDAFortran支持的PGI开发人员版本。支持库由OpenMPIv3.1和v4.0,以及UCX 1.7.0以及ArmPerformance Libraries提供的优化的BLAS,LAPACK,FFT等数学例程组成。在测试的应用程序中有用于比较基因组学的组合度量(CoMet)代码、格罗宁根化学模拟机(GROMACS)、用于分子动力学模拟、量子多体系统的动态簇近似++(DCA ++)代码、大规模原子/分子大规模并行模拟器(LAMMPS)代码以及材料科学的局部自洽多重散射(LSMS)代码等。 橡树岭科学计算小组的计算科学家Wayne Joubert表示,移植是非常简单的,主要是需要更改应用程序构建脚本。例如,CoMet主要方法的移植,测试和基准测试不到两天。其他代码只需几个小时即可移植。 Joubert告诉我们:“这种体验非常类似于将代码从X86转移到Power架构。事实上,移植过程中最大的挑战是确保所有需要的系统软件都安装在系统上。” ORNL技术集成小组的HPC系统程序员RossMiller表示,移植代码的不同团队在SC19移植代码之前仅几周,因此在大多数情况下,他们只有时间来启动应用程序并进行移植。在Wombat上运行,而不是花费更多的劳动强度来优化其性能。例如,尽管GPU的HBM2容量是Summit上的GPU的两倍,但开发人员没有机会为额外的内存调整问题大小。 “至少在一种情况下(VMD),开发人员已经为X86代码编写了手动调整的SSE,AVX和AVX-512例程,” Miller指出。“ Arm端口必须完全依赖编译器生成的代码,而效率却不那么高。如果开发人员花时间为NEON指令集编写类似的优化例程,那么性能将更加接近。” 通常,GPU性能差不多是Summit的20%,差异归因于功能较弱的主机处理器(ThunderX2与Power9)以及缺乏优化。一些应用受到较低PCIe带宽的影响,而对于另一些应用,差异并不明显。考虑到所有这些因素,再加上Wombat使用的是预制硬件,在某些情况下还使用了预制软件,现在就对这种Arm-GPU产品的相对性能做出确切的决定还为时过早。 同样,评估此特定系统的能源效率也为时过早。他们打算在将来考虑这一点。 每个参与者Arm、Nvidia和HPC用户社区都在打持久战,没有人指望Arm能够像1990年代初X86接管HPC并成为未来三十年的主导架构那样,席卷整个HPC市场。但是Arm可以一点一点地在竞争中脱颖而出。 (EETOP翻译自nextplatform)
自主创新,兼容主流:兆芯走出一条x86国产化可行之道 时间:2019-03-29 作者:顾正书 由ASPENCORE举办的“ 2019中国IC领袖峰会“特邀上海兆芯副总经理罗勇博士为我们分享了兆芯六年的发展历程,如何持守“自主创新,兼容主流”的发展理念,而走出一条国产x86解决方案自主创新之路。 在今天由ASPENCORE旗下《电子工程专辑》、《电子技术设计》、《国际电子商情》三大媒体联合举办的2019年中国IC领袖峰会上,上海兆芯副总经理罗勇博士为我们分享了兆芯六年的发展历程,如何持守“自主创新,兼容主流”的发展理念,而走出一条国产x86解决方案自主创新之路。 首先,从发展理念上要有开放的心态。我们强调自主创新,不是闭门造车,一切都从头做起,而是要面向国际,侧重国民安全。我们一定要杜绝“民粹”思想。兆芯从一开始就积极拥抱国际主流x86产业生态,同时自主把控核心技术,现在已经全面掌握x86全平台实现技术。要开发出完整兼容Windows软件和主流硬件外设的x86电脑,光有CPU还是不够的。兆芯目前同时掌握了PC整机的三大核心技术,即CPU、GPU和Chipset(主板芯片组)。这样才能有比较强的产业化能力,和专业高效的服务能力。 虽然兆芯从威盛团队承接了大量x86技术资源,也得到了英特尔的x86专利交叉授权,但x86 CPU内核还是要独立开发。同样都是x86 CPU,英特尔和AMD的就完全不同,因为这种授权不是像Arm那样的架构或内核授权。这意味着兆芯必须开发自己的CPU架构和设计,以及GPU架构、芯片组设计和IP定制电路设计。除硬件外,软件也都需要自己开发。照罗勇博士的说法,兆芯是从南桥,到北桥,再到模拟芯片和电路,都是自主研发、测试和验证。从定义新架构框架和目标,到完成设计,进入掩膜流量,系统测试,直到量产阶段,兆芯500人的团队需要花费一年半的时间,其中涉及4000个计算核心、占用200TB磁盘容量、10台最先进的硬件仿真和验证平台。成功量产也离不开业界合作伙伴及行业先进标准,三大EDA/IP供应商都是兆芯的设计和验证合作伙伴,其晶圆代工和封测合作方包括台积电、华力微电子和通宝机电等。 兆芯已经研发出四代CPU,从40nm、28nm到目前的16nm,CPU主频也从小于2G发展到现在的3G。预计今年6月份推出的KX-6000系列性能已经接近英特尔的7代i5。在去年的上海工博会上,《微型计算机》杂志对KX-6000工程样机(3.0G主频和八核)做了第三方评测。最后得出的结论是跟英特尔第八代I5基本上不相上下。虽然兼容主流PC生态,但兆芯仍要建立自己的生态体系。兆芯涉及的整机形态十分丰富多样,从台式机、一体机、笔记本,到嵌入式工控机和服务器存储设备等。这些CPU芯片国产化产品在政府机构、军政系统等对国家安全要求很高的场合有着广泛的需求,很多产品在使用中用户体验已经跟英特尔/AMD电脑没什么差别。为搭建完整的国产化产业生态,兆芯联合了国内电脑、网络、软件等多家企业、高校和科研院所。基于兆芯芯片的电脑系统已经在多种高端会议和应用场合得到验证,比如中共第19大、2018年中非合作论坛,以及上海银行等。 罗勇博士最后总结到,兆芯从成立开始,就秉承了既要做国产自主可控,又必须面向国际兼容主流的理念。自主是第一要求,但是我们一定要开放,一定要融合,去拥抱已有的生态,而不是去替代它。因为替代这个已经有40年发展历史的市场是不现实的,市场已经决定了什么是主流,我们只要在其中保持自主创新,相信就可以走出一条可行的成功之路。
格局决定命运,龙芯飞腾技术路线对比 飞腾一开始类似龙芯,选了一个走下坡路的sparc指令集,做出了FT1000,拿到了国家核高基支持,按理说体制内的他们一直可以做下去,国家支持力度不会比龙芯差,但他们认清方向后,敢于革自己的命,重新选择了走可以持续发展的ARM路线,而龙芯却固执地在MIPS这条船上慢慢下沉。转一篇2015年文章 龙芯吐槽:我们陷入MIPS陷阱是上了小日本的当! 总所周知,龙芯早在2011年就已购买了mips64位架构授权,使得龙芯可以毫无顾虑的迈向64位高性能芯片领域。然而,仅仅在龙芯购买MIPS授权后的一年之后,2012年11月6日MIPS被多家科技企业联合肢解收购。其中ARM母公司以3.5亿美元买下了MIPS全部的498项专利永久授权和另外82项专利交叉授权。ARM购买MIPS专利的最大原因和龙芯购买MIPS64架构授权的原因不谋而合,是因为ARM64位架构和MIPS 64位架构重合度高达70%,不肢解MIPS以后将面临巨额的专利侵权赔偿。 究其历史原因,为何龙芯之父胡伟武在立项当初选择了今天已经破产倒闭的MIPS,而不是今天正在如日中天的ARM? 龙芯之父胡伟武坦言,龙芯项目开始前期调研的时间点是2000年左右,当时ARM的确有被他的团队列入考虑范围之内。但是2000年之前ARM实在太弱了,那时候ARM公司能拿出来的最强核心设计仅仅只是今天看来非常原始的ARM11,没有乱序执行,没有多发射,没有缓存系统。而龙芯当初的目标是桌面和超算系统,要求实现高运算性能,能够和X86体系分庭抗衡。 相比之下,MIPS架构在90年代就实现了乱序四发射、深度流水线,分支预测,寄存器重命名,Load-Store推测等超前设计,是在全世界范围内能和X86体系分庭抗礼的CPU架构之一,曾经一度辉煌过。90年代风靡世界的家用游戏机普遍采用了MIPS架构CPU,如大家熟知的的SONY的PLAYSTATION1中的R3000A,后来的PSP的R4000,以及任天堂N64的 R4300i,以及摩托罗拉,爱立信,诺基亚、思科、高通、SUN、3COM等通讯领域巨头在交换机、路由器、通讯器材中均使用了MIPS芯片。 在x86阵营经营多年的专利壁垒无法攻破的情况下,当时能为中国CPU起步的选择无非就是MIPS、ALHPA、ARM。ARM还在幼年阶段难堪重任,MIPS架构以其出色的计算性能被大量日本科技企业作为用户终端设备的MAIN CPU,这一点具备重要借鉴价值,龙芯之父胡伟武因此选择了MIPS。 随着MIPS公司的轰然倒塌,整个MIPS体系都摇摇欲坠,整个MIPS产业链都在逐步转向ARM,连传统的路由器也是如此。思科、朗讯、华为等老牌讯通企业算是MIPS的最忠实用户了,到了移动智能时代也不得不改变步伐,现在新产品也在转ARM架构。新一代智能路由了,如小米路由、极路由、华为智能盒,清一色ARM!为啥大家都在用ARM?到不是因为ARM天天吹我们世界第一CPU。而是乔布斯的IOS,谷歌的安卓彻彻底底的带动了ARM生态圈的发展,这是软件反哺硬件的最成功案例没有之一!这就是为什么建设生态圈远比研发单一硬件本身要重要的多的多的原因!可以这么直白的认为,说胡伟武完全是上了小日本的当选了MIPS陷入今天进退两难的地步是一点也不过分的!
首页 6 7 8 9 10 11 下一页