FF6618的个人资料

问龙粉十大问题注意问题范围是常见的国产CPU中 1、龙芯现在是不是用户实测性能最低的？是的，即使是龙粉自己测试，base成绩就是14分左右，更别提别的测试数据 2、龙芯是不是功耗最高的？是的，4核 40W以上 3、龙芯是不是生态很差？是的，大部分开源软件逐步放弃对龙芯支持，本来就没支持过龙芯，人家支持的是MIPS 4、龙芯是不是最先给美国交授权费？是的，10年前就开始交了，每隔几年就要交，还有HT总线也是，和永久授权的说法有出入 5、龙芯是不是主要在境外流片？是的，之前主要在意法半导体，下代去台积电 6、龙芯是不是私营企业？是的，现在老胡是实际控制人，性质为私企，他老婆管账，学生接班 7、龙芯是不是虚假宣传？是的，20分、达到AMD水平等都是虚假宣传，之前还有5年改变世界CPU格局、说自己首次实现国产芯卫星等（实际为772所功劳） 8、龙芯是不是花钱请水军？是的，龙芯曾经付给铁流“稿费”，并且供稿，这是龙粉中国原创亲口承认。 9、龙芯是不是攻击友商？是的，老胡亲口在发布会上说ARM是买IP，尽管友商多次澄清内核自研，质疑别家研制内核速度太快 10、龙芯是不是在开源软件上口是心非，剽窃藏私，意图垄断生态？是的，请看之前小吧777等人的揭露文章

华为任正非的忧虑（评自主可控、人才引进等）一楼防删

飞腾携手百度、长城推出全国产AI计算平台解决方案记者7月10日获悉，来自新区的飞腾公司将联合百度和长城共同推出全国产AI计算平台解决方案，面向机器学习、视频识别、图像识别、语音识别等场景提供多样化算力支撑。该全国产AI计算平台解决方案可广泛应用于智慧城市、智慧交通、智慧能源、智慧金融等相关领域，全面助力新基建。图为飞腾高性能服务器CPU 此次全国产AI计算平台解决方案搭载飞腾CPU芯片和昆仑AI芯片，基于长城全国产AI服务器进行架构，通过docker开源的应用容器引擎实现对深度学习框架的管理。这次全国产AI计算平台解决方案中搭载的飞腾FT-2000+/64 处理器，是飞腾面向高性能服务器领域的产品，集成64个自主研发的处理器核心FTC662、主频 2.0~2.3GHz，典型功耗100W。该款处理器设计了数据亲和的多核处理器体系架构，突破了高效乱序超标量流水线、层次化片上并行存储结构、多级异构片上互连网络、高可用处理器设计等关键技术，实测性能达到了国际主流服务器 CPU 同等水平，填补了国产高端通用 CPU 领域的空白，为百度昆仑 AI 芯片提供了高效完整的 AI 计算流程支撑。图为长城智擎 ZQ2200 自主 AI 服务器据了解，目前飞腾 CPU 已经与国内主流的 AI 加速卡如百度昆仑、云天励飞、比特大陆等完成适配，同时已展开和国内外通用高端 GPU 显卡的适配。飞腾 CPU 支持 PaddlePaddle（飞桨）、TensorFlow、Caffe等主流学习框架，支持训练和推理的应用，可以快捷帮助用户进行模型服务与整合。基于飞腾芯片的 AI 服务器生态已初具规模。飞腾公司相关负责人表示，飞腾非常重视人工智能的产业规划和落地牵引，与人工智能头部企业达成了深度合作，加速部署 AI 生态，通过开放共赢的方式构筑 AI 生态圈，打造新基建的计算“合力”。

分享贴子分享贴子

龙芯和孔乙己龙芯粉逃避最重要的境外流片问题，使劲扯毫无价值已经被证明失败的的自扩指令，其实国内几家谁也不把这个当做多难的事，整个指令集都能换何况加几条指令。这里，龙芯就像孔乙己，混那么惨被打断腿（境外流片、美国授权基础指令），还在教小学徒茴有四种写法（利用MIPS授权不管兼容性的特点，瞎扩了几条指令），而某些人就像那个小学徒，把火星贴翻出来当宝贝，可笑不？另外，龙芯粉经常说，龙芯目标是自创生态，全然不顾基础指令采采用MIPS的事实，和孔乙己所云：窃书不是偷，异曲同工啊最后，龙芯粉经常说，MIPS是高性能的架构，ARM是移动架构没法比，全然不顾ARM架构已经取得TOP500领先，不顾苹果CPU单核赶上X86 的事实，就如同孔乙己，祖上也曾经是个读书人，混的再差看不起别人出身，一样样的

转贴:同样是天玥的电脑,飞腾依然领先.【龙芯吧】_百度贴吧同样是天玥的电脑,飞腾依然领先.【龙芯吧】_百度贴吧来自：http://tieba.baidu.com/p/6750738966

发个有趣的知乎文章总被隔壁删帖，搞得没心情自己写了，发个别人的文章为什么龙芯总裁胡伟武说「凡是当年技术上超过英特尔的 CPU 企业都死了」？ chadwick bi6 人赞同了该回答本来懒得写这篇文字的，但居然有人把胡伟武的这本书，作为行业经典来阅读。忍无可忍了，我就从高赞答案里，随机拿出一页，来给大家做一做点到为止的论述。

Peak和Base，看看啥意思引用自：SPEC CPU2006 Run and Reporting Rules 1.5 Peak and base builds "Peak" metrics may be produced by building each benchmark in the suite with a set of optimizations individually selected for that benchmark. The optimizations selected must adhere to the set of general benchmark optimization rules described in section 2.1 below. This may also be referred to as "aggressive compilation". "Base" metrics must be produced by building all the benchmarks in the suite with a common set of optimizations. In addition to the general benchmark optimization rules (section 2.1), base optimizations must adhere to a stricter set of rules described in section 2.2. These additional rules serve to form a "baseline" of performance that can be obtained with a single set of compiler switches, single-pass make process, and a high degree of portability, safety, and performance. The choice of a single set of switches and single-pass make process is intended to reflect the performance that may be attained by a user who is interested in performance, but who prefers not to invest the time required for tuning of individual programs, development of training workloads, and development of multi-pass Makefiles. SPEC allows base builds to assume that the program follows the relevant language standard (i.e. it is portable). But this assumption may be made only where it does not interfere with getting the expected answer. For all testing, SPEC requires that benchmark outputs match an expected set of outputs, typically within a benchmark-defined tolerance to allow for implementation differences among systems. Because the SPEC CPU benchmarks are drawn from the compute intensive portion of real applications, some of them use popular practices that compilers must commonly cater for, even if those practices are nonstandard. In particular, some of the programs (and, therefore, all of base) may have to be compiled with settings that do not exploit all optimization possibilities that would be possible for programs with perfect standards compliance. In base, the compiler may not make unsafe assumptions that are more aggressive than what the language standard allows. Finally, though, as a performance suite, SPEC CPU has throughout its history allowed certain common optimizations to nevertheless be included in base, such as reordering of operands in accordance with algebraic identities.

评论龙芯小吧主的所谓答疑因为被封，所以发在这里，我认为我还是比较客观公允，欢迎转载辩论。他说： 1、龙芯交钱的性质根据龙芯官方的说法就是要交“兼容 MIPS”这个商标费； 2、龙芯购买 R5 是不成立的。龙芯给 MIPS 交钱有两种方式，一种就是每5年续费，另一种就是在每颗卖出去的芯片中提成（顺便一提君正也是如此）。“龙芯购买 R5 ”最早的说法来自前吧宠 386 ，后经过别人继续加工。至于是否购买，龙芯官方以前（大概2010至2017年左右）就有文章进行说明，且从龙芯3A2000开始就已经集成了 R5 的 DSP AES，拿龙芯3A4000来说龙芯重新买了 R5 是不成立的。评： 1 MIPS指令集申请了一系列专利，即使有老专利到期，这些年一直在申请新专利，龙芯要实现MIPS指令集就需要使用这些专利，龙芯交的钱必然包括这些专利的使用权，绝对不是仅仅所谓商标费。他这么说的目的估计是让人感觉龙芯可以很轻易的抛开MIPS指令 2 从来不是强调龙芯购买R5，强调的是龙芯在3A4000大量使用原先没有采用的R5指令集，帮助其在虚拟化和向量计算方面取得提升，同时加深了对MIPS的依赖，放弃了一些自创的一些不成熟的指令扩展，从4000看龙芯指令架构设计水平或生态影响力仍然不足。当然龙芯绝对不会这样宣传，他们只会说它的指令集叫LoongISA，创造了上千条指令，而MIPS原始指令只有几百条（现在这已经不成立了），所以实现了指令集自主之类的话术。重要的是4000用r5指令表明其自创指令路线的不顺利，至于R5指令的授权费是在原有授权协议框架订阅续费取得，下还是单独谈的，根本不重要。龙芯小吧这么强调重新购买R5是避重就轻转移话题。

RISC-V董事长摊牌了：RISC-V不是开源处理器 2月18日，RISC-V基金会董事长Krste Asanovic在其官网上出人意料地发布了一篇博客《RISC-V不是开源处理器》（RISC-V is not an “open-source processor”），看到标题小编一惊，“哈？你们在全世界和中国吹了好几年的开源，现在居然自己主动跑出来打脸了？？？” 为了搞清楚这到底是什么神仙操作，小编仔仔细细把这篇文章阅读了3遍，算是弄明白了这个标题到底要表达什么：RISC-V开源的是指令集架构，简称ISA，仅此而已。这位大佬特别指出：“RISC-V内核”这个东西是不存在的，准确的说法应该是“由各个公司或者团队设计出来的的基于RISC-V指令集架构的处理器”，他称之为“implementation”，并且指出，这种implementation有开源的和商用的。好了，看起来，这篇文章很短，200字出头，但细细读来，却发现意味深长：一、过去几年，诸多国内和国际的RISC-V厂商在国内大肆宣扬“RISC-V是开源的”，但是现在RISC-V基金会董事长却专门撰文澄清，可想而知过去相关厂商在他们的营销和公关中，打了多少擦边球、蒙了多少不明就里的群众。现在好了，老大特地跑出来发声明，显然是无法继续对这些厂商的行径视而不见。二、文章特意指出：在基金会网站上，列出了一些“开源的RISC-V处理器implementation”，但是，（更值得关注的是），商业化RISC-V处理器供应商“能够像其它专有ISA供应商”（虽然你没说，但我们都知道你在说Arm）一样，可以向付了授权费（连跟Arm的商业模式都一样）的客户提供内核设计和技术支持。啥意思呢？意思就是说：开源的不是内核，只是那个小小的ISA，如果你想要内核，请付钱啦。再说得直白一些，董事长的意思是说：各位，不好意思，之前误导大家了，事实是，想用RISC-V的内核，你们还是得掏钱的，我们可不是开源哈！为什么在这个时间节点，RISC-V基金会的董事长会主动跳出来发表这样的文章？小编觉得有三个可能： 1、之前RISC-V厂商在全球、在中国，忽悠得有点大了，董事长作为当家人看不下去了，跳出来拨乱反正一下； 2、那些提供RISC-V内核的商业公司的日子可能不太好过，董事长赶紧跳出来帮着吆喝吆喝； 3、说到追捧RISC-V，现在中国说自己排第二，可没有人敢说自己是第一。但大家不要忘了，RISC-V归根结底是made in USA的，如果中国成了它最大的热土，有人会不高兴的。谁？川普啊！RISC-V在中国最大的卖点是啥？开源。现在基金会派最高领导人出来辟谣，我们不是开源，我们一样是卖的，这会不会是在向美国政府表清白表忠心呢？小编觉得，这种可能性，还是很大的。有消息称美国政府正在考虑加大对华企业（尤其是华为）的技术禁售，在这个节骨眼儿上，这篇博客的发表值得我们密切关注啊。

我对国产芯片的一些看法（转载） icbank 2020-03-02 最近几年，国产芯片突飞猛进，2019年国产芯片产值超过3000亿人民币，首次超过全球芯片产值的10%。芯片行业，遇到了千载难逢的机会。芯片企业，如雨后春笋般涌现，到2019年底国内芯片企业数量已有1780家。先有数量再有质量，中国走这样的芯片成长之路，也无可厚非。但做芯片很烧钱，必须有持续的资金支持，成功往往需要十年。在企业融资和风险投资的互动过程中，一些问题也因此出现。有人说，是做投资的带偏了做芯片的；有人说，是做芯片的带偏了做投资的；也有人说，是周瑜打黄盖愿打愿挨。不管怎么说，芯片创业企业都会有一个初心，是自我成就？还是产业报国？抑或是借机发财致富？这些我认为都不是，芯片企业的初心就是做好芯片。做不好芯片，其他无从谈起。国产芯片要更好地发展，作为行业人，我的看法是：芯片企业要不忘初心，芯片产品要体现价值，芯片投资要正向引导。芯片企业要不忘初心不忘初心，方得始终。芯片企业的初心是做好芯片。每个芯片创业者最初选择这条路都有自己的理由和出发点，无论他们当初为何走上创业之路，最后都将成为他们一生中最难忘和骄傲的事情。芯片之路，艰辛之路。创业路上，芯片企业不忘初心才可能走的更远。不要想着走捷径，捷径的终点可能是断崖；不要想着快速成功，短平快就做不了芯片。初心，也有抵不过现实的时候。一些芯片企业开始偏离轨道，变成出产品是为了融资，哪里热就往哪里蹭，静不下心来钻研技术和打磨产品。要想真正成功，做芯片还得回归初心。

英特尔和AMD迎来CPU劲敌来源：内容由半导体行业观察（icbank）编译自「mashviral」，作者：Pierce Koter，谢谢。到目前为止，我们还没有讨论过Nuvia(与Nvidia没有关系)，但自从去年年底它走出隐身模式以来，我一直关注着这家初创公司。Nuvia是一个新的CPU设计公司，有着令人印象深刻的行业背景，它打算挑战英特尔和AMD的部分整体服务器市场，使用自己的定制的基于arm的架构。这是一个令人震惊的声明，因为基于arm的公司很难做到这一点。自从2013年Calxeda崩溃以来，我们已经看到许多公司声称他们将把基于arm的服务器推向市场。并非所有这些公司都是初创公司。2015年，当时的amd首席执行官Rory Read自信地预测，到2018年ARM将拥有15%的服务器市场份额。高通(Qualcomm)、博通(Broadcom)和Applied Micro都曾在ARM服务器市场出手，此外还有Cavium、Ampere正在这个领域做出自己的努力。因此Nuvia进入的市场非常拥挤。然而，该公司相信，它的血统和商业计划将使它成功，甚至在这个领域蓬勃发展。该公司由总裁兼首席执行官Gerard Williams领导，他的职业生涯始于英特尔，随后是ARM。他领导了Cortex-A8和A15的CPU架构团队，之后转到苹果，在A7、A8、A9、A10、A11和A12中设计了一个或多个核心。考虑到苹果在ARM的表现上已经引领了整个行业，这可不是一个小问题。 NextPlatform发布了对营销副总裁John Carvill的采访，讨论了Nuvia希望实现什么，以及它希望如何实现。在该公司工作的其他著名工程师包括Manu Gulati，他在原来的K7上设计了FPU，并为K8建造了超运系统和北桥设计。K7 FPU是一个值得注意的亮点，因为它标志着这么多年来除了英特尔之外，第一次有公司用顶尖的浮点单元构建了x86芯片。以下是Paul Hsieh在1999年对它的描述: K7的大多数特性实际上只是K6(和P6)中存在的超级增强的特性。但它的不同之处在于它的无序浮点单元。通过组合88个（!!）重命名寄存器，并在完全超标量的FPU上对堆栈和依赖项进行重命名，AMD可能创建了21264，这可能是我见过的最先进的体系结构，可能是例外。尽管有些持怀疑态度的高端微处理器审阅者声称，它也肯定比K6和P6架构都具有显着的性能水平。历史证明Hsieh在这一点上是正确的。强大的FPU性能是AMD cpu多年来的一个特殊优势。在他职业生涯的后期，Gulati随后领导了一些苹果公司的SoC建筑设计。团队中另一位熟悉的老ATI粉丝是系统工程副总裁John Bruno。Bruno领导了多个ATI移动GPU的设计团队，然后是第一个Trinity Fusion apu，它结合了Llano硅和基于Radeon HD 5000s VLIW5 GPU的GPU。在那之后，他在苹果公司担任了六年的系统架构师，设计了多款iPhone。总的来说，这个团队的工程能力很强。

这个是不是秒价？

初中生小吧又开始表演了先捂住我的嘴，然后开始批 dou

B站体验：来看看5年前产的FT1500A/4搭配银河麒麟OS到底表现如何 B站的up主二斤啦啦啦啦继前几天发了兆芯体验后，今天（2.8 正月15）发了一个FT1500A 的体验视频，不过她明显不熟悉Linux，就体验了下安卓版游戏大作，确实能玩，但比较卡玩游戏还是兆芯比较厉害

英特尔和华为在高性能CPU市场即将迎来一战雷锋网 2020-02-05 15:26:02 英特尔不久前公布的2019第四季度财报轻松超越了预期，服务器CPU和提供相关产品的数据中心集团（DCG）收入增长19％绝对是这份漂亮成绩单中不可忽略的亮点。不过，2020年英特尔在这一利润丰厚的市场将面临同属x86阵营AMD以及Arm阵营的左右夹攻。特别是，随着计算机国产替代“3-5-2”的推进，来自Arm服务器CPU阵营的华为将和英特尔迎来正面竞争。

NVIDIA将推氢弹级7nm安培GPU 性能提升100%不是梦 2020-02-01 15:24 NVIDIA什么时候发布新一代7nm安培显卡？这件事让很多玩家极为关注，3月份的GTC大会是最有可能的，不过首发的基本上确定是数据中心级安培显卡了。日前美国印第安纳大学的新一代超算Big Red 200中揭示了下代NVIDIA GPU的性能，据说能提升70-75%的性能。根据印第安纳大学提供的数据，Big Red 200超算最初规划计算性能为5.9PFlops(5.9千万亿次浮点计算每秒)，使用的是Tesla V100加速卡，但是升级下代NVIDIA GPU后可达8PFlops，而所需的GPU数量更少，因为新架构GPU（也就是7nm安培）可带来70-75％的性能提升！ 70%的性能提升已经很强大了，但这可能还不是7nm安培的真实实力，推特用户dylan522p计算出来的结果更让人吃惊，因为7nm安培GPU的性能提升超过100%。根据他的结果，7nm安培GPU的FP64性能可达18TFLOPS ，作为对比的是Tesla V100加速卡是7-7.8TFLOPS，最新的Tesla V100s是8.2TFLOPS。在Tesla系列的加速卡中，FP32:FP64是2：1的，也就是说7nm安培显卡的FP32性能可达36TFLOPS，是目前我Tesla V100系列的2倍还多，后者最强也不过16TFLOPS。从这些信息来看，NVIDIA下一代GPU——7nm安培的性能提升会非常大，100%以上的增幅远超Pascal到Volta那一代50%的性能提升，后者不过是从21TFLOPS提升到30TFLOPS，2000年代后成倍性能提升到GPU已经非常罕见了。当然，游戏级的7nm安培最终如何还不好说，因为NVIDIA最近几代GPU中Tesla与GeForce系列都是分开的，RTX显卡用的12nm图灵GPU完整版也只有4608个CUDA核心，Volta是5120个，而且游戏GPU的FP64性能阉割到了1：32，可比的只有FP32性能，TU102核心跟GV100核心的FP32性能差不多，都在14-16TFLOPS左右。总的来说，如果Big Red 200超算上的性能泄露是准确的，而且NVIDIA在游戏GPU上也没有大刀阉割，那么下一代的7nm安培游戏卡性能也会有明显提升，伴随而来的还会有RTX光追性能大涨，这样的性能优势显然会让AMD的big Navi旗舰卡再追一阵子。快科技责编：黎晓珊

转：ARM-GPU将在高性能计算中脱颖而出 2020-01-30 09:51:52 来源：EETOP GPU已经成为加速高性能计算工作负载的标准平台，至少对于那些已经对其代码进行了调整以完全支持加速的工作而言。但是直到最近，大部分加速还是发生在使用Intel Xeon或IBM Power处理器的主机系统上。但是随着Nvidia兑现了支持Arm作为X86和Power的对等产品的承诺，由Arm-GPU组合提供支持的HPC的前景已大大增加。从Nvidia的角度来看，考虑到Arm将在未来的HPC部署中取代X86，特别是在欧盟和英国，这当然很有意义。在美国和其它地方，Arm被视为向高性能计算生态系统注入更多多样性和竞争的一种方式。此外，Arm在超大规模、云计算和企业设置方面还具有更广泛的地理可能性。三大知名超级计算中心正在帮助Nvidia将这种Arm-GPU计算模型实现为HPC：日本的RIKEN，英国的布里斯托大学和美国的橡树岭国家实验室。以橡树岭为例，实验室已通过为基于ThunderX2的Wombat测试平台群集配备NvidiaV100 GPU并使用该设置移植和基准化一系列加速的HPC代码来着手这项工作。Wombat由16个预制的HPE Apollo70节点组成，每个节点都配备了一对28核的ThunderX2CPU，256 GB RAM和100 Gb / sec EDRInfiniBand网络接口。其中四个节点已配备Nvidia V100 GPU，每个节点两个，每个GPU都挂接到32 GB的HBM2内存中。与橡树岭的“ Summit”超级计算机上设置的V100 GPU相比，Wombat的HBM2内存是其两倍，但接口要慢得多，因为这些GPU使用PCI-Express 3.0链接而不是Nvidia专门构建的NVLink2互连。在软件方面，为Wombat用户提供了Arm增强的CUDA 10.1（预发行版）以及一系列Arm支持的编译器，包括gcc v8.2，gcc v9.2，用于HPC v19的Arm编译器。 3，以及具有CUDAFortran支持的PGI开发人员版本。支持库由OpenMPIv3.1和v4.0，以及UCX 1.7.0以及ArmPerformance Libraries提供的优化的BLAS，LAPACK，FFT等数学例程组成。在测试的应用程序中有用于比较基因组学的组合度量（CoMet）代码、格罗宁根化学模拟机（GROMACS）、用于分子动力学模拟、量子多体系统的动态簇近似++（DCA ++）代码、大规模原子/分子大规模并行模拟器（LAMMPS）代码以及材料科学的局部自洽多重散射（LSMS）代码等。橡树岭科学计算小组的计算科学家Wayne Joubert表示，移植是非常简单的，主要是需要更改应用程序构建脚本。例如，CoMet主要方法的移植，测试和基准测试不到两天。其他代码只需几个小时即可移植。 Joubert告诉我们：“这种体验非常类似于将代码从X86转移到Power架构。事实上，移植过程中最大的挑战是确保所有需要的系统软件都安装在系统上。” ORNL技术集成小组的HPC系统程序员RossMiller表示，移植代码的不同团队在SC19移植代码之前仅几周，因此在大多数情况下，他们只有时间来启动应用程序并进行移植。在Wombat上运行，而不是花费更多的劳动强度来优化其性能。例如，尽管GPU的HBM2容量是Summit上的GPU的两倍，但开发人员没有机会为额外的内存调整问题大小。 “至少在一种情况下（VMD），开发人员已经为X86代码编写了手动调整的SSE，AVX和AVX-512例程，” Miller指出。“ Arm端口必须完全依赖编译器生成的代码，而效率却不那么高。如果开发人员花时间为NEON指令集编写类似的优化例程，那么性能将更加接近。” 通常，GPU性能差不多是Summit的20％，差异归因于功能较弱的主机处理器（ThunderX2与Power9）以及缺乏优化。一些应用受到较低PCIe带宽的影响，而对于另一些应用，差异并不明显。考虑到所有这些因素，再加上Wombat使用的是预制硬件，在某些情况下还使用了预制软件，现在就对这种Arm-GPU产品的相对性能做出确切的决定还为时过早。同样，评估此特定系统的能源效率也为时过早。他们打算在将来考虑这一点。每个参与者Arm、Nvidia和HPC用户社区都在打持久战，没有人指望Arm能够像1990年代初X86接管HPC并成为未来三十年的主导架构那样，席卷整个HPC市场。但是Arm可以一点一点地在竞争中脱颖而出。（EETOP翻译自nextplatform）

看看这个配置是不是6000元挡位均衡搭配了我自己配的话，配置也差不多，算了半天，最多省200，还费事

//@FF6618 :中国芯吧正在竞选吧主，有两个狂热的某芯 //@FF6618 :中国芯吧正在竞选吧主，有两个狂热的某芯粉丝参选，想把持中国芯吧，捂住别人的嘴，为了避免这种情况，希望大家去支持LYLMNF。

回应关于最近龙芯被黑的感想龙芯吧小吧主@windows1809发了一个帖子：关于最近龙芯被黑的感想其中我是缺席的一个主角因我长期被他封，所以把回应发在这里严正声明: 我不是职业水军，我同所有的国内CPU厂家都保持正常的工作往来，我作为嘉宾出席了龙芯、飞腾的发布会就是明证。相关网络发文完全是我个人行为，与所有其他人无关，也没有因此拿过一分钱。我同知乎上出现的4000 spec2006成绩的文章无关，但我认可其中的数据是实测数据。那篇文章中没有任何地方说跑Speccpu测试只要1个小时左右。如同我已发文解释我的动机，我只是抱着讨论的态度来龙芯吧，不是故意抹黑谁，是龙芯吧里一些人的的反应激怒了我，之后我越看相关的材料，越觉得问题严重，所以才有了后续一系列文章。关于测试数据，我已经在之前的发文中解释，不再赘述，成绩的巨大差异同软件优化、工程样片、测试参数等都有关，我不否认龙芯有可能在后续优化出20分，但是即使这样，这么多项测试数据落后，不能都归因于优化不足，不要因自己的立场就否认事实，我的观点没有变过：龙芯3A4000没有达到宣传的主频2G、性能翻番，超过16/14nm ARM 的目标.

只发图不说话

转贴一些关于龙芯软件生态的讨论最近关于新发布国产CPU性能测试的话题比较热，龙芯3A4000在现有的测试中表现不佳，有人认为是龙芯的操作系统等软件生态拖了后腿。软件滞后有整体生态走下坡路的原因，也有部分原因是龙芯自己的策略出现问题。我认为目前网友基于内核3.10版本的中标麒麟测试是恰当的，无可厚非，因为这是目前应用最广最常见组合，龙芯一直大力支持主推的也就是这个版本。龙芯一直宣称要做人民的CPU，那应该认可广大用户能用到的性能，比PPT上的指标更有分量这个道理。我找了一点材料贴在这里，让大家对龙芯的软件生态现状有个了解。很多是一些熟ID所发，在此对他们的贡献致谢。

7zip测试不专业、不全面？那就来一个全面专业测试吧！龙芯飞腾一直奇怪那篇被收回的龙芯回应文章中为何有关于文档打开速度的测试，后来发现还有一篇测试文章，观察者网PVT发表，我转过来大家看看。

自主CPU扩展指令的能力、动机和效果一直以来，能否自行扩展指令集，成为某些人判断CPU自主性的一条标准，甚至用这个来攻击几家抬高一家，成为粉丝信仰源泉之一。本文本着实事求是的态度，分析一下这个问题。

再揭铁流移花接木，772所功劳被抢偶然发现，关于北斗导航卫星全面国产化的抗辐照CPU幕后英雄，不同报道有矛盾之处，我稍作探究，又把铁流捉了个现行

温故而知新，从数据看测试“优化” 最近龙芯3A4000发布，PPT上18/21分的单核spec06成绩令龙粉欢声雷动。那怎么看待这个成绩呢？大家都知道，我最近收集并发布了网友测试的7zip性能数据，展会现场龙芯3A4000最好得分6686，而前几天飞腾发布会上，FT2000-4得分9934，从这个数据看，龙芯CPU整型性能是飞腾的2/3，比3A3000的典型成绩4179提高50%，但龙粉一直认为4000性能翻番，如此一来就存在一个矛盾，spec06成绩为啥这么高？先说我的结论：相比精心打扮的发布测试成绩，我发的7Zip在大部分情况下，更能体现用户实际能用的性能。

为什么越来越多云计算厂商推出 ARM 架构产品？铁流很有影响的一个论点就是：高通都不做ARM服务器了，ARM服务器打不过Intel没有前途，生态也不行，还不如支持他鼓吹的那家。然而事实真的如铁流所说么？最近看了一个知乎的问题，转载过来看看。问题：最近两年，领先的云计算厂商都在积极研发和部署 ARM 架构产品，包括采用自研 ARM 数据中心 CPU 的 AWS（基于 Graviton 2 的 EC2 实例）、华为云（基于华为鲲鹏 920 处理器的鲲鹏云实例、Redis、大数据解决方案等），以及采用第三方 ARM 芯片的微软 Azure（基于 Marvell 的 ThunderX2）。甚至包括 Google 也一直计划部署 ARM 服务器。国内的私有云厂商也推出了支持华为鲲鹏的云计算产品。为什么这些云厂商都在大力投入 ARM 架构？它有什么突出优势？在云端，ARM 是不是未来通用计算的主流？作为开发者，我们是否现在就要开始向 ARM 迁移？

Arm现神队友，英伟达GPU为ARM超级计算加速在最新的超级计算大会上，NVIDIA创始人兼CEO黄仁勋宣布了一套用于构建GPU加速ARM服务器的参考设计，从而大大扩展GPU加速对于超级计算机的支持。 2019年11月21日作者：Teardown

转贴:【图片】接到邀请函,飞腾大会【飞腾处理器吧】_百度贴吧【图片】接到邀请函,飞腾大会【飞腾处理器吧】_百度贴吧来自：http://tieba.baidu.com/p/6398993899?sharefrom=tieba

转贴:【图片】关于性能快一倍! 龙芯电脑流畅体验UOS操作系统【... 【图片】关于性能快一倍! 龙芯电脑流畅体验UOS操作系统【中国芯吧】_百度贴吧来自：http://tieba.baidu.com/p/6394317498?pid=128841151709

转贴:关于性能快一倍! 龙芯电脑流畅体验UOS操作系统【中国芯吧... 关于性能快一倍! 龙芯电脑流畅体验UOS操作系统【中国芯吧】_百度贴吧来自：http://tieba.baidu.com/p/6394317498

关于性能快一倍! 龙芯电脑流畅体验UOS操作系统看到这篇文章，最先感觉是一个爱好者的体验文章，没在意。没想到很多龙芯吧里的人把它当成大喜报，三四个人转贴，一片欢呼，我就仔细探究了一下。

转一篇文章，关于如何客观看待SPCCPU测试优化因为speccpu的影响，很多CPU厂家有一个SPEC优化团队，目标就是用软件优化提高成绩，如何看待这种优化提分，哪些是用户用不到的，怎么公平对比？今天逛zhi~hu时看到讨论鲲鹏920性能时发现有一些有意义的讨论，对于speccpu优化问题，进行了分析。

对 <龙芯3A4000性能大飞跃龙芯自主生态初露端倪>的点评最近，铁流发了一篇文章，提及了贴吧中的一些讨论，本文就此点评一下

转贴:最近实测的各国产CPU 7zip成绩【中国芯吧】_百度贴吧最近实测的各CPU 7zip成绩【中国芯吧】_百度贴吧来自：http://tieba.baidu.com/p/6369045415

转贴:最近实测的各CPU 7zip成绩【中国芯吧】_百度贴吧最近实测的各CPU 7zip成绩【中国芯吧】_百度贴吧来自：http://tieba.baidu.com/p/6369045415

最近实测的各CPU 7zip成绩厂家宣传水分大，最近网友借着展会机会，实测了一些国产计算机的7Zip成绩，均有照片或截图，我做了一个图表，可以供大家直观比较各国产CPU性能，为了对比，还插入几个Intel、AMD CPU

给RISCV开源架构泼泼冷水转自 zh 给开源架构泼泼冷水低空飞行的熊猫享受副园长待遇的老员工常成等 101 人也赞同了该文章一楼占座防删

最近看ZHI HU,对龙芯的评价挺有意思反正龙芯吧龙黑吧都发不了，就发这里了问题：如何评价龙芯处理器性能怎么样？下一代CPU同频性能可达英特尔90%？

自主创新，兼容主流：兆芯走出一条x86国产化可行之道时间：2019-03-29 作者：顾正书由ASPENCORE举办的“ 2019中国IC领袖峰会“特邀上海兆芯副总经理罗勇博士为我们分享了兆芯六年的发展历程，如何持守“自主创新，兼容主流”的发展理念，而走出一条国产x86解决方案自主创新之路。在今天由ASPENCORE旗下《电子工程专辑》、《电子技术设计》、《国际电子商情》三大媒体联合举办的2019年中国IC领袖峰会上，上海兆芯副总经理罗勇博士为我们分享了兆芯六年的发展历程，如何持守“自主创新，兼容主流”的发展理念，而走出一条国产x86解决方案自主创新之路。首先，从发展理念上要有开放的心态。我们强调自主创新，不是闭门造车，一切都从头做起，而是要面向国际，侧重国民安全。我们一定要杜绝“民粹”思想。兆芯从一开始就积极拥抱国际主流x86产业生态，同时自主把控核心技术，现在已经全面掌握x86全平台实现技术。要开发出完整兼容Windows软件和主流硬件外设的x86电脑，光有CPU还是不够的。兆芯目前同时掌握了PC整机的三大核心技术，即CPU、GPU和Chipset(主板芯片组)。这样才能有比较强的产业化能力，和专业高效的服务能力。虽然兆芯从威盛团队承接了大量x86技术资源，也得到了英特尔的x86专利交叉授权，但x86 CPU内核还是要独立开发。同样都是x86 CPU,英特尔和AMD的就完全不同，因为这种授权不是像Arm那样的架构或内核授权。这意味着兆芯必须开发自己的CPU架构和设计，以及GPU架构、芯片组设计和IP定制电路设计。除硬件外，软件也都需要自己开发。照罗勇博士的说法，兆芯是从南桥，到北桥，再到模拟芯片和电路，都是自主研发、测试和验证。从定义新架构框架和目标，到完成设计，进入掩膜流量，系统测试，直到量产阶段，兆芯500人的团队需要花费一年半的时间，其中涉及4000个计算核心、占用200TB磁盘容量、10台最先进的硬件仿真和验证平台。成功量产也离不开业界合作伙伴及行业先进标准，三大EDA/IP供应商都是兆芯的设计和验证合作伙伴，其晶圆代工和封测合作方包括台积电、华力微电子和通宝机电等。兆芯已经研发出四代CPU，从40nm、28nm到目前的16nm，CPU主频也从小于2G发展到现在的3G。预计今年6月份推出的KX-6000系列性能已经接近英特尔的7代i5。在去年的上海工博会上，《微型计算机》杂志对KX-6000工程样机(3.0G主频和八核)做了第三方评测。最后得出的结论是跟英特尔第八代I5基本上不相上下。虽然兼容主流PC生态，但兆芯仍要建立自己的生态体系。兆芯涉及的整机形态十分丰富多样，从台式机、一体机、笔记本，到嵌入式工控机和服务器存储设备等。这些CPU芯片国产化产品在政府机构、军政系统等对国家安全要求很高的场合有着广泛的需求，很多产品在使用中用户体验已经跟英特尔/AMD电脑没什么差别。为搭建完整的国产化产业生态，兆芯联合了国内电脑、网络、软件等多家企业、高校和科研院所。基于兆芯芯片的电脑系统已经在多种高端会议和应用场合得到验证，比如中共第19大、2018年中非合作论坛，以及上海银行等。罗勇博士最后总结到，兆芯从成立开始，就秉承了既要做国产自主可控，又必须面向国际兼容主流的理念。自主是第一要求，但是我们一定要开放，一定要融合，去拥抱已有的生态，而不是去替代它。因为替代这个已经有40年发展历史的市场是不现实的，市场已经决定了什么是主流，我们只要在其中保持自主创新，相信就可以走出一条可行的成功之路。

老胡对MIPS和ARM是否存在双标？ MIPS和ARM这两个公司，商业模式类似，都是自己不做CPU，搞CPU授权，也都有架构授权IP授权等。但把老胡历史上发的文章串起来，就比较有意思了，咱们按年代看看他对MIPS和arm的态度。 2005年先是不承认侵权MIPS，甚至不想提类似MIPS架构。2009年为了产业化不得不买MIPS授权并进行自我辩护，MIPS成了对抗X86的朋友。按这种逻辑，ARM至少不是敌人吧。 2015年，飞腾1500A出现后，ARM就变成敌人了，先是信心满满希望国家不要搞政策倾斜扶持要自由竞争，竞争了几年后，2019年又转而不要竞争了，直接要求独占党政军市场不要竞争对手进，说到2020年龙芯才能适度参与开放市场竞争。这种变来变去的表态，双重标准的典型，到底为啥呢？还不是后来因为国产ARM成了自己的竞争对手，都盯着有限的体制内市场，别人多卖一片自己就少买一片CPU，果然天下熙熙皆为利来天下攘攘皆为利往，学者的客观科学，哪里比得上董事长老板的“钱景”。

分享贴子分享贴子

格局决定命运，龙芯飞腾技术路线对比飞腾一开始类似龙芯，选了一个走下坡路的sparc指令集，做出了FT1000，拿到了国家核高基支持，按理说体制内的他们一直可以做下去，国家支持力度不会比龙芯差，但他们认清方向后，敢于革自己的命，重新选择了走可以持续发展的ARM路线，而龙芯却固执地在MIPS这条船上慢慢下沉。转一篇2015年文章龙芯吐槽：我们陷入MIPS陷阱是上了小日本的当! 总所周知，龙芯早在2011年就已购买了mips64位架构授权，使得龙芯可以毫无顾虑的迈向64位高性能芯片领域。然而，仅仅在龙芯购买MIPS授权后的一年之后，2012年11月6日MIPS被多家科技企业联合肢解收购。其中ARM母公司以3.5亿美元买下了MIPS全部的498项专利永久授权和另外82项专利交叉授权。ARM购买MIPS专利的最大原因和龙芯购买MIPS64架构授权的原因不谋而合，是因为ARM64位架构和MIPS 64位架构重合度高达70%，不肢解MIPS以后将面临巨额的专利侵权赔偿。究其历史原因，为何龙芯之父胡伟武在立项当初选择了今天已经破产倒闭的MIPS，而不是今天正在如日中天的ARM？龙芯之父胡伟武坦言，龙芯项目开始前期调研的时间点是2000年左右，当时ARM的确有被他的团队列入考虑范围之内。但是2000年之前ARM实在太弱了，那时候ARM公司能拿出来的最强核心设计仅仅只是今天看来非常原始的ARM11，没有乱序执行，没有多发射，没有缓存系统。而龙芯当初的目标是桌面和超算系统，要求实现高运算性能，能够和X86体系分庭抗衡。相比之下，MIPS架构在90年代就实现了乱序四发射、深度流水线，分支预测，寄存器重命名，Load-Store推测等超前设计，是在全世界范围内能和X86体系分庭抗礼的CPU架构之一，曾经一度辉煌过。90年代风靡世界的家用游戏机普遍采用了MIPS架构CPU，如大家熟知的的SONY的PLAYSTATION1中的R3000A，后来的PSP的R4000，以及任天堂N64的 R4300i，以及摩托罗拉，爱立信，诺基亚、思科、高通、SUN、3COM等通讯领域巨头在交换机、路由器、通讯器材中均使用了MIPS芯片。在x86阵营经营多年的专利壁垒无法攻破的情况下，当时能为中国CPU起步的选择无非就是MIPS、ALHPA、ARM。ARM还在幼年阶段难堪重任，MIPS架构以其出色的计算性能被大量日本科技企业作为用户终端设备的MAIN CPU，这一点具备重要借鉴价值，龙芯之父胡伟武因此选择了MIPS。随着MIPS公司的轰然倒塌，整个MIPS体系都摇摇欲坠，整个MIPS产业链都在逐步转向ARM，连传统的路由器也是如此。思科、朗讯、华为等老牌讯通企业算是MIPS的最忠实用户了，到了移动智能时代也不得不改变步伐，现在新产品也在转ARM架构。新一代智能路由了，如小米路由、极路由、华为智能盒，清一色ARM！为啥大家都在用ARM？到不是因为ARM天天吹我们世界第一CPU。而是乔布斯的IOS，谷歌的安卓彻彻底底的带动了ARM生态圈的发展，这是软件反哺硬件的最成功案例没有之一！这就是为什么建设生态圈远比研发单一硬件本身要重要的多的多的原因！可以这么直白的认为，说胡伟武完全是上了小日本的当选了MIPS陷入今天进退两难的地步是一点也不过分的！

分享贴子分享贴子

大家怎么看大家怎么看

感觉有道理感觉有道理

大家围观，有点意思大家围观，有点意思