hcdpz的个人资料

MIPS基础架构的第5版(“R5”)包含了重要的功能，包括虚拟化simd MIPS基础架构的第5版(“R5”)包含了重要的功能，包括虚拟化和SIMD(单指令多数据)模块。亮点基于多年开发的MIPS体系结构的主要版本，包括下一代基于MIPS的产品的重要功能。 MIPS SIMD Architecture （MSA）架构模块为广泛的应用提供了更多的计算能力。 Scalable Virtualization （VZ）可扩展虚拟化模块为从小型微控制器到高端企业的一系列应用提供安全的硬件虚拟化。 Enhanced Virtual Addressing （EVA）增强型虚拟寻址技术为大型现代工作负载扩展了可用内存空间。流行的多线程和DSP数字信号处理器扩展现在作为模块集成在基本的微处理器体系结构中。回复 1楼 -chipo- FT2000+12 Release 5 ("R5") of the se architecture incorporates important functionality including virtualization and SIMD (Single Instruction Multiple Data) modules. Highlights Major release of the MIPS architecture-based on years of development-includes significant functionality for next-generation MIPS-Based™ products MIPS SIMD architecture (MSA) module provides more computational capability for a wide range of applications Scalable Virtualization (VZ) module provides secure hardware virtualization across a range of applications from tiny microcontrollers to high-end enterprise Enhanced Virtual Addressing (EVA) technology extends available memory space for large modern workloads Popular multi-threading and DSP extensions are now integrated as modules within the base MIPS architecture 回复 2楼 2020-02-04 17:13 -chipo- FT2000+12 曾经的是基于MIPS32/64R3（共216条基础+311条DSP指令），通过MIPS架构的UD1进行扩展基础扩展LoongEXT（共148条指令）如定义乘除、多核同步、128位访存、CAM 虚拟机扩展LoongVM（共5条指令）支持云计算需要的多操作养统快速切换二进制翻译扩展LoongBT（共215条指令）支持X86/ARM到LoonglSA的高效翻译向量指令扩展LoongSIMD（共1014条指令） 128位（32位模式）及256位（64位模式）向量指令最新的是基于MIPS32/64 R5（共279条基础+159条DSP指令+900条SMID+37条加解密）基础扩展LoongEXT（共186条指令）如定义乘除、多核同步、128位访存、CAM 二进制翻译扩展LongBT（共157条指令）支持X86/ARM到LoonglSA的高效翻译向量指令扩展LoongSIMD（共477条指令） 128位（32位模式）及256位（64位模式）向量指令好了，问题来了那些少掉了指令是被废弃了还是？？？？怎一个乱字了得。回复 3楼 2020-02-04 17:28 FF6618 KP92013 回顾一下3A2000发布时的文章龙芯发布新一代四核CPU：自主指令集来了观察者网据快科技报道，今天，龙芯201新品发布暨合作伙伴大会在北京朗丽兹西山花园酒店举办，从会场刚刚传来最新消息，新一代四核处理器3A2000、3B2000正式发布。其实3B2000已经在6月底亮相，主要应用于双路8核以及四路16核国产服务器。而3A2000此次则是首次与外界见面，它对标的是Intel\AMD消费级产品。除了自主架构GS464E，龙芯这次还有一个创举是自主指令系统LoongISA。LoongISA指令系统在MIPS64架构500多条指令基础上，在基础指令、虚拟机指令、面向X86和ARM的二进制翻译指令、向量指令四个方面增加了近1400条新指令。龙芯技术人员称，耗时三年研发的GS464E综合技术水平达到了与Intel的第三代酷睿IvyBridge及AMD的Steamroller相当的水平，而微结构是CPU最核心技术，是决定性能、功耗、成本、安全性的最重要因素。该人员还提到，龙芯自2010年市场转型以来取得一些成绩，也遇到一些问题，比如与其他处理器主频只差1倍，但性能差10倍这种问题，都是龙芯接下来要去努力改善的。回复 4楼 FF6618 KP92013 看看铁流这篇文章中有没有误导？ MIPS开源后龙芯获得主导MIPS生态建设的的历史机遇铁流发布时间：19-01-0513:23在一次对龙芯首席科学家胡伟武的采访中，有细心的网友发现，龙芯3A4000的展板上出现了MIPS64 R5的字样，因而有网友表示：龙芯偷偷去买了MIPS64授权，言论中还带一些嘲讽和酸味。前不久，MIPS宣布开源，从现有的资料显示，MIPS这次开源主要是针对MIPS64 R6的，那么，龙芯的MIPS授权到底处于什么情况？是否还偷偷的买了MIPS64 R5？还需要再花钱买MIPS指令集授权么？龙芯课题组成立于2001年，最初，胡伟武老师是非常欣赏Alpha的设计，是打算借鉴Alpha指令集搞一套自己的东西的。但胡伟武的师兄表示，现在龙芯课题组就十几个人，一间40平方米的实验室，仅仅是一个学术研究课题组而已，根本没有能力自己搞一套体系，因而就选择了当时仅次于X86的MIPS。在早期学术研究阶段，龙芯是没有获得MIPS指令集授权的，不过，根据法律规定，少量用于科研和教学这类非商业活动一般是不属于专利侵权的范畴，全球很多大学在教学和做科研课题时候都有用MIPS的，且龙芯在很长一段时间一直没有商业化量产，更多是一款学术产品。因而在当时有没有MIPS授权都无所谓，并不能成为一些舆论攻击龙芯的黑点。之后，ST花3000万买下龙芯5年的生产代工权，每生产一片给龙芯2美元专利费，如果存在知识产权纠纷，ST也不可能这么做。在2008年金融危机后，美国股市一泻千里，科技股更是成为重灾区，本身就和X86竞争中处于明显劣势的MIPS在无法从股市中吸血的情况下，已经难以为继，准备卖身。而在这个时候，龙芯果断选择出手，购买了MIPS指令集永久授权。由于时机挑的好，龙芯谈的条件非常优惠。那么，为何不是把MIPS收购，而只是购买指令集永久授权呢？主要是两个原因，第一是龙芯很穷，买不起，第二是这种收购不可能通过美国政府的审查。由于MIPS逐渐边缘化，因而在谈判时候底气也有限，龙芯拿到的条件是相当优惠的。比如ARM指令集授权很贵，但龙芯只花了很少很少的钱买MIPS指令集授权。又比如ARM买指令集授权后，是不能把自己开发的IP核对外授权的，但龙芯可以对外授权自己的IP核。还比如ARM指令集更新后需要另外花钱买，龙芯则不需要，MIPS64 R5/R6这些更新龙芯都能继续用，不需要再买。而且在MIPS开源后，据小道消息披露，龙芯用MIPS，已经完全免费了。铁流也向Wave Computer的员工求证，得到的回复也是开源后龙芯全部免费用。究其原因，铁流猜测和MIPS一直被边缘化有关。在Imagination持有MIPS时期，一直没有投入多少资源进行发展，导致在高性能CPU上已经被龙芯超越，且龙芯在MIPS的生态建设上贡献良多，已经开始引领MIPS的生态建设，像几个重要的API，以及MIPS的JAVA虚拟机、GS引擎等都是龙芯贡献的，而且龙芯还是实际的维护者，像MIPS的GCC编译器、Linux内核等，龙芯也贡献了大量的代码。面对这样一个合作伙伴，MIPS自然会给出更加优厚的条件，龙芯和MIPS谈判的时候自然会有更多底牌和筹码，获取更加优惠的条件。加上以前龙芯在生态建设上的不懈努力，在MIPS开源之后，龙芯有望进一步加大MIPS生态的话语权，甚至是主导MIPS生态建设。收起回复 6楼中国芯时代: 德邦总管：如果真的龙芯引领MIPS生态，那么何必需要升级到MIPS R5呢？龙芯基于MIPS R3+自主扩展指令集不香吗？过个几年等MIPS R3里的专利都过期了，就真的相当于是自主指令集了。2020-2-4 19:16回复 CN: 回复德邦总管 :R5指令多些用途，功能加强了，龙芯想用R5不行吗，龙芯也只用到R5，在MIPS指令用于桌面、服务器方面，你说下谁引领2020-2-7 11:04回复中国芯时代: 回复的撒旦法师法03 :跟随还差不多，跟在MIPS后面亦步亦趋的，自主扩展指令集为啥不香了呢？2020-2-7 16:10回复 CN: 回复德邦总管 :兆芯跟随x86很香吧，龙芯的自主指令比采用的MIPS基本指令多很多，你感觉龙芯扩展的指令不香吗，2020-2-7 16:37回复太液提督管叉叔: 回复的撒旦法师法03 :根本不是这样。 MIPS基础指令279条，DSP指令159条，SIMD指令900条，37条加解密，5条虚拟化。龙芯自己的扩展只有基础扩展186条（多核协同和CAM），二进制翻译157条，SIMD扩展477条。龙芯的扩展指令集不止是少数，而且离开MIPS根本就不能构成一套指令2020-2-7 19:29回复我也说一句还有1条回复，点击查看不要加班 C8611 回复 7楼 2020-02-04 20:50 来自Android客户端 FF6618 KP92013 铁流为啥被人骂，看看这篇文章中的问题： 1、ARM买指令集授权后，是不能把自己开发的IP核对外授权的，但龙芯可以对外授权自己的IP核。贵州华芯通虽然没有做下去，但是证明拿到ARM指令集授权高通的IP核可以授权给华芯通。 2、MIPS64 R5/R6这些更新龙芯都能继续用，不需要再买。没有确切的证据证明这一点，不过个人认为MIPS不会签这种协议的，这把自己公司未来技术都预售了。 3、在MIPS开源后，据小道消息披露，龙芯用MIPS，已经完全免费了。事实是开源R6版本不影响之前版本的授权费用，每隔几年的授权费是免不了的，果然是小道消息。 4、在MIPS开源之后，龙芯有望进一步加大MIPS生态的话语权，甚至是主导MIPS生态建设。 MIPS开源的R6版本，和龙芯没啥关系，龙芯继续授权R5，原因是其自身扩展的指令在技术和生态上，还是不如R5，这点从4000相对3000在虚拟化、SIMD的提升上就能看出来。 5、最初，胡伟武老师是非常欣赏Alpha的设计，是打算借鉴Alpha指令集搞一套自己的东西的。这一点，从来没有发现其它材料佐证，难道是老胡对铁流的面授机宜？ 6、龙芯果断选择出手，购买了MIPS指令集永久授权。永久授权但是要定期缴费，同时采用完全美国技术的该授权也要遵守美国政府出口管制，说不定哪天就不可抗力了铁流文章中承认的情况：把MIPS收购，这种收购不可能通过美国政府的审查。这点说的没错，前几年有中资参与的基金收购原来的MIPS母公司，也需要把MIPS剥离。收起回复 8楼 2020-02-04 21:12 贴吧用户_Q6yGKU7: 已经不看铁流大作了，那真是呕心力作(恶心腻作)2020-2-4 22:49回复我也说一句 X37B FT2000/46 不愧是FF大神 FF6618 KP92013 看这句话：而且在MIPS开源后，据小道消息披露，龙芯用MIPS，已经完全免费了。铁流也向Wave Computer的员工求证，得到的回复也是开源后龙芯全部免费用。学学铁流的话术：据小道消息（编瞎话自己没责任）向Wave Computer的员工求证（哪个员工，反正不告诉你，记得以前还说向xx公司高管求证，好像谁都认识，其实啥也不能确认）开源后龙芯全部免费用（就是不告诉你开源的R6，全世界都免费用，不多龙芯这一家，就不告诉你R2-R5还是不免费！这就叫选择性引导，一个全部免费真是敢说）收起回复 10楼 2020-02-04 21:40 良民端好621811: 回复 FF6618 :舆论引导是这样的啦。我觉得马前卒的睡前消息这个节目挺好的。2020-2-4 22:37回复 -chipo-: 铁流的话，随意的很！2020-2-5 10:38回复 LYLMNF: 回复骁龙2212 :把那个帖子挖出来看看呗2020-2-5 12:15回复 chipo-: 回复 LYLMNF :恐怕够呛了，贴吧里，2017年以前的帖子都没了。2020-2-5 12:49回复 mygo358: 回复 -chipo- :此人就是就是技术盲，他的话术都是引用朋友或我认识的行内人士，没有一个是他自己验证的。2020-2-22 15:00回复我也说一句还有6条回复，点击查看 kyokusanagi98 KP920s8 现在看见胡大嘴就恶心，天天还自嗨得很，尤其在台上演讲得时候好像觉得自己是乔布斯一样，说什么自建生态，你在建吗？收起回复 12楼 2020-06-24 09:40 mygo358: 以前对他印象可以的，现在来看问题确实有，都是还是对搞科技的人抱有敬畏之心的。2020-6-24 14:32回复披萨卷大葱666: 你终于认清某大嘴的真相了，问的好，他自建啥生态了，顶多把.net之类的迁移过来，这就成自建了？2020-6-24 15:43回复我也说一句小狗和小猴羞耻汉芯1 真好奇这么多翻译指令龙芯想拿来干啥回复 13楼 2020-06-24 15:16 来自Android客户端 FF6618 KP92013 前几天MIPS快破产的消息，引起一些人兴奋，其实： 1、MIPS倒了，龙芯会彻底失去在国际开源软件领域最后的一点生态，只能依靠自己那几号人搞移植，而龙芯封闭生态的质量和发展进度堪忧，这恐怕不是好事 2、因为美国政府的原因，龙芯不可能收购MIPS，这个MIPS会永远成为龙芯的鼻环被人牵着，而且是老美直接牵，不像arm还有缓冲 3、老胡在书中承认，每隔5年需要交授权费，这说明以前MIPS永久授权的说法是永久续费的意思 4、龙芯是增加了增加近1400条新指令，并不想承认MIPS的渊源，但我了解其自扩指令并不成功，涉及侵权并低效的X86和ARM二进制翻译指令且不说，虚拟机指令和向量指令龙芯本想自己搞，但效果不行，2019年KVM好不容易调通效率只有80%多。所以龙芯3A4000实际上又采纳了MIPSr5版本中的VZ和MSA，靠着这两种指令的加持，龙芯才有可能把speccpu“优化”提高，才有可能有实用的KVM虚拟机。这样来看，龙芯仍旧在吸纳MIPS技术，MIPS倒了，龙芯除了宣传上得意，又有何实际好处？回复 14楼 2020-07-03 11:25 -chipo- FT2000+12 龙芯瞎折腾了一圈自主指令集的结果就是，Linux 的虚拟机不支持 3A3000。后来 3A4000 改回用 MIPS 官方的 R5 虚拟化方案。真是呵呵了！想当初那么高调的宣传虚拟化技术，其实在 Loongnix 以外的操作系统上根本跑步起来。UOS 统信、Fedora 龙梦，都是从 3A4000 开始支持虚拟化的！因为上游支持啊！收起回复 15楼 2020-07-03 20:53 来自Android客户端中国芯时代: 还要当初更高调宣传过的二进制翻译技术，不管什么指令集他翻译一下就可以支持了。2020-7-3 20:56回复太液提督管叉叔: 回复德邦总管 :做一些针对性设计提高模拟效率是可能的。2020-7-4 14:47回复我也说一句 -chipo- FT2000+12 真没想到，解决了 MIPS 却没解决芯联芯。回复 16楼 2021-06-03 19:47 来自Android客户端当家 KP920s8 龙芯在只有r4授权的情况下，实现了一些r5才有的功能，不知道是不是科技的进步回复 17楼 2021-06-03 20:14 来自手机贴吧 FF6618 KP92013 3A4000实现了一些MIPS有专利的指令，才把虚拟机向量搞利索，交授权费是应该的，这点如果龙芯拖欠是没道理的，毕竟现在3A4000还在销售。 3A5000短时间内改出来，从测试成绩上看与3A4000设计差不多，这点龙芯自己也承认（tick-tok里的tok）龙芯想靠改指令集规避MIPS专利，从而不再交授权费，但是芯连芯提出来，龙芯行为超出了授权范围，比如宣传可以随便改自由发展MIPS，完全自主新指令集等，3A5000也是MIPS发展而来，自由发展MIPS是虚假宣传也没啥争议，这点授权协议白纸黑字写着没跑。因此目前的问题焦点是：新的loongarch是否是从MIPS架构改造而来，用没用专利技术？这点就比较罗生门了，问题已经提出需要龙芯有效回应，但是不是说所有的risc都差不多么？不是说100%效率运行MIPS么，那么结构不可能和MIPS不相似吧，这能洗白？为了XC市场、上市发财，我估计最可能结果就是破财消灾，并发个两方能接受下得了台的声明，鱼死网破并不符合双方利益。过几天芯联芯得钱签个不公开协议不再挑事，龙芯吧继续夸龙芯从胜利走向胜利，无惧专利流氓威胁云云

申威121处理器申威121处理器是基于第三代“申威64”核心（C3）的国产嵌入式处理器，主要面向高性能嵌入式应用需求。申威121采用SoC技术和AMBA总线结构，单芯片集成了1个64位RISC结构的申威处理器核心、1路64位DDR3存储控制器接口和多种标准I/O接口。最高工作频率可达800MHz。 AMBA总线是arm的通用总线结构。看来申威也用arm的东西嘛。

龙boy们不但要在龙芯吧堵别人的嘴，还要在整个贴吧都堵别人的嘴贴吧不是你龙芯家开的，想堵住悠悠众口，做梦去吧！有胆做龌蹉事，就不要妄想永远蒙蔽天下众人出来骗，终究是要还的！

转贴:龙芯FAQ,写给对龙芯有误解的人仔细看看也许能有用_龙芯吧... 看看当初龙芯是怎么描述指令集的作用的. 龙芯FAQ,写给对龙芯有误解的人仔细看看也许能有用_龙芯吧_百度贴吧来自：http://tieba.baidu.com/p/147425180

处理器指令集，不是一本武功秘籍处理器的指令集也经常被人误会是武功秘籍；以为有了指令集就能笑傲处理器芯片江湖。其实作为一个处理器芯片，能否笑傲江湖，和指令集的关系不那么大。与武林秘籍不同的是，任何一种CPU的指令集全部是公开的。所有技术人员都能看到，不论是行业大牛还是入行小白，均可一睹芳容。获取CPU的指令集，不需要主角光环；不需要掉悬崖，进山洞，甚至不需要高人指点。上网就能找到，如果找不到，说明这个指令集用的人不多。那如果找不到，怎么办？找不到也不要紧，软件工程师直接反汇编一下，就能完全看到运行在这个CPU的每条汇编的二进制码，可以得到这个CPU采用的每条详细指令集。没有任何的保密需要。也保密不了。

飞腾对自己CPU的评价 1 月 31 日，飞腾信息技术有限公司副总经理张承义博士接受凤凰卫视专访，以下为张承义答记者的内容。 "我们更看重的是量级的变化，国产芯片如果没有达到一定用量，我们很难说这个芯片是可用的、好用的。正因为达到了超百万的用量，我们才敢说国产芯片已经到了一个完全可用的程度 ”。 “ 我们不希望以一种强制的手段告诉客户，这是国产的东西所以你必须要用，其实我们希望推出的产品能切实地满足客户的需求、满足客户的应用和一些痛点、难点，解决他们的问题，而不是单纯的要做国产替代。” “ 现在的芯片竞争实际是处于战国时代，原来我们会说国外的几个巨头占据了这个芯片市场。现在随着信息技术的不断发展，趋势的不断变化，不管是国外还是国内都进入了战国的时代，谁抓住了用户的需求，谁和用户的需求走得更近，未来在行业内谁才会走得更远。” 看来飞腾对自己的CPU，评价是“已经达到完全可用”。比之某芯的 “补课完成、大学毕业、接近天花板”，还算是比较谦虚的了。

关爱“不及格”人士，来贴贴被自嗨吧封禁的奇葩理由出于对“不及格”人士的关爱，我带个头满足他的要求。贴一贴我被自嗨吧封禁的奇葩理由大家有类似经历的，也可以一起来关爱

飞腾FT2000/4 运行win10

【反碰瓷】今年飞腾市占率，杨威博士如此说。

最新信息，飞腾XC中标情况及占比在今天下午的“智能协同云技术与发展高峰论坛”上，飞腾副总经理郑志群报告了飞腾在XC市场的中标及占比情况。张的原话是“这是一个多月前的数据”，按日期推测应是截止10月底的数据。

《逐梦天河》

长城面向消费者市场，推出飞腾电脑体验店 @消费者，长城电脑邀你来体验中国长城用十年时间，研制出全系列国产化自主安全电脑，击穿各级漏洞风险，以中国架构—PK体系为基础，加入立体防护安全可信链，兼容移动生态，形成具有“PKS-M”特色安全金甲的台式机、一体机、笔记本等产品，重新定义PC消费者市场。现在，它们悉数集结，等待和你的近距离会面。 2座城市，5大类别，中国长城自主安全计算机旗舰店即将开业。

ZT：如何看待2020年7月28日Arm中国团队发出的公开信作者：lolicon 来源：知乎原来肯定是毫无意义的挣扎，这种玩法不符合正常的商业规则，在当今社会完全行不通。但是今日是何时啊，当今是懂历四年八月，白宫皇上圣明，群贤在位………… 远的是美国对中国企业下手，ARM作为第三国企业你说被迫也好自愿也好，反正也是跟着动手了。中的是美国对中国企业的打压变本加厉，已经连基本的法律、商业原则都不讲了，直接“和买”tiktok。近的是ARM自己犯到中国手上了，ARM的老板软银在欧美投资失败最近两年估计亏了近500亿美元，急需出售ARM回笼资金（避免破产），中国大陆是ARM的主要市场，中国监管当局对ARM任何可能的出售行为具备否决权………… 从世界角度说，ARM的IP是当今世界重要的基础设施，关乎世界经济和人民生活的正常运行，属于重要的公共财产。我国作为负责任的大国，不想剥夺ARM公司对其财产的受益权，但是也要防止对这一重要公共财产的滥用和误用。从中国自己的角度来说，为了维护国家利益，也要防止美国政府利用ARM公司对中国的打压和霸凌。那么中国监管当局出于防止市场垄断维护市场经济秩序，当然可以对ARM提出一些整改意见，例如提供包括再授权许可的全部技术长期授权（不限于目前技术，包括未来技术），ARM对ARM中国的股权不再有投票权等等，ARM中国引入新的股东等等。 ARM可以提出意见，我国监管当局也有权对任何涉及ARM控制权转移的操作一票否决。实际我国对软银还有更厉害的杀招，软银目前最主要的资产是他的阿里巴巴股权，而这个股权完全依赖于脆弱的VIE结构。（截止目前，软银持股24.9%仍为阿里最大股东）前面有个回答说得很好，ARM中国本身就不是一个正常商业逻辑的产物，一个本地销售公司需要让外来股东占比51%吗，需要弄一堆技术授权吗。说白了，ARM中国是在中国贸易战开战并且逐渐升级以后，ARM公司和中国势力达成默契，准备的一个类似50年代香港的白手套/窗口，是大英帝国的家传手艺。但是2018年庄汉生政权上台后，英国跟着懂皇的指挥棒转，要对双方的默契和安排反悔了。而中方原来的安排出了问题，找来的白手套其实是两面人，ARM中国近一段时间来的纷争就来源于这个变化。不过如前面所说，ARM近日是犯在中国政府手里了。而区区厚朴投资，当年XX系，那个谁谁谁不牛B吗，现在在哪里呢?

国产通用服务器CPU（ARM64）测评分析作为第三方测评机构，鹏城实验室最近完成了针对国产ARM64通用处理器的性能测试评估。本次测试，共测试了5款CPU，其中包括4款进入XC市场的国产ARM64指令集兼容CPU。考虑到篇幅，这里只介绍大家比较关心的飞腾FT2000+和鲲鹏920，并且主要介绍其整数性能（int）。被测芯片的参数如下：测试的软件环境如下：由上表可见，FT2000+和鲲鹏920的测试环境是完全一样的，包括操作系统、编译器、以及编译优化参数都完全一致。报告给出的测试对比，都是使用GCC9.1.0 -O3编译的测试结果。 FT2000+（2.2Ghz）和鲲鹏920（2.6Ghz 48核）Spec cpu 2017的测试结果对比如下：以下为，华为和飞腾官方给出的两种CPU在spec cpu 2006下的测试成绩：注：上图FT-2000+的工作频率为2.3GHz。下表为两种CPU“整数性能” 在spec17和spec06下测试结果的对比：注：鉴于频率接近可以认为性能增长基本是线性的，所以飞腾的spec06 int speed值由13.5/2.3 *2.2=12.9得出，rate同理。由于没有官方成绩，鲲鹏920的spec06int speed值源自meJustPlay网友，同时也与鲲鹏920的主任架构师夏晶，每Ghz性能10.8的说法相一致（可能与实际成绩有差异，但不影响最终结论）。由上表可以看出，在相同测试环境下的spec17测试成绩对比，飞腾显著优于基于官方发布的spec06成绩所做对比。飞腾在spec17和spec06测试中的多核效率基本一致。鲲鹏在spec17测试时的多核效率则显著优于spec06时的多核效率。由此可以见，在不同的测试环境下得出的测试成绩，基本没有对比价值。

基于飞腾2000/4的长城轻薄笔记本

新一代飞腾八路服务器已超华为鲲鹏国产ARM服务器CPU在高通等国际厂商宣布退出后，仅剩下天津飞腾、华为等为数不多的国产芯片企业在做持续的设计与开发，为此以国产IC公司作为主力军的ARM 服务器处理器的命运和前景，也受到中国IC产业的关注。 28日在2020年中国IC领袖峰会上，根据天津飞腾总经理窦强的介绍，基于飞腾最新一代多路服务器CPU,腾云S2500系列产品，最高单核主频为2.0~2.2Ghz，共有64个FTC663内核，可同时直连2~8路，支持到DDR4。窦强表示，腾云S2500性能上已经与双路直连的华为鲲鹏旗鼓相当，而在八路上则已超过华为鲲鹏，是目前已经发布的国内最高性能ARM架构服务器芯片。在此之前飞腾还曾对外公布的ARM服务器CPU系列有采用16nm 4核的FT-2000/4、16nm 64核的FT-2000+/64和28nm 16核FT-1500A/16。面对未来的机遇风口，窦强认为，对于国产服务器厂商而言，万物互联与新基建的潮流下，5G和AI是不可缺席的机遇。窦强认为，ARM服务器在受到了传统X86 CPU服务器的挤压下，在美国市场的商用机会逐渐暗淡，但在中国市场，由于受到自主可控、信息安全等市场的特别要求，中国芯片厂商自主研发的ARM服务器仍然还有较大的需求。传统的服务器、桌面、嵌入式微处理器不断更新迭代，用户持续不断的新需求给厂商提出了更高的要求。未来，天津飞腾计划实现从端到云、按需定制、安全可信，提供未来万物互联时代从端到云所需的各种通用和专用计算算力，在此基础上根据不同的应用场景提供定制化服务。窦强表示，5G时代，云计算对CPU提出新的要求和需求。未来，天津飞腾将在云服务器芯片这个方向上做进一步优化，加强芯片的单核性能，另外对虚拟化的性能进行持续优化，支持更强的包括SVE的向量计算能力，以及INT8、FP16这些面向机器学习和人工智能更加有效的计算固件。对于2020年的展望，窦强强调，飞腾将实现100万片的年销售量，并将团队规模扩充至1000人以上，同时完成两款FT内核的开发、新一代桌面CPU和chipset芯片的流片以及持续推进下一代服务器芯片设计的开发。这也是飞腾耕耘通用CPU二十年来一个比较大的飞跃。

央企人事调整 : 袁洁任中国航天科工集团董事长、党组书记 6月18日,据国务院国资委官方微信消息。原航天科技集团总经理、党组副书记：袁洁，调任中国航天科工集团有限公司董事长、党组书记。原董事长高红卫免职。 xc相关大型央企董事长或总经理：中国电子信息集团，董事长、党组书记：芮晓武，国防科技大学计算机专业大学本科毕业中国航天科工集团，董事长、党组书记：袁洁，国防科学技术大学飞行器系统工程专业大学本科毕业中国电子科技集团，总经理、党组副书记：吴曼青，国防科学技术大学通信与电子系统专业大学本科毕业中国航天科技集团，董事、党组副书记：方向明，国防科技大学液体火箭发动机专业大学本科毕业

从工信部云平台看XC技术路线选择工信部作为XC工程的国家主管部门，在建设自己的云平台时选择的技术路线是： 60%的飞腾（终端+服务器），30%的鲲鹏，10%兆芯。完全没有某自称最自主、最强桌面、cpu设计能力国内首位的X芯的位置。

人不要脸，天下“第一”

飞腾新核心FTC860研制成功，性能翻番！飞腾最新的演讲上（达梦主办大咖讲堂）副总张承义表示：飞腾新一代处理器核心FTC860已经研制成功，并已交付流片。新的嵌入式核心FTC330也研制成功并交付。 FTC860 属于高性能核心系列，追求单核性能，追求DP浮点性能。 FTC330核心属于低功耗嵌入式核心系列，追求低功耗，追求高效能。飞腾目前在研的CPU有FT3000系列，和FT4000系列。在随后的答疑中，有人提问，使用860核心的CPU何时面市。张承义回答：暂时保密，请大家密切关注飞腾公众号。有人提问860核心的spec性能如何。张承义回答：FTC860核心设计指标是，spec性能比上一代(FTC663)核心翻一番。目前860已经研制成功并交付流片，并且在pre silicon的测试中，860核心表现出超过上一代核心一倍的性能。根据此前飞腾的roadmap，使用860核心的新一代FT-3500处理器，主频为3.5Ghz。而上一代核心spec06int性能为17.2（@2.6Ghz）到 ≤19.82（@3Ghz）。那么，按照翻一番的性能，860核心的性能为34.4 到 ≤39.64。如果按860核心频率为3.5Ghz计算，则飞腾新核心的所谓IPC可达：9.82 ~ ≤ 11.33。

飞腾最新演讲视频总结近日，飞腾在四川省中芯举办的国产芯片和os远程视频培训会上，飞腾行业解决方案总监杨威，做了关于飞腾CPU的一个报告。里面有一些值得关注的信息。由于版主不允许发信创培训视频，我把视频中要点信息总结如下： 1、飞腾是自主可控处理器领域百分之百国资的国家队。 2、飞腾进入信创市场相对较晚，之前市占率在30%，今年预计可达50%。 3.、国务院发展研究中心2019年11月发布的白皮书，分析了目前信创市场各种指令集架构的情况。 a.信创市场的x86架构未来会被完全替换掉； b.alpha架构（Sw64）主要用在神威超算和某兵种的数据中心（wangjun）,信创市场应用不多； c.龙芯的MIPS实际也是分期付款的架构授权，终究也是受制于人、受制于美国，MIPS被反复多次倒卖令人唏嘘。d.power架构，主要用于银行的小型机，未来一年左右就会被替换掉。 e.国内arm生态，华为是一致对外，飞腾是国家队，一主一背，主导zzkk市场5~10的发展已经是逐渐显现的趋势。从指令集来说大家都不是完全自主研发的，自主可控程度的评价是要求每一行代码都是自己写的。 4、指令集活跃度比较，比较linux发行版对各种指令集架构的支持，x86和arm64、powerpc所有发行版都支持，对其他架构支持越来越差，造成这些架构不得不自己维持一个庞大的团队，去维护linux内核对自己芯片架构的支持。只能靠自己去维护庞大的生态。 6、已经有600多家软件厂家加入飞腾生态，6大类400多种整机产品，1000多种软件，形成了一个完整的生态体系。 7、测过ft1500a的用户都知道，spec、unixbench测试，飞腾是前几年出来的几种国产cpu中性能最好的。而且，在数据库测试中性能是其他国产CPU的5~6倍。 8、行业应用，服务器都要求2路以上的CPU。FT2500支持2到8路，很快就会发布，双路性能和鲲鹏920基本一致（我估计应该是指华为主推的48核鲲鹏920 4826，也就是说spec int rate性能大约在700分）目前，2路的FT2500已经调试完毕，4路的FT2500已经成功启动操作系统正在继续调试优化。 9、飞腾对新4核FT2000/4 寄予厚望，发布半年多来已经出货 50万片，飞腾是按100万片备货的。基于FT2000/4 即将推出无风扇的超薄笔记本，飞腾已经成功在上面运行 windows（估计是win10arm），飞腾自己的员工都在等这款超薄笔记本。有望在京东公开销售。 10、基于飞腾的云平台，包括腾讯政务云在内的几万台服务器级别的大型案例很多，云方面远远领先国内其他架构。 11、与电信合作，飞腾服务器进入5G核心网，应用在UPF、 DU、CU单元中。未来将为电信定制服务器CPU。 12、基于飞腾的台式机在：xc目录、j口目录、 bm目录、等等级目录，飞腾占据的份额愈来愈大，目前已经占据60~70%的份额。 13、飞腾生态发展极为迅速，2018年适配的软件厂家才60多家，到现在已经超过600家软件厂商适配飞腾。 14、安全设备（防火墙等），全部80多款产品，60%采用飞腾的架构，30%为X86，10%为MIPS。

飞腾—在四川创信培训上的报告近日，飞腾在四川省中芯举办的国产芯片和os远程视频培训会上，做了关于飞腾CPU的一个报告。里面有一些值得关注的信息。为了方便没时间仔细观看视频的朋友，我把视频中要点信息总结如下： 1、飞腾是自主可控处理器领域百分之百国资的国家队。 2、飞腾进入信创市场相对较晚，之前市占率在30%，今年预计可达50%。 3.、国务院发展研究中心2019年11月发布的白皮书，分析了目前信创市场各种指令集架构的情况。信创市场的x86架构未来会被完全替换掉；alpha架构（Sw64）主要用在神威超算和某兵种的数据中心（wangjun）信创市场应用不多；龙芯的MIPS实际也是分期付款的架构授权，终究也是受制于人、受制于美国，MIPS被反复多次倒卖令人唏嘘。从指令集来说大家都不是完全自主研发的，自主可控程度的评价是要求每一行代码都是自己写的。国内arm生态，华为是一致对外，飞腾是国家队，一主一背，会主导zzkk市场5~10的发展。 4、指令集活跃度比较，比较linux发行版对各种指令集架构的支持，x86和arm64、powerpc所有发行版都支持，对其他架构支持越来越差，造成这些架构不得不自己维持一个庞大的团队，去维护linux内核对自己芯片架构的支持。只能靠自己去维护庞大的生态。 6、已经有600多家软件厂家加入飞腾生态，6大类400多种整机产品，1000多种软件，形成了一个完整的生态体系。 7、测过ft1500a的用户都知道，spec、unixbench测试，飞腾是前几年出来的几种国产cpu中性能最好的。而且，在数据库测试中性能是其他国产CPU的5~6倍。 8、行业应用，服务器都要求2路以上的CPU。FT2500支持2到8路，很快就会发布，双路性能和鲲鹏920基本一致（我估计应该是指华为主推的48核鲲鹏920 4826，也就是说spec int rate性能大约在700分）目前，2路的FT2500已经调试完毕，4路的FT2500已经成功启动操作系统正在继续调试优化。 9、飞腾对新4核FT2000/4 寄予厚望，发布半年多来已经出货 50万片，飞腾是按100万片备货的。基于FT2000/4 即将推出无风扇的超薄笔记本，飞腾已经成功在上面运行 windows（估计是win10arm），飞腾的员工都在等这款超薄笔记本。有望在京东公开销售。 10、基于飞腾的云平台，包括腾讯政务云在内的几万台服务器级别的大型案例很多，云方面远远领先国内其他架构。 11、与电信合作，飞腾服务器进入5G核心网，应用在UPF、 DU、CU单元中。未来将为电信定制服务器CPU。

航天天域实测飞腾vs鲲鹏920

PK生态公开课上有意思的东西在前两天的PK生态公开课中发现了几个有意思的片段。第一张是介绍飞腾CPU时，ppt上说飞腾正在研制1024核的千核级处理器。第二张介绍各种国产CPU，最后一行标注了已经进入信创目录（大安可）的CPU，包括兆芯、飞腾、龙芯。

胡伟武说飞腾FT64-1 龙芯大boss胡伟武证实FT64-1是飞腾参照安腾的指令集自主设计，某些个longboy还要硬拗么？至于胡伟武说飞腾买arm商用核心，飞腾官方已经声明飞腾兼容Arm v8的核心全部是自主设计，并且从未购买过armA57核心等产品，此次FT1500a荣获国家科技进步一等奖就是最有力的证明。

飞腾最新64核服务器处理器FT2500进展情况 FT-2500，基于飞腾FTC663核心，片上集成64M L3 Cache ，8通道DDR4 3200，支持8路CPU直连，可以组成高达512个核心的系统。 2019年8月投片，11月底样片完成。今年3月出样机。

龙芯之MIPS授权问题辨析看来贴吧还是有那么一点影响力的，在本贴吧揭露龙芯长期蒙骗群众的所谓“买断MIPS”的谎话后，龙芯不得不在UOS开发者大会上把自己获取MIPS授权具体情况公布出来，承认自己是每五年续费一次，而以前龙芯的宣传口径都是所谓“买断MIPS授权”，从来没见过龙芯在公开场合或者公众媒体上提到过五年一续费的事情，所以龙芯“不老实” 这口锅是背稳了。而所谓”“每5年续费一次，双方不需要重新谈判。协议不能提前终止，除非双方破产。”也是在打马虎眼，不仔细分析一下又会被它蒙骗。 1、龙芯被迫承认每5年续费一次，但所谓“双方不需要重新谈判”，这个谈判所指的具体对象是啥？龙芯没有明确说明，但我们可以合理推断，肯定应该是龙芯已经获得的授权，因为如果是龙芯此前没有获得的授权，比如MIPS r6，那就不是“重新”谈判，而是“新的”谈判了。所以，龙芯的这个授权协议跟华为飞腾获得的arm V8指令集授权是类似的，龙芯并不能自动获得r5以后的新版本的授权。 2、再来分析一下：“协议不能提前终止”。这里的“提前”，是一个时间概念，是相对正常的、不提前的时间节点而言的。那么这句话至少说明了，有一个时间节点，在此之后就不算提前。很明显这个时间节点就每5年续费的一个周期结束的时候。而所谓“协议不能提前终止”指的就是在这5年的周期内，比如第三年，按照次条款协议不能终止。既然有“协议不能提前终止”的条款，那么就意味着：如果不提前，“协议可以终止”。也就是说在5年续费周期结束的时候，MIPS有权结束协议！ 3、而所谓“双方不需要重新谈判”，并不意味着MIPS在5年周期结束后一定继续授权龙芯，而只是说明如果mips同意继续授权，那么授权的具体协议照旧，无需再次谈判具体条款而已。

[转贴] 国产CPU：本是同根生，相煎何太急！文章转帖自公、众、号：科技芯焦点。转帖此文，不代表本人认同或证实文中观点、陈述。原创：曰非曰在郭嘉重大战略布局上，lx、FT、SW永远是最积极响应的，作为中国开展CPU研制工作最早的三家团队，经过二三十年的技术积累，目前已经具备相应能力来满足用户不同层次的需求： lx：来自于中科院体系，一直以“中国芯”的身份出现，也是产业化做的最早的公司，在市场上的熟识度较高。其MIPS架构同ARM架构一样属精简指令集，授权模式类似。龙芯根据指令集架构自己研制了基于不同自主内核的CPU产品，做到了自主、可控、可靠。但因指令集架构的小众，其产业生态的建设步履维艰，但目前也取得相当的成绩。截至目前，龙芯在信创领域的项目中参与较多。 FT：之前服务于较多涉密关键领域，指令集架构也几经变化，最后综合考量软硬件生态的问题，选择ARM架构。据目前全球的发展，ARM是和X86平分秋色的存在，且飞腾取得的是指令集架构永久授权，自己写微内核，做到自主、可控、可靠，业务覆盖较广。截止目前，飞腾在信创领域的项目中参与较多。 SW：若不是神威·太湖之光因为突然取得世界超算top500的NO.1，他会一直神秘下去。申威采用的是ALPHA（SW64），因指令集小众，且自成一体，自主、可控、可靠，业务目标主要瞄准安全密码领域，在具体信创产业布局上稍显滞后。不过，最近中国电科在上海举行了申威服务器首批量产下线仪式活动，以此开始申威CPU产业化。相信在不久之后，相关单位也将会陆续用到申威服务器，具体性能指标也将逐步公开，在信创领域申威也将会有更多的参与。

飞腾关于指令集扩展的官方说明龙粉总拿扩展指令集说事儿，说什么只有龙芯能自己扩展指令集，所以龙芯最自主云云飞腾的官方说明，表明飞腾一样可以自行扩展指令集，只是尽量选择不破坏生态的方式扩展指令。

飞腾最新roadmap，FT3500指标曝光 FT-3500 ，主频3.5Ghz，32核心，8通道DDR4，功耗65瓦，7nm工艺。

新华社：国产芯片火了！新华社记者姜琳龙头企业密集推出新产品、数千亿投资基金就位、概念股全面涨停……时值寒冬，国产芯片行业呈现出非同一般的火热，整个产业链引发市场高度关注。是“昙花一现”，还是“未来趋势”？记者进行了多方采访。小小芯片有多火？近日在北京国际会议中心召开的“2019飞腾生态伙伴大会”上，记者目睹了国产芯片之红火。会议尚未开始，会场已爆满。不仅座位异常密集，两侧及过道都站满了人。一位晚到的发言嘉宾甚至差点进不去场地。 “我们也没想到会这么火。”会议举办方天津飞腾信息技术有限公司总经理窦强告诉记者，“原本预估会议规模800人左右，后来仅网上报名就超过2500人。投资机构、行业用户、上下游合作伙伴等全来了。” 和其他几家国产CPU处理器龙头企业一样，飞腾早在20年前就开始自主研制芯片。近几年技术上大幅提升，但市场上大多服务于特定领域。2018年以来，市场需求明显提升，企业明显感受到未来行业高速扩张的势头。 “一年多来订单快速增长，咨询合作和投资的越来越多，有些产品供不应求。保守估计，未来我们年供货量会从几万片、几十万片增长到百万级。今年营收预计较去年增长超2倍，未来会保持高速增长，2024年我们力争实现年营收超过100亿元。”窦强说。

UOS下FT2000/4的7zip测试结果转自龙芯吧，7zip16.02测试，2.6Ghz的FT2000/4。和我的推测分数相差不大（推测9695）实测还高些9936。因此可以推算3Ghz下7zip分值：9936/2.6*3=11464

Pts访存性能测试：2代飞腾桌面CPU vs Intel haswell i3 FT2000/4 访存性能进步显著，8项测试领先haswell 5项。相对上一代ft1500a更是极大的提升，访存关键性能 stream triad 增长了3倍多。

A76核心的7zip测试成绩麒麟980（4个a55 2个 1.92G的a76 2个2.6G的a76），在7zip 16.02下测试单线程。由一个2.6Ghz的a76核心完成测试。对比鲲鹏920 1229k的折合单线程分值，920的核心“泰山101”明显领先同频a76。如果单独测试鲲鹏920的单线程成绩，鲲鹏领先程度会更大。

FT1500A在7zip16.02下的测试结果 FT1500A在7zip 16.02版本下，4线程测试分值5372，折合单线程1492。同一台机器，系统相同。在7zip9.20版下，4线程测试4872，折合单线程1374

你们要的FT2000/4实测7zip 来了！现场实测，长城银行即将于12月1日在武汉发布的飞腾新四核台式机。2.6GHz的FT2000/4，在7zip 比较旧的9.20版本下，4线程压缩7zip测试分值 8552，折合单线程2442。

FT2000/4 实测7zip ，全网首发现场实测，长城银行即将于12月1日在武汉发布的飞腾新四核台式机。2.6GHz的FT2000/4在7zip 比较旧的9.20版本下，4线程压缩7zip测试分值 8552，折合单线程2442。

微软云服务 Azure正式引入ARM服务器 Marvell宣布微软正在为Microsoft Azure部署基于Marvell的ThunderX2的内部生产级服务器。Microsoft Azure，Microsoft Corp.的杰出工程师Leendert van Doorn博士说：“Microsoft的Project Olympus云硬件与Marvell的ThunderX2服务器处理器的部署是一个里程碑，它增强了Azure云基础设施上的Arm64产品开发。”微软致力于推动平台创新，我们扩大对硅架构的支持是我们致力于行业领先地位和最佳实践的一部分。与Marvell和Ingrys的合作产生了最完整和性能最高的ARM服务器解决方案，可供我们内部使用。“。微软在2017年开放计算项目(OCP)上宣布，它打算一直追求基于ARM的硬件。当时，微软谈到了两个可行的选择-ThunderX2和高通的Centriq。此后，高通放弃了服务器市场。新的Azure部署使用基于Open Compute的主板，使其与微软的Project Olympus兼容。 —————————————————————————————————————————————————— 自此，全球排名前三的云服务：微软 Azure、亚马逊AWS、阿里云，全部引入了ARM服务器（分别基于Marvell Thunderx2、亚马逊自研的Graviton、飞腾的FT2000+）。

大数据WorkLoad测试：飞腾2000+ VS E5-2650V4 2019年，在某项目中，4台FT-2000+/64单路服务器和4台E5-2650V4双路服务器在大数据方面进行了对比测试。经过优化，Storm测试中，飞腾各项测试均相当或占优（速度越高越好）；离线计算Spark测试中，得益于飞腾多核处理能力，性能占优（时间越短越好），消息队列Kafka测试，性能基本相当，而功耗方面飞腾仅仅为Inter处理器的约50%。这体现了飞腾平台对大数据组件，尤其对离线计算的良好支持，也体现了飞腾平台能效方面的优势。

龙芯的股权结构龙芯中科股权构成如上图所示。天童芯源科技+天童芯源投资中心+天童芯正股权占比33.61%，天童系的其实际控制人是胡伟武。国资占比33.61%，剩余为其他投资合伙机构。

老帖重发：三大国产处理器评测及分析江南计算技术研究所高级工程师程华（现已升任总师）无锡江南计算机研究所总师程华，一直从事国产关键软硬件的评测和自主可控度评估工作。从2010年开始，8年以来，她每年都会将三大国产品牌的最新款处理器与国外芯片进行对比。 2017年10月27日，在中国计算机大会（CNCC2017）上，程华报告了对申威、飞腾、龙芯三大国产处理器平台在2015和2017年两度专业测试的结果及初步分析，并和英特尔奔腾4的测试结果进行了对比。以下内容由程华总师演讲视频整理：对比方式：图中的柱状图每种颜色代表一个处理器厂商的产品，红绿黄都是国产cpu，蓝色为国外cpu。最左边为申威411（2015年测试），同一颜色接下来的是申威1621（2017年测试）(2017年还在内测未正式发布)。然后是飞腾1500A（2015年测试）和2017年测试的飞腾1500A，虽然硬件并未发生变化，但由于软件优化，测试性能有了明显提高。再后面是龙芯3A2000（2015年测试）和3A3000（2017年测试）。右边3列蓝色柱状图从左至右分别是 Intel P4处理器（补充：双核、主频3.2GHz ）Intel， 2009年发布的 i5处理器，AMD E350 (2009年发布)。首先对比的是基础的综合性能，使用业界主流的测试套件：Unixbench。主要测字符、上下文切换、整数与浮点运算、管道存储能力等，此张ppt反映的是运行单线程Unixbench的情况，分值越高越好（柱状图越高越好）。它反映的是操作系统可以看到的处理器单核的性能。从单线程性能来看，从2015年开始，每一款国产处理器都超过了P4，到2017年已经明显高于P4。同时可以看到，在2年时间里，3家国产处理器的单核性能提升都非常明显。上图为4核的性能对比上图为16核时的性能对比，因为这里有一个国产处理器厂商只有4核的芯片……。图上仍然以P4的性能作为对比（最左边的蓝色柱状图）。上图为3个国产处理器2015年到2017年两年时间里，单核、4核、16核（无16核的处理器以4核叠加计算）综合性能提升比率，可以看到黄色代表的厂商其单核性能都已经翻倍了。（整理者补充：绿色代表的厂商性能提升最不明显，大概因为其处理器硬件并未更新换代，只是软件优化带来了一些性能提升）上图为细粒度的性能中，基本的双精度浮点加、乘、除运算时间，单位是纳秒，数值越小成绩越好。 2015到2017年，3家的此项性能都不如P4。这个测试与软件基本无关，主要反映处理器加法器乘法器等部件的设计水平。上图为上下文切换延迟性能，单位是纳秒，数值越小越好。包括多线程和单线程上下文切换性能，3家处理器性能一直比P4好，我们分析国产处理器性能低从来不在上下文切换上。有两家2017年性能比2年期有所下降，是正常现象，因为性能是在做不断的平衡。此图为虚拟文件系统延迟，也是越低越好。此图为本地通信带宽，成绩是越大越好。通过管道 ……、通过标准Unix协议、通过文件的重读内存的读和内存的写入来做通信。我们可以看到带宽这方面，国产处理器都远远的超过了P4。此图为内存的读写延迟，数值越小越好。图上第一项是L1cache延时，国产处理器都不如P4。第二项L2 cache读写延迟，国产处理器除黄色代表厂商外做得比P4好。后面两项为内存写入延迟和读取延迟。此图为磁盘写入性能。单位为kB每秒，数值越高越好。此图为磁盘读取性能，单位为kB每秒，数值越高越好。磁盘读写性能是我们的长项，3家的国产处理器都远远的超过了P4，特别是有一家厂商（绿色代表厂商）在磁盘读取性上面(非常突出)……这张图片总结了3家处理器厂商在2015年到2017年两年时间里细粒度性能的涨幅，平均下来是2.4倍左右。此图为我们自己做的一个用户测试。我们老说去比Spec CPU 国产处理器也不差呀，可是为什么用起来感觉好像慢呢？我们就做了一个userbench，方法是我们单位使用的国产处理器计算机平台，一个月以来让大家做一个使用情况的统计，比如做一个新word文档大家都一样的。我们做了Word文档，Ppt文档，Excel文档，一百次重启，文件压缩，点对点的文件拷贝，浏览器的使用浏览ccs的网站……网站，就是平常常用的计算机操作。图中最后一项就是所有测试加起来的时间，除以10（补充：用时越短越好）。从总时间来看，3家处理器，在2年时间里性能大概都只提高了20%左右，低于前面的硬件细粒度性能提升。原因主要是缺乏软件的配合，缺乏中间件的配合。此图为Trace分析，如打开word文档，看起来我们的cpu性能比P4好，为什么实际用起来还是比P4慢呢？我们trace了性能数据，红色曲线是我们自己的国产处理器计算机平台，在打开文件的过程中，用户态和系统态所占的百分比，蓝色曲线是P4的。可以看到，在刚开始工作的时候，蓝色曲线比较高（P4）对系统资源的利用比较好，红色就弱一些。这个非常典型，实际3家国产处理器情况都差不多。这就说明软件的优化没有跟上…… 谢谢大家整理者总结：程华总师 (出于照顾面子的原因，因为3家厂商代表都参加了计算机大会)，在演讲中没有明确指出红、绿、黄分别代表哪一家国产处理器厂商。但是演讲的上下文对照图片，我们不难推断出：红色代表申威，绿色代表飞腾，黄色代表龙芯。从江南所所做的性能分析可以看出，无论单线程还是多线程综合性能，飞腾都明显领先，申威性能居中，龙芯忝陪末座。用户实际使用测试结果，仍然是飞腾最强，但龙芯略为优于申威。原因大概是龙芯生态已经很烂了，申威的软件生态更弱。来源：中国计算机学会，数字图书馆《三大国产处理器评测及分析》演讲视频地址：https://tieba.baidu.com/p/5839106512?pid=121440886896&cid=0&red_tag=0512716996#121440886896

国产CPU运行国产计算数据库性能对比测试报告一、测试背景由于众所周知的世界经贸形势，拥有全面自主可控的IT解决方案成为摆在国家面前的一项重要任务。但是，由于目前国产芯片的性能还相对较弱，大多只能应用于OA等边缘业务，要用到关键业务中时就必须加大成本以扩大集群规模，这将进一步推高因为生态成熟度还不足而导致本身成本就不低的全国产技术方案的应用门槛，抑制了全国产技术的推广应用范围。 SPL计算数据库是一项从理论模型到代码实现都拥有完全自主产权的新技术，它采用了创新代数体系，允许程序员实现更高性能的低复杂度算法，从而获得比传统关系数据库更好的运算性能。因此，可以通过软件弥补硬件，使较低性能的国产芯片不需要扩大集群规模就能够适应原来必须使用国外芯片的应用场景，并且还有一定程度的性能提升。

龙芯接受“核高基” 重大专项资助情况（公开资料分析）下面我根据网上公开的资料，对截止2014年（之后没有公开）龙芯接受核高基资助情况，做一简单的回归总结。以下信息都是个人从网上搜集后整理，错漏之处，敬请网友不吝赐教。核高基重大专项，最早从2009年开始，网上有公开材料的一直到2014年。有关高性能通用处理器的重大专项，涉及龙芯的从2009年开始就有至少2个，分别是：国家核高基重大专项 “面向服务器/大规模科学计算的高性能多核CPU”，项目编号（2009ZX01028-002-xxx）[ 新型处理器结构研究的项目编号是（2009ZX01028-001-xxx）]；国家核高基重大专项 “安全适用计算机研制与应用” ，项目编号 (2009ZX01029-001-xxx)。这两个重大专项都给予了龙芯资助；第一项，龙芯的项目编号是（2009ZX01028-002-003） [2009ZX01028-002-001，2009ZX01028-002-002分别由总参56所和国防科大承担] ；第二项，龙芯是项目编号是（2009ZX01029-001-002，2009ZX01029-001-003 ），两个项目分别是龙芯“安全适用计算机CPU” 和 “安全适用计算机推广应用”。此09年的“核高基”项目，关于cpu部分，项目持续时间大致是09年开始到2012年结束。 2011年后，涉及高性能多核/众核CPU的重大专项有： “超高性能CPU新型架构研究” （2011ZX01028-001-xxx），接受该项目资助的单位有： (2011ZX01028-001-001)国防科大，（2011ZX01028-001-002）中科院计算所体系结构国家重点实验室 “超级计算机处理器研发” (2013ZX01028-001-xxx)，接受该项目资助的单位有：(2013ZX01028-001-001-001)56所，(2013ZX01028-001-001-002)国防科大龙芯在2010年后继续接受资助的核高基项目有： “国产服务器操作系统在电子政务领域的推广应用” ，龙芯的项目编号 (2010ZX01036-001-002）； “ 支持国产CPU的编译系统及工具链”，龙芯的项目编号（2010ZX01036-001-002）； “国产64位软硬件的数控装置及其应用与推广” ，龙芯的项目编号（2012ZX01029-001-002）； “面向移动智能终端的高性能低功耗嵌入式CPU研发” ，龙芯的项目编号（2014ZX01030101）； “抗辐照CPU研发[项目名称存疑]” ，龙芯的项目编号（2014ZX01020201）。

飞腾CPU初评入围2019国家科技进步一等奖，作为计算机与自动控制组唯一的一等奖候选者，飞腾大概率入选。那些无耻造谣中伤FT1500A是A57核心的宵小，如今惨遭国家亲自动手实力打脸

申威转向RISC-V？参与发起中国RISC-V产业联盟由上海芯原、芯来科技、上海赛昉科技(SiFive China)、上海高性能集成电路设计中心(申威)、杭州中天微、北京君正、兆易创新、致象尔微电子、乐鑫科技、时芯电子、展讯通信、地平线、晶晨半导体、华大半导体、格易电子、上海集成电路行业协会、上海物联网行业协会等单位共同发起的中国RISC-V产业联盟正式宣布成立，上海芯原担任联盟首任理事长单位。实际上，以上很多联盟成员已经在推进RISC-V产业生态建设的路上。指令集是半导体芯片发展最重要的基础，对CPU运算进行指导和优化的硬程序。传统的大多数指令集架构，例如x86，ARM和MIPS等，通常属于某个公司所有，在获得专利授权前无法自由使用。RISC-V特色鲜明，目标是成为指令集架构领域的Linux。与大多数指令集相比，其最大特色就是开放和免费，通过将核心指令集以及其CPU设计的IP开源，很大程度上改变运算平台芯片的设计生态。然而，相比ARM和英特尔x86，RISC-V现阶段的一大短板就是生态不完善。这并不是任何一家或几家企业能够做好，还需要持续的政策、人才、资金的大力支持，此次中国RISC-V产业联盟的成立，正是将全球最优质的资源集聚于此，大家共同发力，建立起一套基于全新指令集的生态系统，促进信息产业自主可控的发展。

（申威参与发起）中国RISC-V产业联盟在沪成立由上海芯原、芯来科技、上海赛昉科技(SiFive China)、上海高性能集成电路设计中心、杭州中天微、北京君正、兆易创新、致象尔微电子、乐鑫科技、时芯电子、展讯通信、地平线、晶晨半导体、华大半导体、格易电子、上海集成电路行业协会、上海物联网行业协会等单位共同发起的中国RISC-V产业联盟正式宣布成立，上海芯原担任联盟首任理事长单位。实际上，以上很多联盟成员已经在推进RISC-V产业生态建设的路上。指令集是半导体芯片发展最重要的基础，对CPU运算进行指导和优化的硬程序。传统的大多数指令集架构，例如x86，ARM和MIPS等，通常属于某个公司所有，在获得专利授权前无法自由使用。RISC-V特色鲜明，目标是成为指令集架构领域的Linux。与大多数指令集相比，其最大特色就是开放和免费，通过将核心指令集以及其CPU设计的IP开源，很大程度上改变运算平台芯片的设计生态。然而，相比ARM和英特尔x86，RISC-V现阶段的一大短板就是生态不完善。这并不是任何一家或几家企业能够做好，还需要持续的政策、人才、资金的大力支持，此次中国RISC-V产业联盟的成立，正是将全球最优质的资源集聚于此，大家共同发力，建立起一套基于全新指令集的生态系统，促进信息产业自主可控的发展。

阿里、腾讯发布基于飞腾CPU的云服务在5月6日开幕的第二届中国建设峰会上，CEC联合国内70多家PK生态合作伙伴（phytium+kylin）重磅发布多款基于FT2000+的服务器及云产品。阿里云发布了基于飞腾CPU平台的阿里专有云安可敏捷标准云计算平台，阿里云方面表示基于飞腾cpu构建的阿里云平台，已经咋国内部分省市实际部署和运用。腾讯云发布了基于飞腾CPU平台的腾讯云TStack。基于飞腾FT2000+处理器的服务器产品有：联想 TinkSystem SR358Fv2、浪潮NF2180M3、紫光 R3800、航天706所 SR124210、长城擎天DF720。中国建设银行宣布基于 PK 体系的商密自动化办公系统全面上线。该系统基于飞腾 CPU 和银河麒麟 OS 为核心的自主安全可控平台，率先在国内金融业中实现了办公自动化系统的软硬件全国产化替代。中国联通宣布采用 “ PK体系 ” 实现自有系统的改造升级，未来将同中国电子共同为用户提供更加安全的网络基础设施服务，助力现代数字城市建设。

不学好…… 跟老胡一样开始吹牛了一楼喂度娘…………

倪光南：x86 、ARM、RISC-V未来将三分CPU天下在2018亿欧创新者年会上，中国工程院院士倪光南发表了《中国开源芯片（RISC-V）的前景》的演讲。他提到： 1、从市场的反映来看，绝大多数的软件服务商，像中国的BAT，或者亚马逊、谷歌、facebook等中外的服务商基本上都基于开源。 2、开源芯片的好处在于能够按市场需求进行升级，并且降低芯片业创业的门槛。 3、RISC-V有很多好处，比如模块化、可扩展、成本低，未来的发展需要扬长避短。 4、未来RISC-V很可能发展成为世界主流CPU之一，从而在CPU领域形成Intel(x86)、ARM、RISC-V三分天下的格局。

密码算法性能(Openssl）测试性能对比：飞腾vs申威 FT1500A-4 (单核,包括SM2/SM3/SM4) 1.5Ghz 1 The 'numbers' are in 1000s of bytes per second processed. 2 type 16 bytes 64 bytes 256 bytes 1024 bytes 8192 bytes 3 md2 0.00 0.00 0.00 0.00 0.00 4 mdc2 0.00 0.00 0.00 0.00 0.00 5 md4 15135.49k 54699.16k 157732.44k 307936.60k 426825.05k 6 md5 12763.39k 42586.75k 110446.68k 187538.77k 235361.62k 7 hmac(md5) 12151.78k 41377.71k 109793.19k 185889.79k 235077.63k 8 sha1 12715.67k 41930.39k 100413.44k 157123.58k 187569.49k 9 rmd160 10788.69k 33493.42k 74574.51k 108126.89k 124559.36k 10 rc4 138604.84k 143156.95k 145253.38k 146560.34k 146915.33k 11 des cbc 30976.65k 32833.47k 33251.75k 33340.76k 33376.94k 12 des ede3 12198.75k 12395.24k 12442.20k 12464.47k 12468.22k 13 idea cbc 0.00 0.00 0.00 0.00 0.00 14 seed cbc 34303.63k 35765.85k 36084.91k 36252.33k 35957.42k 15 rc2 cbc 20562.17k 21847.96k 22142.12k 21927.59k 21951.83k 16 rc5-32/12 cbc 0.00 0.00 0.00 0.00 0.00 17 blowfish cbc 53236.89k 57363.22k 58331.14k 58602.84k 58272.43k 18 cast cbc 49132.90k 52182.40k 52953.00k 53155.16k 53253.46k 19 aes-128 cbc 64960.12k 72470.85k 75711.74k 76560.38k 76791.81k 20 aes-192 cbc 56942.73k 62618.26k 65020.25k 65657.86k 65858.22k 21 aes-256 cbc 50680.58k 55096.02k 56985.77k 57465.86k 56942.59k 22 camellia-128 cbc 52909.42k 57681.77k 59849.30k 60369.92k 60476.07k 23 camellia-192 cbc 41912.33k 44835.16k 46142.12k 46451.71k 46511.45k 24 camellia-256 cbc 41847.65k 44824.90k 46142.81k 46452.05k 46511.45k 25 sha256 13548.60k 35859.82k 69527.98k 91877.72k 101373.27k 26 sha512 8819.93k 35399.72k 70668.29k 112675.84k 136814.59k 27 whirlpool 7549.15k 15862.23k 26269.95k 31657.98k 33655.47k 28 aes-128 ige 63098.66k 70161.02k 72837.21k 73467.22k 72559.27k 29 aes-192 ige 55248.83k 60550.12k 62563.24k 63027.20k 62376.62k 30 aes-256 ige 49133.08k 53423.02k 54844.50k 55200.77k 54692.52k 31 ghash 97872.01k 101282.99k 105198.42k 106225.66k 106370.39k 32 sm4 cbc 32188.83k 34662.36k 35741.78k 36016.47k 36069.38k 33 sha384 8880.59k 35751.15k 71047.59k 112916.14k 136858.28k 34 sm3 8214.83k 19067.43k 33665.54k 41670.31k 44763.82k 35 sign verify genkey sign/s verify/s genkey/s 36 rsa 512 bits 0.000310s 0.000024s 0.011222s 3222.2 41125.8 89.1 37 rsa 1024 bits 0.001254s 0.000064s 0.050503s 797.3 15666.5 19.8 38 rsa 2048 bits 0.007407s 0.000192s 0.311818s 135.0 5212.6 3.2 39 rsa 4096 bits 0.045636s 0.000661s 11.880000s 21.9 1512.0 0.1 40 sign verify sign/s verify/s 41 dsa 512 bits 0.000284s 0.000266s 3522.5 3753.2 42 dsa 1024 bits 0.000679s 0.000711s 1472.2 1406.6 43 dsa 2048 bits 0.002030s 0.002210s 492.6 452.5 44 sign verify genkey sign/s verify/s genkey/s 45 160 bit ecdsa (secp160r1) 0.0003s 0.0012s 0.0010 3206.7 852.8 971.3 46 192 bit ecdsa (nistp192) 0.0003s 0.0013s 0.0010 2946.0 798.5 976.5 47 224 bit ecdsa (nistp224) 0.0004s 0.0017s 0.0014 2383.4 605.4 740.0 48 256 bit ecdsa (nistp256) 0.0005s 0.0018s 0.0015 2165.5 563.7 681.5 49 384 bit ecdsa (nistp384) 0.0008s 0.0034s 0.0028 1270.9 294.8 363.3 50 521 bit ecdsa (nistp521) 0.0012s 0.0059s 0.0048 809.4 168.5 207.7 51 163 bit ecdsa (nistk163) 0.0006s 0.0023s 0.0011 1582.7 436.7 871.7 52 233 bit ecdsa (nistk233) 0.0012s 0.0032s 0.0016 851.7 308.4 622.1 53 283 bit ecdsa (nistk283) 0.0019s 0.0068s 0.0033 530.1 148.0 299.8 54 409 bit ecdsa (nistk409) 0.0041s 0.0141s 0.0070 242.3 70.7 142.6 55 571 bit ecdsa (nistk571) 0.0089s 0.0302s 0.0150 111.9 33.1 66.8 56 163 bit ecdsa (nistb163) 0.0006s 0.0024s 0.0012 1583.6 413.5 829.6 57 233 bit ecdsa (nistb233) 0.0012s 0.0034s 0.0017 854.7 295.0 592.7 58 283 bit ecdsa (nistb283) 0.0019s 0.0073s 0.0036 530.2 137.2 277.8 59 409 bit ecdsa (nistb409) 0.0041s 0.0153s 0.0076 242.3 65.2 131.0 60 571 bit ecdsa (nistb571) 0.0089s 0.0332s 0.0165 111.8 30.1 60.5 61 256 bit ecdsa (sm2) 0.0004s 0.0019s 0.0016 2673.3 534.5 615.8 62 op op/s 63 160 bit ecdh (secp160r1) 0.0010s 1004.0 64 192 bit ecdh (nistp192) 0.0011s 946.1 65 224 bit ecdh (nistp224) 0.0014s 726.9 66 256 bit ecdh (nistp256) 0.0015s 662.9 67 384 bit ecdh (nistp384) 0.0028s 351.2 68 521 bit ecdh (nistp521) 0.0049s 202.4 69 163 bit ecdh (nistk163) 0.0011s 885.0 70 233 bit ecdh (nistk233) 0.0016s 630.0 71 283 bit ecdh (nistk283) 0.0033s 301.9 72 409 bit ecdh (nistk409) 0.0070s 142.2 73 571 bit ecdh (nistk571) 0.0150s 66.7 74 163 bit ecdh (nistb163) 0.0012s 834.2 75 233 bit ecdh (nistb233) 0.0017s 596.5 76 283 bit ecdh (nistb283) 0.0035s 282.6 77 409 bit ecdh (nistb409) 0.0076s 131.2 78 571 bit ecdh (nistb571) 0.0165s 60.4 79 256 bit ecdh (sm2) 0.0016s 616.3

华为最新服务器cpu-Hi1620 华为最新服务器cpu-Hi1620 基于ARM Cortex-Ares 核心（A76的服务器版） ARMV8指令集 48核心台积电 7nm工艺最高频率 3Ghz 每核心L1数据Cache 48kB；指令Cache 32kB 8路组相连每核心L2 Cache 256KB 8路组相连共享L3 Cache 48MB 16路组相连内存接口 4通道 DDR4-2400 ECC 2*8 lan PCIe3.0接口支持 ARM NEON 支持 CRC32 2018年9月发布

胡博士新画的大饼最近的ppt，看看到时能实现多少。

2017计算机大会报告：三大国产处理器对比评测

三大国产处理器评测及分析江南计算技术研究所高级工程师程华无锡江南计算机研究所高级工程师程华一直从事国产关键软硬件的评测和自主可控度评估工作。从2010年开始，8年以来，她每年都会将三大国产品牌的最新款处理器与国外芯片进行对比。 2017年10月27日，在中国计算机大会（CNCC2017）上，程华报告了对申威、飞腾、龙芯三大国产处理器平台在2015和2017年两度专业测试的结果及初步分析，并和英特尔奔腾4的测试结果进行了对比。对比方式：图中的柱状图每种颜色代表一个处理器厂商的产品，红绿黄都是国产cpu，蓝色为国外cpu。最左边为申威411（2015年测试）同一颜色接下来的是申威1621（2017年测试）(2017年还在内测未正式发布)。然后是飞腾1500A（2015年测试）和2017年测试的飞腾1500A，虽然硬件并未发生变化，但由于软件优化，测试性能有了明显提高。再后面是龙芯3A2000（2015年测试）和3A3000（2017年测试）。右边3列蓝色柱状图从左至右分别是 Intel P4处理器（补充：双核、主频3.2GHz ）Intel， 2009年发布的 i5处理器，AMD E350 (2009年发布)。首先对比的是基础的综合性能，使用业界主流的测试套件：Unixbench。主要测字符、上下文切换、整数与浮点运算、管道存储能力等，此张ppt反映的是运行单线程Unixbench的情况，分值越高越好（柱状图越高越好）。它反映的是操作系统可以看到的处理器单核的性能。从单线程性能来看，从2015年开始，每一款国产处理器都超过了P4，到2017年已经明显高于P4。同时可以看到，在2年时间里，3家国产处理器的单核性能提升都非常明显。此图为4核的性能对比此图为16核时的性能对比，因为这里有一个国产处理器厂商只有4核的芯片…… 图上仍然以P4的性能作为对比（）最左边的蓝色柱状图）。此图为3个国产处理器2015年到2017年两年时间里，单核、4核、16核（无16核的处理器以4核叠加计算）综合性能提升比率，可以看到黄色代表的厂商其单核性能都已经翻倍了。<编者补充：绿色代表的厂商性能提升最不明显，大概因为其处理器硬件并未更新换代，只是软件优化带来了一些性能提升>此图为细粒度的性能中，基本的双精度浮点加、乘、除运算时间，单位是纳秒，数值越小成绩越好。 2015到2017年，3家的此项性能都不如P4。这个测试与软件基本无关，主要反映处理器加法器乘法器等部件的设计水平。此图为上下文切换延迟性能单位是纳秒，数值越小越好。包括多线程和单线程上下文切换性能，3家处理器性能一直比P4好，我们分析国产处理器性能低从来不在上下文切换上。有两家2017年性能比2年期有所下降，是正常现象，因为性能是在做不断的平衡。此图为虚拟文件系统延迟，也是越低越好。此图为本地通信带宽，成绩是越大越好。通过管道 ……、通过标准Unix协议、通过文件的重读内存的读和内存的写入来做通信。我们可以看到带宽,越大越好这方面国产处理器都远远的超过了P4。此图为内存的读写延迟，数值越小越好。图上第一项是L1cache延时，国产处理器都不如P4。第二项L2 cache读写延迟，国产处理器除黄色代表厂商外做得比P4好。后面两项为内存写入延迟和读取延迟。此图为磁盘写入性能。单位为kB每秒，数值越高越好。此图为磁盘读取性能，单位为kB每秒，数值越高越好。磁盘读写性能是我们的长项，3家的国产处理器都远远的超过了P4，特别是有一家厂商（绿色代表厂商）在磁盘读取性上面(非常突出)……这张图片总结了3家处理器厂商在2015年到2017年两年时间里细粒度性能的涨幅，平均下来是2.4左右。此图为我们自己做的一个用户测试。我们老说去比Spec CPU 国产处理器也不差呀，可是为什么用起来感觉好像慢呢？我们就做了一个userbench，方法是我们单位使用的国产处理器计算机平台，一个月以来让大家做一个使用情况的统计，比如做一个新word文档大家都一样的。我们做了Word文档，Ppt文档，Excel文档，一百次重启，文件压缩，点对点的文件拷贝，浏览器的使用浏览ccs的网站……网站，就是平常常用的计算机操作。图中最后一项就是所有测试加起来的时间，除以10（补充：用时越短越好）。从总时间来看，3家处理器，在2年时间里性能大概都只提高了20%左右，低于前面的硬件细粒度性能提升。原因主要是缺乏软件的配合，缺乏中间件的配合。（补充：软件优化不到位）此图为Trace分析，如打开word文档，看起来我们的cpu性能比P4好，为什么实际用起来还是比P4慢呢？我们trace了性能数据，红色曲线是我们自己的国产处理器计算机平台，在打开文件的过程中，用户态和系统态所占的百分比，蓝色曲线是P4的。可以看到，在刚开始工作的时候，蓝色曲线比较高（P4）对系统资源的利用比较好，红色就弱一些。这个非常典型，实际3家国产处理器情况都差不多。这就说明软件的优化没有跟上…… 谢谢大家补充：程华高工(或许出于照顾面子的原因，因为3家厂商代表都参加了计算机大会)，在演讲中没有明确指出红绿黄分别代表哪一家国产处理器厂商。但是从演讲的上下文对照图片，我们不难推断出红色代表申威，绿色代表飞腾，黄色代表龙芯。从上面的性能分析可以看出，无论单线程还是多线程综合性能飞腾都明显领先，申威性能居中，龙芯忝陪末座。用户实际使用测试结果，仍然是飞腾最强，但龙芯反倒优于申威。原因大概是申威的软件生态还是比不过龙芯，优化不够。当然龙芯也有亮点，就是在2年时间里，单线程综合性能提高了几乎一倍。 ppt来源，中国计算机学会，数字图书馆《三大国产处理器评测及分析》

三大国产处理器对比评测三大国产处理器评测及分析江南计算技术研究所高级工程师程华无锡江南计算机研究所高级工程师程华一直从事国产关键软硬件的评测和自主可控度评估工作。从2010年开始，8年以来，她每年都会将三大国产品牌的最新款处理器与国外芯片进行对比。在2017年10月27日的中国计算机大会（CNCC2017）上，程华报告了对申威、飞腾、龙芯三大国产处理器平台在2015和2017年两度专业测试的结果及初步分析，并和英特尔奔腾4双核处理器（主频3.2GHz）的测试结果进行了对比。对比方式：图中的柱状图每种颜色代表一个处理器厂商的产品，红绿黄都是国产cpu，蓝色为国外cpu。最左边为申威411（2015年测试）同一颜色接下来的是申威1621（2017年测试）(2017年还在内测未正式发布)。然后是飞腾1500A（2015年测试）和2017年测试的飞腾1500A，虽然硬件并未发生变化，但由于软件优化测试性能有了明显提高。再后面是龙芯3A2000（2015年测试）和3A3000（2017年测试）右边3列蓝色柱状图从左至右分别是 Intel P4处理器（补充：双核、主频3.2GHz ）Intel， 2009年发布的 i5处理器，AMD E350 (2009年发布)。首先对比的是基础的综合性能，使用业界主流的测试套件，Unixbench。主要测字符、上下文切换、整数与浮点运算、管道存储能力等，此张ppt反映的是运行单线程Unixbench的情况，它的分值越高越好（柱状图越高越好）它反映的是操作系统可以看到的处理器单核的性能。从单线程性能来看，从2015年开始每一款国产处理器都超过了P4，到2017年已经明显高于P4。同时可以看到，在2年时间里3家国产处理器的单核性能提升都非常明显。此图为4核的性能对比此图为16核时的性能对比，因为这里有一个国产处理器厂商只有4核的芯片…… 图上仍然以P4的性能作为对比（最左边的蓝色柱状图）。此图为3个国产处理器2015年到2017年两年时间里，单核、4核、16核（无16核的处理器以4核叠加计算）提升比率，可以看到黄色代表的厂商其单核性能都已经翻倍了。,<补充：绿色代表的厂商性能提升最不明显，大概因为其处理器硬件并未更新换代，只是软件优化带来了一些性能提升>此图为细粒度的性能中，基本的双精度浮点加、乘、除运算时间，单位是纳秒，数值越小成绩越好。 2015到2017年，3家的此项性能都不如P4。这个测试与软件基本无关，主要反映处理器加法器乘法器等部件的设计水平。此图为上下文切换延迟性能单位是纳秒，数值越小越好。包括多线程和单线程上下文切换性能，3家处理器性能一直比P4好，我们分析国产处理器性能低从来不在上下文切换上。有两家2017年性能比2年期有所下降，是正常现象，因为性能是在做不断的平衡。此图为虚拟文件系统延迟，也是越低越好。此图为本地通信带宽，成绩是越大越好。通过管道 ……、通过标准Unix协议、通过文件的重读内存的读和内存的写入来做通信。我们可以看到带宽,越大越好这方面国产处理器都远远的超过了P4。此图为内存的读写延迟，数值越小越好。图上第一项是L1cache延时，国产处理器都不如P4。第二项L2 cache读写延迟，国产处理器除黄色代表厂商外做得比P4好。后面两项为内存写入延迟和读取延迟。此图为磁盘写入性能。单位为kB每秒，数值越高越好。此图为磁盘读取性能，单位为kB每秒，数值越高越好。磁盘读写性能是我们的长项，3家的国产处理器都远远的超过了P4，特别是有一家厂商（绿色代表厂商）在磁盘读取性上面(非常突出)……这张图片总结了3家处理器厂商在2015年到2017年两年时间里性能的涨幅，平均下来是2.4左右。此图为我们自己做的一个用户测试。我们老说去比Spec CPU 国产处理器也不差呀，可是为什么用起来感觉好像慢呢？我们就做了一个userbench，方法是我们单位使用的国产处理器计算机平台，一个月以来让大家做一个使用情况的统计，比如做一个新word文档大家都一样的。我们做了Word文档，Ppt文档，Excel文档，一百次重启，文件压缩，点对点的文件拷贝，浏览器的使用浏览ccs的网站……网站，就是平常常用的计算机操作。图中最后一项就是所以测试加起来的时间，除以10（补充：用时越短越好）。从总时间来看，3家处理器，在2年时间里性能大概都只提高了20%左右，低于前面的硬件细粒度性能提升。原因主要是缺乏软件的配合，缺乏中间件的配合。（补充：软件优化不到位）此图为Trace分析，如打开word文档，看起来我们的cpu性能比P4好，为什么实际用起来还是比P4慢呢？我们trace了性能数据，红色曲线是我们自己的国产处理器计算机平台，在打开文件的过程中，用户态和系统态所占的百分比，蓝色曲线是P4的。可以看到，在刚开始工作的时候，蓝色曲线比较高（P4）对系统资源的利用比较好，红色就弱一些。这个非常典型，实际3家国产处理器情况都差不多。这就说明软件的优化没有跟上…… 谢谢大家补充：程华高工(或许出于照顾面子的原因，因为3家厂商代表都参加了计算机大会)，在演讲中没有明确指出红绿黄分别代表哪一家国产处理器厂商。但是从演讲的上下文对照图片，我们不难推断出红色代表申威，绿色代表飞腾，黄色代表龙芯。从上面的性能分析可以看出，无论单线程还是多线程综合性能飞腾都明显领先，申威性能居中，龙芯忝陪末座。当然龙芯也有亮点，就是在2年时间里，性能提高了几乎一倍。

天河三号E级原型机系统通过科技部验收记者从国家超级计算天津中心获悉，由国防科技大学和国家超级计算天津中心等团队合作承担的“天河三号E级原型机系统”研制项目，经过两年多的持续关键技术攻关和突破，原型系统研制成功，在国家超级计算天津中心部署完成，于7月22日顺利通过国家科技部高技术中心组织的课题验收，将逐步进入开放应用阶段。　　据了解，2016年国家科技部结合“十三五”发展规划，通过国家重点研发计划支持，开始分两期启动我国E级计算机研制计划。第一期主要为“E级计算机关键技术”研究，安排了三个E级机原型样机的研制；第二期为研制E机计算机。其中，“天河三号E级原型机系统”研制项目是我国首个完成原型样机系统研制和部署的项目。　　通过几十年积累和不断的技术创新，“天河”超级计算机系统在核心关键技术上实现了整体自主可控。“天河三号原型机系统”全面搭载国产自主芯片，实现了可适应科学计算和数据处理多应用需求的柔性体系结构，可支持十万结点规模的高速互连和光电混合高速信号传输技术。在原型样机系统基础上，“天河三号”超级计算机最终有望于2020年研制成功，其运算能力将比“天河一号”提高200倍，存储容量提高100倍。　　国家超级计算天津中心相关负责人表示，今后将依托“天河三号”超级计算机，构建超级计算与云计算和大数据深度融合的高性能计算服务平台，在长效高分辨率气候气象预报、大规模航空航天数值风洞、地震地质研究和油气能源勘探、生命科学研究等超大规模计算与模拟，以及涉及国计民生、信息安全的政务数据、医疗卫生、基因健康、智慧城市、交通、地理、海洋等大数据分析处理领域，发挥强大支撑和平台作用，有效推动新一代人工智能发展规划等实施和网络强国建设。

鼓噪FT1500a是公版a57核心者，可以休矣！采用 ARMv8指令集飞腾 1500A处理器有一个独特的特征，与其他处理器，包括同样采用 ARMv8 指令集的处理器都不同：飞腾 1500A 处理器的内存访问指令分为两类，一类是普通的 ld / st 访存指令，可以访问所有的 CPU 地址空间; 另外一类是ldp / stp 指令，只能访问主存地址范围，不能访问外设地址范围。 ldp / stp 指令，在访问内存时，一条指令可以携带两个64 比特数据，从而在一条指令中同时传输128 比特数据，而普通的 ld / st 指令，只携带一个数据，一条指令最多同时传输 64 比特数据很显然，数据拷贝时，使用 ldp / stp 指令能够获得更高的传输性能。事实上，基于飞腾1500A 处理器的计算机系统中的大量数据拷贝操作( 如 memcpy 函数) 基本都是调用 ldp / stp 指令来进行的。以上文字引用自论文：《国产飞腾1500A处理器的显存管理优化》