hcdpz hcdpz
关注数: 46 粉丝数: 135 发帖数: 4,723 关注贴吧数: 31
两“芯”战事:龙芯被指违约侵权 IPO或成水月镜花 来源:财经自媒体 2000年10月,毕业已有9年的胡伟武回到母校中科大进行招生宣传,故地重游,实验室一如十年前凌乱,触手可及的芯片、电容、电阻,勾起他重操旧业的冲动。有此契机,胡伟武参与到计算所筹备的CPU设计项目中,龙芯中科便诞生于此。 2002年,基于MIPS技术的龙芯1号流片成功,胡伟武团队给它起了个小名叫“狗剩”,音译成英文就是“Godson”,希望名字贱一点容易养大,可惜龙芯中科没能如胡伟武所愿。龙芯1号到龙芯2号只用了22个月,而龙芯3号系列却走了十多年。 当时在学院派思想的主导下,国内CPU的目光从单核转向多核,被提升单核通用性能的主流市场拉开差距,用胡伟武的话来说是,“从相差1-2倍到相差一个数量级。” 从意气风发的起步,到跌跌撞撞的修正,CPU,这座芯片界的“珠穆朗玛峰”,龙芯中科已攀爬了二十年有余。本以为否极泰来,却在龙芯中科宣布“推出自主指令系统架构LoongArch”、筹备在科创板上市之时,遭到了芯联芯的“违约侵权”之诉。 两“芯”内战一触即发,近期由于鸿蒙系统发布,被网友质疑为安卓套壳,趁着连带着当年汉芯旧闻的讨论,一时间甚嚣尘上,芯片行业再次陷入一片质疑,是否侵权?李鬼李逵?孰是孰非? 两“芯”矛盾公开 龙芯中科脱胎于中科院计算所的一个课题组,胡伟武为课题组长。设计之初,所长李国杰将“高性能、通用、一步到位”定为目标,细分下去,胡伟武与结构室主任唐智敏又确定兼容及采用RISC结构为具体目标,指令系统定为与MIPS兼容。自此,龙芯中科便与MIPS维系了长达二十年的羁绊。 2010年,在中科院与北京市政府的牵头出资下,龙芯中科向市场化转型,成立了公司,李国杰任董事长,直到2020年,董事长变更为胡伟武。 值得一提的是,龙芯芯片是国内六家国产CPU处理器之一。其中,龙芯中科是六家厂商中首家向科创板发起冲击的公司,其他五家分别为天津飞腾、华为鲲鹏、海光信息、上海申威和上海兆芯。日前,海光信息也传出了上市消息。 而此次违约侵权纠纷中的另一主角中国公司“上海芯联芯智能科技有限公司”成立于2018年12月,在2019年取得MIPS公司在中国(包括香港和澳门地区)的独家、永久和不可撤销的经营权,承接其在中国的所有授权合约(包括上述龙芯中科),以及其全部技术与可衍生的二次研究开发权与命名权、可追溯的诉讼权。 由此,两家公司通过MIPS技术产生了联系,龙芯中科与MIPS公司的业务转到了芯联芯名下。凤凰网财经《启阳路4号》了解到,从2019年开始,芯联芯便就侵权违约相关事项与龙芯中科进行磋商。到了2021年2月,因龙芯中科与MIPS的合约以美国加利福利亚洲的法律为依据,芯联芯按规定在香港提出了对龙芯中科的仲裁。 提出仲裁后,6月2日,芯联芯又发布声明表示,龙芯中科“彻底抛弃MIPS发布自主指令系统”等内容的宣传和报道偏离事实,损害了芯联芯的合法权益.并且多年来龙芯中科未依约履行相关授权协议,包括未依约按时足额向其支付技术授权的权利金等相关费用。 对于芯联芯的声明,龙芯中科当日回应称,芯联芯向龙芯中科的合作伙伴、社会公众不断发布各种恶意中伤、诽谤龙芯中科及龙芯中科产品和自主知识产权的函件与信息,严重侵害了龙芯中科的合法权益,造成了极其恶劣的社会影响。龙芯中科已经采取法律行动,将追究芯联芯及相关人员的法律责任。但,龙芯中科对于芯联芯声明里所有披露的问题,没有提出任何实质性的回复或法律证据。 次日,芯联芯再度发布声明,建议龙芯中科遵守行业惯例,立即发布“LoongISA”和“LoongArch”手册的完整内容,适时公布所有“LoongArch”研发人员名单。截止发稿之日,龙芯中科仍未正面回答芯联芯的第二次声明。 这一轮交锋过后,双方的矛盾被推至大众眼前。 是否拥有对MIPS指令集二次开发的权利? 为了更进一步了解龙芯中科与芯联芯的纠纷,凤凰网财经《启阳路4号》分别联系了双方,截至发稿,龙芯中科尚未回复,而芯联芯方则向凤凰网财经《启阳路4号》透露了一些细节。 芯联芯表示,作为一家中国公司,除了获得上述MIPS在中国独家、永久和不可撤销的经营权外,芯联芯还享有代表MIPS对存在侵权违约行为的客户进行追溯的权利。 在承接了MIPS的业务后,芯联芯对MIPS在中国的所有业务进行梳理,过程中,发现了龙芯中科存在侵权行为。具体的侵权行为,芯联芯认为有三方面,一是违规对MIPS指令集进行二次开发,二是违规对MIPS的IP进行分授权,三是没有依约缴纳权利金。 违规对MIPS指令集进行二次开发,最早可追溯至龙芯一号。在龙芯中科还是课题组时期,MIPS公司只与中科院签署过单个的授权合同,合同约定中科院不可转让、不可修改等,严格限制了其二次开发的权利。这种背景下,龙芯中科团队在MIPS指令集的基础上开发出了龙芯一号、龙芯二号。 2010年,龙芯中科转型为公司后,2017年与MIPS公司签订了R6版本的授权协议。芯联芯透露,这份协议仍然严格限定了龙芯中科二次开发的权利,并且不包括此前的R1、R2、R3、R5版本。这与龙芯中科技术白皮书中“得到MIPS架构的永久使用授权”、“授权允许龙芯中科公司通过MIPS指令系统的UDI对指令系统进行扩充”的说法并不相符。 此外,在龙芯中科对外宣传的ppt上,也出现过LoongISA指令系统“基于MIPS32/64 R3”的内容。 因此,芯联芯认为,龙芯中科自主研发的“LoongArch”指令集,依照行业规范,应公开完成净室程序(Clean Room Process)的验证过程、验证研发人员有无重叠及开发过程间隔等事宜。 是否涉嫌虚假宣传? 对于市场质疑的一些问题,芯联芯也向凤凰网财经《启阳路4号》作出了回答,比如“多年来”龙芯中科都没有依约足额缴纳权利金一说有何依据? 芯联芯向凤凰网财经《启阳路4号》表示,龙芯中科除与MIPS约定每五年支付一次授权费用外,还需要每季度向其支付版税。自芯联芯取得经营权后,从2019年一季度开始,龙芯中科就向芯联芯支付这笔费用,一直到2020年一季度。 既然龙芯中科向芯联芯支付了版税,为何芯联芯还认为其没有依约足额缴纳? 对此,芯联芯透露,龙芯中科每季度向芯联芯支付的版税是依据每季度的产量及售价计算,芯联芯发现龙芯中科支付的版税与其对外宣传的收入规模并不相符。而且在2001-2010年间,胡伟武团队利用MIPS技术生产产品也并未交过版税。 在对照龙芯中科所宣传的销量后,芯联芯产生了疑虑,提出了依约审计,但龙芯以各种理由拒绝配合。 根据公开数据,2017年,龙芯中科实现了1.5亿元的销售收入,利润为2000多万元;2018年,龙芯中科利润翻番,实现了现金流的净增加;2019年,龙芯中科销售收入为2018年的2.2倍,利润是2018年的3倍以上,净利润首次突破1亿元;而到了2020年一季度,龙芯中科表示销售收入同比增长30%以上。 能否顺利IPO? 芯联芯的专利维权,对于正处于上市辅导期间的龙芯中科来说并不是个好消息。 12月28日,北京证监局网站显示,龙芯中科中信证券于2020年12月签署《关于首次公开发行人民币普通股(A股)并上市之辅导协议》。协议显示,龙芯中科拟于上交所科创板上市。如此推测,龙芯中科早于启动上市辅导前就得知芯联芯有追溯知识产权的法律权力并已经对龙芯中科的“违约侵权”提出多次质询与警告,不知龙芯中科有无据实向辅导上市中介提供所有情况与信息? 天眼查显示,龙芯中科注册资本3.6亿元,有10个股东,其中中科院计算所(国资)持股21.52%,北京天童芯源科技公司(胡伟武个人投资292万元,占46.67%;其他股份为早期高管所有)持股21.52%。 龙芯中科选择在这个时期IPO不无道理,CPU市场的竞争在持续加剧,2020年英特尔的研发投入超过135亿美元,同期AMD的研发投入也近20亿美元,龙芯中科也需要投入大量经费去进行研发升级。 据AI财经社报道,2019年前,国家信创项目(信息化应用创新)做了两批试点,总共四五百家单位做了国产替代。由于龙芯中科和飞腾做得比较早,又分别是中科大和国防科大的背景,获得先发优势。其中桌面CPU市场绝大部分是龙芯中科获得,服务器CPU市场80%也是龙芯中科。 但在2019年后,随着其他国产CPU,如天津海光、华为入局,整个市场竞争变得更为激烈。中国电信公布的2020年采购项目中,华为鲲鹏和海光就首次中标。 这种背景下,龙芯中科能否通过上市获得更多渠道的融资便十分重要。然而,近年来,企业在IPO的进程中,监管对于涉及专利的内容颇为关注,案例显示,不少企业因专利问题倒在了IPO的大门外。在此关键时期,芯联芯的依约维权或成为龙芯中科上市的“拦路虎”。 此外,从芯联芯对龙芯中科的维权来看,一个值得探讨的问题是:中国企业上市应该理清知识产权关键属性与界限,保护广大投资人的合法利益,维护中国芯的国际合法地位。在中国芯的发展过程中,龙芯的知识产权是否“自主可控、永久买断授权”一直存有争议,趁这次机会,把问题浮上台面,彻底厘清权属对国内集成电路行业的IP发展是一个好事。(凤凰网)
中国芯黑暗往事 “汉芯造假”事件始末 CPU,相当于计算机的大脑,因为研发门槛高、生态构建难,被视作是半导体产业的“珠穆朗玛峰”。 如果一个国家拥有芯片核心技术,那就相当于站在国际科技发展的最前沿! 中国是世界上芯片市场需求量极高的国家,但长期以来芯片自给严重不足,这是因为,芯片产业一直以来都是中国的弱项,从最早期的大型计算机IBM时代,再到PC时代的英特尔、AMD时代,芯片始终被美国所垄断。 那么,中国早期为什么没有研发自己的芯片呢? 实际上,中国早在20年前,就已经非常重视自主芯片领域了,从早年在芯片领域给人、给钱、给物的全力支持政策倾斜,到后来在这个领域的谨小慎微,都要拜芯片领域的一次惊天造假事件所赐——汉芯造假事件! 汉芯造假事件,对中国芯片产业的发展起了非常大的负面作用,业界评论说汉芯造假让“中国芯”发展停滞13年,其阴霾挥散不去,整个中国芯片产业至今意难平。 这里我们简单说下汉芯造假事件的始末,以及对中国芯片产业的影响。 首先我们要从事件的主人公,前上海交大教授陈进说起。在“汉芯黑幕”被曝光之前,陈进身上有无数的光环萦绕,海归、青年学者,他曾在摩托罗拉半导体总部做过芯片设计经理,并担任高级主任工程师。 正因为有了这样“光鲜”的履历,让他一回国就担任了“汉芯”的总设计师。事实上陈进也不负众望,仅仅花费了16个月的时间,便正式宣布“汉芯1号”研制成功,并被业界誉为“中国芯片发展史上一个重要的里程碑”。 陈进所获得的“巨大成功”不仅带来了鲜花和掌声,还有显赫的头衔和不菲的研发经费。他被上海交大特聘为长江学者,出任微电子学院院长,拿到上亿元研发资金。除此之外,他还成为上海硅知识产权交易中心CEO、上海汉芯科技有限公司总裁。 2006年,清华大学BBS上发帖《汉芯黑幕》,匿名举报陈进的汉芯CPU造假。根据这份爆料帖子显示,2002年,陈进前往美国,托自己在摩托罗拉的前同事,私自下载了摩托罗拉一款芯片的源代码,靠着这套源代码,陈进做出了“汉芯1号”。 然而这样做出来的芯片是无法进行实际系统应用的,因为芯不对码。后来,记者们的深度挖掘不仅揭露出“汉芯”处理器更多的造假细节,还揭露陈进的履历和学历均存在造假的问题。曾经的“民族英雄”瞬间变成了欺世盗名的骗子! 尽管整个事件十分曲折,但简单总结起来无非一句话就可以概括:一个海归买了前公司的芯片,找装修工人把LOGO拿砂纸磨了,然后拿来当成自己研发的芯片,轻松骗取了国家上亿的研发经费。 汉芯造假事件,给中国自主芯片发展规划蒙受了不可估量的损失,上海交大及各相关方在汉芯项目上的损失高达11亿。更令人痛心的是,本应该是中国芯片腾飞发展的关键时机,却被一个惊天骗局破坏了。这不仅让我们蒙受了巨大的经济损失,而且错失了最佳的发展时机,以至于到今天,我们的芯片产业仍旧无法摆脱“受制于人”的局面。受汉芯造假事件牵连,上海硅知识产权交易中心的开展无法摆脱巨大的阴影;类似地,龙芯的违约侵权如果查证成立,有更多不知情的龙芯再授权厂商同样可能牵连受损。
龙芯再陷侵权,“汉芯事件”或将卷土重来? OFweek电子工程网 曾几何时,骇人听闻的“汉芯”造假事件,让“中国芯”发展停滞13年,给中国芯片行业留下了重重阴霾,然而阴影尚未完全消散,中国芯片行业却又再起波澜! 最近,上海芯联芯的“一纸声明”,在芯片行业激起千层浪,引发业界广泛关注讨论。上海芯联芯称龙芯中科LoongArch或存知识产权侵权风险,已对其启动法律程序,目前正在进行中。 汉芯造假事件,给中国自主芯片发展规划蒙受了不可估量的损失,上海交大及各相关方在汉芯项目上的损失高达11亿。更令人痛心的是,本应该是中国芯片腾飞发展的关键时机,却被一个惊天骗局破坏了。这不仅让我们蒙受了巨大的经济损失,而且错失了最佳的发展时机,以至于到今天,我们的芯片产业仍旧无法摆脱“受制于人”的局面。受汉芯造假事件牵连,上海硅知识产权交易中心的开展无法摆脱巨大的阴影;类似地,龙芯的违约侵权如果查证成立,有更多不知情的龙芯再授权厂商同样可能牵连受损。 疑云笼罩 龙芯中科,“汉芯事件”或将卷土重来? 龙芯是国内最早开始研发国产CPU的公司之一,其余几家为申威科技、飞腾信息、兆芯集成、华为鲲鹏及海光信息。 关于龙芯,众所周知的故事是,2001年5月,龙芯诞生于中科院计算所知识创新工程支持下的龙芯课题组,“七八号人,两三条枪”,和英特尔同岁、时年33岁的胡伟武自动请缨,出任首席科学家,组建队伍。 然而这20年的发展历程,龙芯走得并不平坦,曾几一度处于侵权违约疑云笼罩之下,2006年被MIPS指出抄袭, 2015年右也一度由于因违反保密协议约被Imagination(MIPS前控股MIPS公司)发过警告函。 回到2003年,凭借龙芯1号,龙芯团队成功申请到国家863重点项目,而完成863任务的指标只有两个,CPU主频达到500MHz,space CPU2000(当时国际公认的CPU测试软件)分值在300以上。 为了这两个目标,龙芯团队又投入了大量人力、物力,最终在一年内设计出龙芯2号,该芯片在space CPU2000上的分数,超过了当时英特尔的奔腾2。 然而好景不长,2005年,市场调查公司In-Stat发表龙芯2号可能涉嫌侵权的报告后,立即引起业界强烈关注。 2006年,美国半导体设计公司MIPS,称龙芯的指令集95%与MIPS相似,属于抄袭。当时龙芯公司称,虽然龙芯2号在设计思路上与MIPS R1000有相似之处,但并不是后者的复制品,也没有抄袭任何其它芯片产品的设计思路。当时的分析人士认为,如果龙芯2号制造商与MIPS之间无法达成一致,将有可能引发中美芯片企业之间的首次知识产权冲突。 倒霉的是巧的是,也是在同一年,汉芯造假事件被曝光。同为中国芯的典型代表,彼时刚起步的龙芯也被夹裹其中,“外国核心中国外壳”“龙芯和汉芯是一路货色”“龙芯汉芯凉了中国心”等质疑铺天盖地而来。 不过3年后,MIPS宣布MIPS32、MIPS64的结构中的单一功能产品授权给龙芯,双方开展带有限制性条款(不得修改、不得转授权IP等)长期战略性合作,但这又为龙芯带来“骗经费”、“伪自主”的口诛笔伐。 而且,当时龙芯产品市场化走的也不顺利,主要因为疲于应付专利纠纷和抄袭风波的龙芯,没能推出一款让人叫好的电子产品,软件生态的推进更是顾此失彼、步履维艰。 2021年4月,龙芯发布自主指令系统架构“LoongArch”共三卷,大众对龙芯举行隆重的发布会, 却以国家安全保密教育为名只发布封面, 不免惹人质疑。,随后,龙芯才发布了《龙芯架构参考手册卷一:基础架构(V1.00)》,并对外宣称“龙芯架构具有完全自主、技术先进、兼容生态三方面特点。龙芯架构从整个架构的顶层规划,到各部分的功能定义,再到细节上每条指令的编码、名称、含义,在架构上进行自主重新设计,具有充分的自主性。” 但是随后不久,关于龙芯“LoongArch”未完整公布手册第二卷及第三卷内容的问题,再次引起了业界对其是否真正做到了充分“独立自主”的质疑,紧跟而来的怀疑,不只是又一场知识产权纠纷.... 业内盛传卷2卷3侵权疑云罩到了 Intel 与 AMD, 是否 LoongArch 触及各家指令集, 所以迟迟不公布全文及作者? 历来国内各单位公布的指令集有方舟, 众志, 中天微等等… 综观就只有 LoongISA, LoongArch 保密不宣, 要建生态又要遮遮掩掩,难免引来非议。 龙芯, 汉芯对产品源头的处理, 探触到中国对知识产权的保护深度. 13年前是汉芯擦掉了芯片上的印记, 13年后的龙芯 LoongArch会不会是换了个封面的各家指令集成? 这种作法目的是为爱国还是骗补? 过去汉芯也许是中美公司之争, 现在龙芯与芯联芯的纠纷, 不需纠结在爱国情怀, 就是两个中国公司对知识产权法律法规行权界限的争议。 若以国家长期利益为动力, 用一场能创先例的知识产权案件实事求是地展现我国知识产权保护的水平, 经受法律界有力道有高度的客观检视, 对帮助和促进中国蓬勃的半导体及芯片产业走向全球市场将大有裨益。
国产CPU运行国产计算数据库 性能对比测试报告 一、 测试背景 由于众所周知的世界经贸形势,拥有全面自主可控的IT解决方案成为摆在国家面前的一项重要任务。但是,由于目前国产芯片的性能还相对较弱,大多只能应用于OA等边缘业务,要用到关键业务中时就必须加大成本以扩大集群规模,这将进一步推高因为生态成熟度还不足而导致本身成本就不低的全国产技术方案的应用门槛,抑制了全国产技术的推广应用范围。 SPL计算数据库是一项从理论模型到代码实现都拥有完全自主产权的新技术,它采用了创新代数体系,允许程序员实现更高性能的低复杂度算法,从而获得比传统关系数据库更好的运算性能。因此,可以通过软件弥补硬件,使较低性能的国产芯片不需要扩大集群规模就能够适应原来必须使用国外芯片的应用场景,并且还有一定程度的性能提升。 二、 测试方法 采用国际上公认的数据库性能测试工具TPCH,通过与国外数据库产品的杰出代表Oracle12.1.0及另一国产数据库(下文中简称国产数据库)进行对比测试。 TPCH是由TPC(Transaction Processing Performance Council)事务处理性能委员会公布的一套针对数据库决策支持能力的测试基准,通过模拟数据库中与业务相关的复杂查询考察数据库的综合处理能力,获取数据库操作的响应时间。 TPCH基准模型中定义了一个数据库模型,容量可以在1GB~10000GB的8个级别中进行选择。数据库模型包括CUSTOMER、LINEITEM、NATION、ORDERS、PART、PARTSUPP、REGION和SUPPLIER 8张数据表,涉及22条复杂的SQL查询语句。 TPCH测试具有广泛的权威性和被认可度,涉及内容丰富,可以避免片面性,并确保测试结论的说服力。 传统数据库都是用SQL语言进行查询,在SPL数据库中,需要将TPCH提供的SQL翻译成SPL脚本来运行。 三、 测试环境 本场测试分别在五台不同配置的独立服务器上作运行测试,分别命名为intel2670、intel3014、龙芯、飞腾FT1500、飞腾FT2000,硬件配置如下表: 国产数据库只在龙芯上测试,Oracle 只在 intel 上测试,SPL 在五台服务器上均做了测试。四、 数据准备 测试数据均采用TPCH提供的数据生成程序产生,产生了100G和200G两种规模的测试数据,100G数据用在intel3014、龙芯、飞腾FT1500、飞腾FT2000四台服务器上,200G数据用在intel2670、飞腾FT2000两台服务器上。 TPCH产生原始文本文件数据以后,需要导入数据库表中供数据库软件查询使用。SPL数据库使用的数据存储在硬盘组表文件中,也需要由原始文本数据转换生成。下表是转换成所需要的测试数据所花的时间(共有8张表,只比较数据量较大的3张表)。 可以看出, Oracle数据导入的时间非常长。SPL和国产数据库的导入时间相当,这方面均比Oracle有数倍的性能优势。五、 测试结果 测试的三种软件均支持并行查询,即用多线程共同协调完成一次查询任务。然而并行的路数并不是越多越好,因此在每台测试服务器上需要测出查询速度最快的并行数。我们用TPCH的第一条查询任务作测试,在每台测试服务上的并行查询结果如下: 表中红色数字对应的并行数,即为各测试服务器上最佳的并行数,于是TPCH后面各查询测试中就以此并行数来进行测试。测试结果如下表:
飞腾与龙芯的内存性能简单对比 posted @ 2019-08-25 17:33 济南小老虎 1. 使用的工具 mbw mbw使用了三种不同的方式进行了测试 : (1), 使用memcpy将一个数组复制到另一个数组 :Method: MEMCPY (2), 使用for循环将一个数组复制到另一个数组 : Method: DUMB (3), 使用mempcpy将一个块复制到一个数组 :Method: MCBLOCK AVG 为每一项的最终结果。 2.1 龙芯机器 [root@NeoKylin mbw]# ./mbw -b 4096 16Long uses 8 bytes. Allocating 2*2097152 elements = 33554432 bytes of memory. Using 4096 bytes as blocks for memcpy block copy test. Getting down to business... Doing 10 runs per test. 0 Method: MEMCPY Elapsed: 0.00831 MiB: 16.00000 Copy: 1925.855 MiB/s 1 Method: MEMCPY Elapsed: 0.00743 MiB: 16.00000 Copy: 2151.984 MiB/s 2 Method: MEMCPY Elapsed: 0.00725 MiB: 16.00000 Copy: 2207.810 MiB/s 3 Method: MEMCPY Elapsed: 0.00756 MiB: 16.00000 Copy: 2117.803 MiB/s 4 Method: MEMCPY Elapsed: 0.00696 MiB: 16.00000 Copy: 2299.511 MiB/s 5 Method: MEMCPY Elapsed: 0.00720 MiB: 16.00000 Copy: 2223.149 MiB/s 6 Method: MEMCPY Elapsed: 0.00668 MiB: 16.00000 Copy: 2394.851 MiB/s 7 Method: MEMCPY Elapsed: 0.00672 MiB: 16.00000 Copy: 2380.952 MiB/s 8 Method: MEMCPY Elapsed: 0.00683 MiB: 16.00000 Copy: 2341.235 MiB/s 9 Method: MEMCPY Elapsed: 0.00664 MiB: 16.00000 Copy: 2409.276 MiB/s AVG Method: MEMCPY Elapsed: 0.00716 MiB: 16.00000 Copy: 2235.386 MiB/s 0 Method: DUMB Elapsed: 0.05303 MiB: 16.00000 Copy: 301.722 MiB/s 1 Method: DUMB Elapsed: 0.05248 MiB: 16.00000 Copy: 304.901 MiB/s 2 Method: DUMB Elapsed: 0.05171 MiB: 16.00000 Copy: 309.442 MiB/s 3 Method: DUMB Elapsed: 0.05217 MiB: 16.00000 Copy: 306.719 MiB/s 4 Method: DUMB Elapsed: 0.05256 MiB: 16.00000 Copy: 304.420 MiB/s 5 Method: DUMB Elapsed: 0.05208 MiB: 16.00000 Copy: 307.237 MiB/s 6 Method: DUMB Elapsed: 0.05289 MiB: 16.00000 Copy: 302.509 MiB/s 7 Method: DUMB Elapsed: 0.05493 MiB: 16.00000 Copy: 291.269 MiB/s 8 Method: DUMB Elapsed: 0.05201 MiB: 16.00000 Copy: 307.604 MiB/s 9 Method: DUMB Elapsed: 0.05262 MiB: 16.00000 Copy: 304.044 MiB/s AVG Method: DUMB Elapsed: 0.05265 MiB: 16.00000 Copy: 303.909 MiB/s 0 Method: MCBLOCK Elapsed: 0.00740 MiB: 16.00000 Copy: 2161.578 MiB/s 1 Method: MCBLOCK Elapsed: 0.00699 MiB: 16.00000 Copy: 2289.639 MiB/s 2 Method: MCBLOCK Elapsed: 0.00716 MiB: 16.00000 Copy: 2234.325 MiB/s 3 Method: MCBLOCK Elapsed: 0.00697 MiB: 16.00000 Copy: 2294.894 MiB/s 4 Method: MCBLOCK Elapsed: 0.00663 MiB: 16.00000 Copy: 2412.909 MiB/s 5 Method: MCBLOCK Elapsed: 0.00689 MiB: 16.00000 Copy: 2321.195 MiB/s 6 Method: MCBLOCK Elapsed: 0.00651 MiB: 16.00000 Copy: 2456.248 MiB/s 7 Method: MCBLOCK Elapsed: 0.00710 MiB: 16.00000 Copy: 2252.252 MiB/s 8 Method: MCBLOCK Elapsed: 0.00658 MiB: 16.00000 Copy: 2432.350 MiB/s 9 Method: MCBLOCK Elapsed: 0.00673 MiB: 16.00000 Copy: 2376.355 MiB/s AVG Method: MCBLOCK Elapsed: 0.00690 MiB: 16.00000 Copy: 2319.647 MiB/s 2. 飞腾机器 root@lccy-2321321:~/lmbench3# mbw 16 -b 4096Long uses 8 bytes. Allocating 2*2097152 elements = 33554432 bytes of memory. Using 4096 bytes as blocks for memcpy block copy test. Getting down to business... Doing 10 runs per test. 0 Method: MEMCPY Elapsed: 0.00887 MiB: 16.00000 Copy: 1804.647 MiB/s 1 Method: MEMCPY Elapsed: 0.00837 MiB: 16.00000 Copy: 1911.817 MiB/s 2 Method: MEMCPY Elapsed: 0.00834 MiB: 16.00000 Copy: 1917.316 MiB/s 3 Method: MEMCPY Elapsed: 0.00836 MiB: 16.00000 Copy: 1914.563 MiB/s 4 Method: MEMCPY Elapsed: 0.00838 MiB: 16.00000 Copy: 1909.536 MiB/s 5 Method: MEMCPY Elapsed: 0.00837 MiB: 16.00000 Copy: 1911.817 MiB/s 6 Method: MEMCPY Elapsed: 0.00836 MiB: 16.00000 Copy: 1913.189 MiB/s 7 Method: MEMCPY Elapsed: 0.00835 MiB: 16.00000 Copy: 1915.479 MiB/s 8 Method: MEMCPY Elapsed: 0.00836 MiB: 16.00000 Copy: 1912.960 MiB/s 9 Method: MEMCPY Elapsed: 0.00831 MiB: 16.00000 Copy: 1924.233 MiB/s AVG Method: MEMCPY Elapsed: 0.00841 MiB: 16.00000 Copy: 1902.950 MiB/s 0 Method: DUMB Elapsed: 0.00824 MiB: 16.00000 Copy: 1941.983 MiB/s 1 Method: DUMB Elapsed: 0.00827 MiB: 16.00000 Copy: 1935.406 MiB/s 2 Method: DUMB Elapsed: 0.00831 MiB: 16.00000 Copy: 1926.086 MiB/s 3 Method: DUMB Elapsed: 0.00829 MiB: 16.00000 Copy: 1929.571 MiB/s 4 Method: DUMB Elapsed: 0.00826 MiB: 16.00000 Copy: 1936.577 MiB/s 5 Method: DUMB Elapsed: 0.00825 MiB: 16.00000 Copy: 1938.689 MiB/s 6 Method: DUMB Elapsed: 0.00825 MiB: 16.00000 Copy: 1940.335 MiB/s 7 Method: DUMB Elapsed: 0.00826 MiB: 16.00000 Copy: 1936.812 MiB/s 8 Method: DUMB Elapsed: 0.00829 MiB: 16.00000 Copy: 1929.803 MiB/s 9 Method: DUMB Elapsed: 0.00826 MiB: 16.00000 Copy: 1936.108 MiB/s AVG Method: DUMB Elapsed: 0.00827 MiB: 16.00000 Copy: 1935.125 MiB/s 0 Method: MCBLOCK Elapsed: 0.00198 MiB: 16.00000 Copy: 8060.453 MiB/s 1 Method: MCBLOCK Elapsed: 0.00198 MiB: 16.00000 Copy: 8084.891 MiB/s 2 Method: MCBLOCK Elapsed: 0.00196 MiB: 16.00000 Copy: 8167.432 MiB/s 3 Method: MCBLOCK Elapsed: 0.00196 MiB: 16.00000 Copy: 8146.640 MiB/s 4 Method: MCBLOCK Elapsed: 0.00202 MiB: 16.00000 Copy: 7916.873 MiB/s 5 Method: MCBLOCK Elapsed: 0.00204 MiB: 16.00000 Copy: 7839.294 MiB/s 6 Method: MCBLOCK Elapsed: 0.00198 MiB: 16.00000 Copy: 8068.583 MiB/s 7 Method: MCBLOCK Elapsed: 0.00198 MiB: 16.00000 Copy: 8068.583 MiB/s 8 Method: MCBLOCK Elapsed: 0.00196 MiB: 16.00000 Copy: 8163.265 MiB/s 9 Method: MCBLOCK Elapsed: 0.00197 MiB: 16.00000 Copy: 8134.215 MiB/s AVG Method: MCBLOCK Elapsed: 0.00198 MiB: 16.00000 Copy: 8063.703 MiB/s 由以上测试结果可知,除了第一项测试MEMCPY,龙芯略为领先飞腾外,剩下两项测试 DUMB、 MCBLOCK,飞腾都极大幅度领先龙芯(飞腾分别是龙芯的 6倍 和 4倍) 来源:www.cnblogs.com/jinanxiaolaohu/p/11408614.html
[转贴] 国产CPU:本是同根生,相煎何太急! 文章转帖自公、众、号:科技芯焦点 。 转帖此文,不代表本人认同或证实文中观点、陈述。 原创: 曰非曰 在郭嘉重大战略布局上,lx、FT、SW永远是最积极响应的,作为中国开展CPU研制工作最早的三家团队,经过二三十年的技术积累,目前已经具备相应能力来满足用户不同层次的需求: lx:来自于中科院体系,一直以“中国芯”的身份出现,也是产业化做的最早的公司,在市场上的熟识度较高。其MIPS架构同ARM架构一样属精简指令集,授权模式类似。龙芯根据指令集架构自己研制了基于不同自主内核的CPU产品,做到了自主、可控、可靠。但因指令集架构的小众,其产业生态的建设步履维艰,但目前也取得相当的成绩。截至目前,龙芯在信创领域的项目中参与较多。 FT:之前服务于较多涉密关键领域,指令集架构也几经变化,最后综合考量软硬件生态的问题,选择ARM架构。据目前全球的发展,ARM是和X86平分秋色的存在,且飞腾取得的是指令集架构永久授权,自己写微内核,做到自主、可控、可靠,业务覆盖较广。截止目前,飞腾在信创领域的项目中参与较多。 SW:若不是神威·太湖之光因为突然取得世界超算top500的NO.1,他会一直神秘下去。申威采用的是ALPHA(SW64),因指令集小众,且自成一体,自主、可控、可靠,业务目标主要瞄准安全密码领域,在具体信创产业布局上稍显滞后。不过,最近中国电科在上海举行了申威服务器首批量产下线仪式活动,以此开始申威CPU产业化。相信在不久之后,相关单位也将会陆续用到申威服务器,具体性能指标也将逐步公开,在信创领域申威也将会有更多的参与。
飞腾最新演讲视频总结 近日,飞腾在四川省中芯举办的国产芯片和os远程视频培训会上, 飞腾行业解决方案总监杨威,做了关于飞腾CPU的一个报告。 里面有一些值得关注的信息。 由于版主不允许发信创培训视频,我把视频中要点信息总结如下: 1、飞腾是自主可控处理器领域百分之百国资的国家队。 2、飞腾进入信创市场相对较晚,之前市占率在30%,今年预计可达50%。 3.、国务院发展研究中心2019年11月发布的白皮书,分析了目前信创市场各种指令集架构的情况。 a.信创市场的x86架构未来可能会被替换掉; b.alpha架构(Sw64)主要用在神威超算和某兵种的数据中心(wangjun),信创市场应用不多; c.龙芯的MIPS实际也是分期付款的架构授权,终究也是受制于人、受制于美国,MIPS被反复多次倒卖令人唏嘘。d.power架构,主要用于银行的小型机,未来一年左右就会被替换掉。 e.国内arm生态,华为是一致对外,飞腾是国家队,一主一背, 主导zzkk市场5~10的发展已经是逐渐显现的趋势。 自主可控程度的评价是要求处理器核心的每一行代码都是自己写的。 4、指令集活跃度比较,比较linux发行版对各种指令集架构的支持,x86和arm64、powerpc所有发行版都支持,对其他架构支持越来越差,造成这些架构不得不自己维持一个庞大的团队,去维护linux内核对自己芯片架构的支持。 只能靠自己去维护庞大的生态。 6、已经有600多家软件厂家加入飞腾生态,6大类400多种整机产品,1000多种软件,形成了一个完整的生态体系。 7、测过ft1500a的用户都知道,spec、unixbench测试, 飞腾是前几年出来的几种国产cpu中性能最好的。而且,在数据库测试中性能是其他国产CPU的5~6倍。 8、行业应用,服务器都要求2路以上的CPU。FT2500支持2到8路,很快就会发布,双路性能和鲲鹏920基本一致 (我估计应该是指 华为主推的48核鲲鹏920 4826,也就是说spec int rate性能 大约在700分) 目前,2路的FT2500已经调试完毕,4路的FT2500已经成功启动操作系统正在继续调试优化。 9、飞腾对新4核FT2000/4 寄予厚望,发布半年多来 已经出货 50万片,飞腾是按100万片备货的。 基于FT2000/4 即将推出 无风扇 的超薄笔记本,飞腾已经成功在上面运行 windows(估计是win10arm), 飞腾自己的员工都在等这款超薄笔记本。有望在京东公开销售。 10、基于飞腾的云平台,包括腾讯政务云在内的几万台服务器级别的大型案例很多,云方面远远领先国内其他架构。 11、与电信合作,飞腾服务器进入5G核心网,应用在UPF、 DU、CU单元中。未来将为电信定制服务器CPU。 12、基于飞腾的台式机在:xc目录、j口目录、 bm目录、等等级目录,飞腾占据的份额愈来愈大,目前已经占据60~70%的份额。 13、飞腾生态发展极为迅速,2018年适配的软件厂家才60多家,到现在已经超过600家软件厂商适配飞腾。 14、安全设备(防火墙等),全部80多款产品,60%采用飞腾的架构,30%为X86,10%为MIPS。
贴一贴我被自嗨吧封禁的奇葩理由 出于对“不及格”人士的关爱,我带个头满足他的要求。 贴一贴我被自嗨吧封禁的奇葩理由 大家有类似经历的,也可以一起来关爱FF6618 这记录堪比贴吧曼德拉了吧,这群人还有脸攻击别的吧封人删帖,不看看它们自己干的是人事么!FF6618: 还有奇葩的 中国芯片 龙黑 两个吧,也是暗无天日 | 2020-12-31 20:52回复 LYLMNF 这个理由是龙芯吧定制的吗?我做了一年吧主都没见过这个理由眼里不揉啥: 应该有私人订制啊 删除 | 2020-12-31 21:08回复 FF6618: 这些都不会再我的帖子里出现,其实主要理由就一条,不配合它们吹捧龙芯 | 2020-12-31 21:10回复 给了我恶露Joe 我也被这奇葩理由封过 ,搞得一脸懵逼,一吧主都能有这口气 以后不得了 FF6618 再共享几个奇葩理由2021-01-01 09:41 FF6618 直接不给理由,还有威胁查水表的2021-01-01 12:34 太液提督管叉叔 提供一个定制理由例子:“知道3A2000在SMIC流片么” 在龙芯吧说龙芯3A3000和龙芯3A4000在意法半导体流片、龙芯3A5000在台积电流片收获的。 现在是永不过时的苏联笑话时间: “他们说我恶毒攻击龙芯。” “你说什么了?” “我把龙芯做的事又说了一遍。” LYLMNF: 不是说我们黑龙芯,我们怎么黑了,我们把龙芯跑分成绩发网上了吗 2021-1-1 20:03回复 hcdpz: 今天把“静置续航2.5小时的最强桌面笔记本发到了到自嗨吧LYLMNF: 我帖子里那张图还是那个远空探索者发的,有天晚上我尝试在他层底下讨论续航,第二天发现被封删 2021-1-23 07:43回复 hcdpz: 回复 LYLMNF :看来真正打到龙芯的痛处了。 | 2021-1-23 13:59回复
看看当初龙芯是怎么描述指令集的作用的. 龙芯FAQ,写给对龙芯有误解的人 仔细看看 也许能有用_龙芯吧_百度贴吧 来自:tieba.baidu.com/p/147425180该文的原作者是:当时龙芯项目的总负责人: 唐志敏。 我觉得唐总就比京胡 更踏实。如果龙芯后来没有换帅。 走到今天应该发展得好得多。 给了我恶露Joe 张志敏 唐志敏 老胡三人 各奔东西了 会不会是理念不同 sunnyEEK: 去查一查当年的聚芯事件,当然是胡某人把张志敏和唐志敏给逼走了 2021-5-23 11:22回复 给了我恶露Joe: 回复 sunnyEEK :去看看,卧槽这大事件 FF6618 看看超大这篇文章,某人嘴脸就是顺我者昌,逆我者我就骂,自己常有理,实际把历史串起来看就知道全是屁股决定脑袋,钱闹的 胡伟武对兆芯的怨念真是深恶痛绝啊-IT与通讯技术-超级大本营军事论坛-最具影响力军事论坛 - (cjdby.net) http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Flt.cjdby.net%2Fthread-2470380-1-1.html&urlrefer=664ba667b51ffde6cb652c9c8402bc9c FF6618: 有一段 总结一下逻辑: 买MIPS前: 为什么龙芯是真自主?因为龙芯有自主指令集。 买MIPS后: 为什么龙芯要买MIPS?因为MIPS有生态,龙芯自主指令集没生态。 买MIPS了几年后: 为什么龙芯是真自主?因为龙芯在MIPS基础上又发展了自主指令集,其他国产芯是用别人的指令集。 这么自己打自己的脸很有意思吗?
飞腾对自己CPU的评价 1 月 31 日,飞腾信息技术有限公司副总经理张承义博士 接受凤凰卫视专访,以下为张承义答记者的内容。 "我们更看重的是量级的变化,国产芯片如果没有达到一定用量,我们很难说这个芯片是可用的、好用的。正因为达到了超百万的用量,我们才敢说国产芯片已经到了一个完全可用的程度 ”。 “ 我们不希望以一种强制的手段告诉客户,这是国产的东西所以你必须要用,其实我们希望推出的产品能切实地满足客户的需求、满足客户的应用和一些痛点、难点,解决他们的问题,而不是单纯的要做国产替代。” “ 现在的芯片竞争实际是处于战国时代,原来我们会说国外的几个巨头占据了这个芯片市场。现在随着信息技术的不断发展,趋势的不断变化,不管是国外还是国内都进入了战国的时代,谁抓住了用户的需求,谁和用户的需求走得更近,未来在行业内谁才会走得更远。” 看来飞腾对自己的CPU,评价是“已经达到完全可用”。比之 某芯的 “补课完成、大学毕业、接近天花板”,还算是比较谦虚的了。 眼里不揉啥 D20009 飞腾也是受够了,终于学会还嘴了 FF6618 飞腾说自己才是可用,别家都快到天花板了,所以飞腾💊 爆炒大小萝卜丁 建议某芯下一代芯片代号叫“天花板” papapa001 逻辑上没毛病 不走量没法谈可用 LYLMNF FT2000+12 70%的市场份额短短一年被别人咬成40%,说明产品竞争力差 FF6618: 40%估计也很虚,算金额绝对到不了 | 2021-2-9 17:03回复 hcdpz: 它那个年出货百万片,怕是把啥水表、门锁上的单片机都算上了。 2021-2-9 22:09回复 太液提督管叉叔: 回复 hcdpz :白春礼去年十一明确说,龙芯3A3000处理器销售超过30万颗,在电子公文二期试点中占70%份额;嵌入式领域销售龙芯芯片超过30万颗;累计应用于10颗北斗导航卫星。欢迎自嗨众论证白春礼在污蔑龙芯,或者龙芯向白春礼提供的是假数据。 2021-5-27 21:13回复 太液提督管叉叔: 回复 hcdpz :白春礼可没说“仅今年以来”,哈哈哈 2021-5-27 21:13回复风之翼: 回复 太液提督管叉叔 : 龙芯被把的底裤都没有了
自主CPU扩展指令的能力、动机和效果 FF6618 一直以来,能否自行扩展指令集,成为某些人判断CPU自主性的一条标准,甚至用这个来攻击几家抬高一家,成为粉丝信仰源泉之一。 本文本着实事求是的态度,分析一下这个问题。 自主扩充指令,可以从能力、动机、效果三个方面去分析。 从扩充能力上,国内龙芯、飞腾、申威、华为、兆芯,无疑都具备扩充指令能力,因为他们都是自研整个CPU内核,修改译码部分增加一条指令的译码逻辑没啥难度,飞腾数次更换整个指令集的历史也是明证,华为布局RISCV,兆芯同时有ARM产品,而龙芯从来没有尝试过其它指令集,能力并不算突出,但为啥这里面只有龙芯一直在广泛宣传自己扩充指令这件事呢? 这就要从扩充指令的必要性角度分析了。还是和最初MIPS路线选择有关,要知道MIPS是个走下坡路的生态,原厂没有太大精力维护发展,导致很长一段时间,一些新的指令集特性缺失,具体就是向量指令、虚拟化指令,还有涉及信息安全的一些部分。这些指令,在X86、ARM等生态中,早已经解决,这就是优秀生态的作用。在ARM生态中,如果确实有扩充指令需求,也可以提交ARM生态,飞腾就有多条提议已被采纳。在龙芯这边,而之前很长一段时间,龙芯因为MIPS架构的限制,连KVM虚拟机都不能适配,更遑论KVM之上的OpenStack等云计算框架了。此外软件生态缺失,看着x86 ARM 遍地开花的软件,龙芯也是很着急。还有对提高测试成绩很重要的向量指令。 因此龙芯有急迫的扩充指令需求,他们之前在MIPSr2基础上,自行扩展了1000多条指令,LoongsonISA要比MIPS (216条基础指令+311条DSP指令)庞大得多,曾经达到共有1907条指令。 比如: MIPS基础指令扩展——148条loongEXT,含1、2、3 虚拟机扩展——5条loongVM指令,后来又有LoongVZ(简称LVZP)是龙芯针对MIPS64 Release 5中的VZ虚拟化模块指令集的扩展 二进制翻译扩展——213条loongBT,(用于兼容X86和ARM指令) 向量指令扩展——1014条loongSIMD,实际上又包含了授权的MSA MSA2 还有FP,FPRev,MMI,MSA1,MSA2,CGP,WRP,LSX1,LSX2,LASX,R6FXP,R6CRCP,R6FPP,CNT64,LEXT1,LEXT2,LEXT3,LSPW,LBT1,LBT2,LBT3,LBTMMU,LAMU,LVZP,LVZRev,LDISBLIKELY一大堆,这么多指令,甚至用光了指令集扩展槽,不知道后面再扩是不是要淘汰一批才行。 这里要指出gueenet的一个错误,龙芯是在MIPSr2基础上进行扩展的,r5版本出来的比较晚,龙芯没有等到就自己动手了。而R5版已经有大部分龙芯缺失的东西了,VZ MSA等。所以到了4000,龙芯又授权了r5,具体花多少钱不知道。龙芯有现实的扩充指令的需求,因为很多必要指令是缺失的,同时可以带来宣传上的主动,宣传自己摆脱了MIPS限制,走上了自主发展之路。这也是龙芯粉丝的信仰源泉之一。 但龙芯的指令扩展似乎缺乏总体规划,能定义生态的领军人物,要求远超出处理器体系结构设计的范畴,还要对行业应用发展高瞻远瞩才行。龙芯的指令扩展并不自信,一直没有形成非常固化的成果,曾经出现龙心2f时代直接更新到r2放弃旧的支持的现象,现在涉及到自扩指令条数说法也时有变化,完整指令手册也没有渠道提供。 从扩充指令的效果分析 我本来不想泼这个冷水,但是客观上种种信息表明,龙芯的扩充指令之路并不顺利, 1、推广应用受阻,龙芯的扩展指令集并不完全开放,没有指令手册,甚至同一阵营的龙梦都拿不到,可能和部分二进制翻译扩展会引起知识产权纠纷有关,也可能技术本身尚未固化。指令集就是方便软件开发者的,都握在自己手里能发挥啥作用?可数的应用包括MMI用于ffmpeg,EXT1/2已经在gcc里面用了。但这是我见到的应用面最窄的指令扩展了,生态扩展作用发挥不好. 2、自主指令对处理器效能提升效果有限,3A4000的提升,和自创指令关系不大,主要源于授权采用MIPSr5指令。龙芯在4000发布会上提供的信息表明:之前的虚拟化效能88%,现在提高到98%,4000的向量指令相对之前的3000,科学计算理论效能可以提高到4倍,分析4000主要改进涉及的新增指令,竟然不是自己扩展,还是从MIPSr5授权的MSA、VZ,可见之前的自行扩展,效果不太好。3、过于复杂的指令,拖累了主频提高,指令多必然导致译码复杂,原来优美的精简指令现在拖上了千余条扩展指令的累赘,甚至用完扩展指令槽,绝大部分指令除了龙芯自己跑分外估计还用不上,龙芯的晶体管数量和同性能的X86、ARM要多的多,功耗高、主频提升迟缓和这个有很大原因。 从指令集推广到生态,虽然龙芯宣称其生态本质上已经不能再称为MIPS软件生态,但直到3A4000,基础指令的主干和提高性能的主要指令,仍然是源自MIPS,可见龙芯自建独立生态之艰难。 总结: 能力方面,扩展指令集的能力几家都有,一旦需要都可以自行扩展。 必要性方面,扩展指令集的动机方面,龙芯因MIPS之前的缺失,最为急迫,其他几家因生态完善,并不急迫,国产两家ARM都有扩展指令的渠道和发言权。 效果方面:龙芯从3A4000开始,通过引进和自创,补上了指令集短板,授权的引MSA和VZ成为能力提升主要因素。但缺乏规划已经让龙芯背上了指令集庞杂碎片化的包袱,自创指令的推广效果有限。飞腾等厂家提出的指令建议已经进入ARM主干。 结论:能掌控指令生态的领军企业仍未出现,仍处于跟生态的阶段,距离引领生态的目标,还要许多课需要补。现阶段,盲目追求自创指令,弊大于利。
龙芯的股权结构 龙芯中科 股权构成如上图所示。 天童芯源科技+天童芯源投资中心+天童芯正 股权占比33.61%,天童系的其实际控制人是胡伟武。 国资占比33.61%,剩余为其他投资合伙机构。 从龙芯股权结构可知,L芯完全是胡老板一手控制的私企,这个私企利用与中科院计算所的特殊关系长期半免费的使用计算所的博士硕士等高级劳动力,长期利用此关系申请国家重大项目(数次未通过验收),长期以自主可控cpu的面目抢夺各种政府订单。 对跟它有竞争关系的 兆芯、飞腾、华为等国产cpu厂家,某芯老板及其吹鼓手, 极尽污蔑贬低之能事,造谣飞腾使用公版A57核心,攻击抹黑兆芯不自主不可控,为了贬低华为 污蔑鲲鹏920cpu为外国团队设计,如此种种 不一而足。 某芯用挖空心思手段用尽的优化后spec测试成绩,对比 竞争对手在低版本GCC、非极致优化的情况下测试成绩的base值,鲜廉寡耻的宣传自己单核性能排名第一。却从来不敢明确公布测试的具体环境和优化参数。 实际上在许多第三方测试中,使用和竞争对手一样的测试环境、编译参数时,龙芯的测试成绩惨不忍睹,大幅度落后对手。 某芯还用所谓的每Ghz性能误导大众,每每宣传perGhz性能龙芯最强,宣扬其微架构设计水平最高,此举已被广大业内人士传为笑谈。 飞腾是国资100%控股的央企子公司,兆芯是国资大比例控股的企业,华为是我国电子信息领域技术水平最高的民营企业。他们之间,有竞争,但大家都用产品说话,属于良性竞争;这种竞争,有利于提高我国高性能通用微处理器整体水平。除去某芯,其他国产cpu的研发机构,从来没有 互相恶意造谣 贬低的言论,也从无相互攻击抹黑的行为。 申威作为实际属于体制内的研究机构,跟某芯几乎没有直接的竞争关系(an ke桌面计算机没有申威cpu),所以某芯明面上好像对申威态度较好。 海光作为中科院计算所派生企业,其CPU本来最符合 胡、铁等人对 马甲CPU 的定义,但他们却从不提出海光的自主可控问题,反倒频频发文支持。 某芯所谓的为国家自主可控cpu事业奋斗,实际是胡老板等为自己争夺个人私利的生意。所谓某芯最为自主可控,不过是为了将竞争对手挤出dzj市场所找的借口。 这样一个老板到水军 、乃至部分到粉丝,信口开河、颠倒黑白、愚弄大众 、抹黑友商的私企,实乃国产CPU界的一颗毒瘤。它的所作所为,极大的损害了本就弱小的国产cpu事业。 关心、支持国产处理器事业的有识之士,应该勇敢的站出来,向受其蒙骗大众 充分揭露其丑恶的真实面目。
王东临:尊重市场,主攻ARM和RISC-V生态,放弃MIPS和Alpha 作者 王东临,书生云创始人/CEO,制定了中国软件业第一个国际标准,中国科协十大青年科学家,中国软件十大杰出青年,首届中国杰出工程师,中国软件行业十大领军企业家。 一、什么是自主可控? •系统后门可控 •不会被敌对国家利用后门将系统弄瘫痪了或者将数据偷走了 •生产维护可控 •不会因为禁运、停止技术支持而无法生产、维修、改进 •自主可控是系统工程 二、软件自主可控要求 •软件不存在禁运问题 •不用担心违背商业合同停止法律授权 •你不仁,我不义,没有授权照样用 •需要拥有全部源代码 •需要能吃透全部源代码,能改bug能升级的技术团队 三、自主可控不能违背市场规律 •自主可控不是能否开发出来竞争产品的问题,而是开发出来的产品是否有生存空间的问题 •实践多次证明,单方面追求自主可控,违背市场规律的产品/规划都会失败的 •生态是发展自主可控的首要因素!!! •Nokia+MS,即便是手机第一+软件第一,脱离主流生态依然速死 •硬件、基础软件、应用系统必须形成良性循环的生态 •生态不仅仅包括几个核心产品,还包括丰富低成本的配套产业和人才 •市场要足够大,保证能养活足够多的厂商,不仅覆盖所有环节,还能形成有效竞争 四、自主可控与开源软件 •开源保证了拥有全部软件源代码,再有吃透代码的团队就可以实现自主可控 •积极参与到已经形成主流生态的开源社区,是成本最低、风险最小、最有成效的方式 •保证了位于主流生态 •花费的人力物力比自己从头研发低很多 •通过积极为社区贡献,掌控社区发展主导权 •必要时也可以建立自己的分叉 五、自主可控的误区 •要面向未来搞自主可控,而不要面向过去搞自主可控 •什么被掐脖子搞什么,用了好多年时间和举国资源,好不容易搞出点名堂却发现过时了 •自主可控并不是闭关锁国 •要尽可能追求开放、协作 •中国自主可控并不是某一家公司自主可控 •应该全国一盘棋,尽可能多地发动全国所有力量,而不能被特定公司绑架 •拿开源代码进行闭源,弊远大于利 •不将代码贡献给社区,导致自己做的feature不能合并到主干版本中,逐渐与主干版本渐行渐远,最终被淘汰,例如HP的OpenStack项目 •在已有主流生态的领域,不要自己打造新生态,至少中国政府缺乏独立打造生态的能力 •政府管理体系完全不适应打造生态的需求 •几十年实践反复验证 六、建议 •不要局限单机(PC或单服务器),而应扩展到虚拟化、容器、分布式存储、SDN、云管平台、容器集群管理平台、大数据、AI、超融合、物联网、区块链 •扶持中国公司掌控主流开源软件社区 •所有主要模块都有足够多的中国公司参与,中国公司的并集可以消化吃透所有细节,而且还有足够的竞争强度 •根据贡献度发放奖金,担任PTL、Board等社区负责人的重奖 •主攻ARM和RISC-V生态,放弃MIPS和Alpha •服务器端基于X86的开源生态是完整强大的,基于ARM的生态也逐渐成熟 •移动端基于ARM的生态是完整强大的 •RISC-V是一个方向和趋势,可以实现CPU的完全自主可控,中国可以领导全世界干 •MIPS和Alpha生态肯定做不起来了,请不要浪费国家资源和用户的爱国热情,不要瞎折腾做基础软件的中国公司了 •PC端主攻Android生态 •Android将从移动端反攻PC端,导致Windows边缘化甚至灭亡 申威转向RISC-V?参与发起中国RISC-V产业联盟 由上海芯原、芯来科技、上海赛昉科技(SiFive China)、上海高性能集成电路设计中心(申威)、杭州中天微、北京君正、兆易创新、致象尔微电子、乐鑫科技、时芯电子、展讯通信、地平线、晶晨半导体、华大半导体、格易电子、上海集成电路行业协会、上海物联网行业协会等单位共同发起的中国RISC-V产业联盟正式宣布成立,上海芯原担任联盟首任理事长单位。 实际上,以上很多联盟成员已经在推进RISC-V产业生态建设的路上 。 指令集是半导体芯片发展最重要的基础,对CPU运算进行指导和优化的硬程序。传统的大多数指令集架构,例如x86,ARM和MIPS等,通常属于某个公司所有,在获得专利授权前无法自由使用。RISC-V特色鲜明,目标是成为指令集架构领域的Linux。与大多数指令集相比,其最大特色就是开放和免费,通过将核心指令集以及其CPU设计的IP开源,很大程度上改变运算平台芯片的设计生态。 然而,相比ARM和英特尔x86,RISC-V现阶段的一大短板就是生态不完善。这并不是任何一家或几家企业能够做好,还需要持续的政策、人才、资金的大力支持,此次中国RISC-V产业联盟的成立,正是将全球最优质的资源集聚于此,大家共同发力,建立起一套基于全新指令集的生态系统,促进信息产业自主可控的发展。 FF6618 我觉得说的很好,而且不怕得罪人说出来,令人佩服。不要给人扣帽子,觉得不对就发表自己观点,理性讨论。
三大国产处理器评测及分析 江南计算技术研究所 高级工程师 程华(现已升任总师) 无锡江南计算机研究所总师程华 ,一直从事国产关键软硬件的评测和自主可控度评估工作。从2010年开始,8年以来,她每年都会将三大国产品牌的最新款处理器与国外芯片进行对比。 2017年10月27日,在中国计算机大会(CNCC2017)上,程华报告了对申威、飞腾、龙芯 三大国产处理器平台在2015和2017年两度专业测试 的结果及初步分析,并和英特尔奔腾4的测试结果进行了对比。 以下内容由程华总师演讲视频整理:对比方式:图中的柱状图每种颜色代表一个处理器厂商的产品,红绿黄都是国产cpu,蓝色为国外cpu。 最左边为申威411(2015年测试),同一颜色接下来的是申威1621(2017年测试)(2017年还在内测未正式发布)。 然后是飞腾1500A(2015年测试)和2017年测试的飞腾1500A,虽然硬件并未发生变化,但由于软件优化,测试性能有了明显提高。 再后面是龙芯3A2000(2015年测试)和3A3000(2017年测试)。 右边3列蓝色柱状图从左至右分别是 Intel P4处理器(补充:双核、主频3.2GHz )Intel, 2009年发布的 i5处理器,AMD E350 (2009年发布)。 首先对比的是 基础的综合性能,使用业界主流的测试套件:Unixbench。主要测字符、上下文切换、整数与浮点运算、管道存储能力等,此张ppt反映的是运行单线程Unixbench的情况,分值越高越好(柱状图越高越好)。它反映的是操作系统可以看到的处理器单核的性能。 从单线程性能来看,从2015年开始,每一款国产处理器都超过了P4,到2017年已经明显高于P4。同时可以看到,在2年时间里,3家国产处理器的单核性能提升都非常明显。上图为4核的性能对比上图为16核时的性能对比,因为这里有一个国产处理器厂商只有4核的芯片……。 图上仍然以P4的性能作为对比(最左边的蓝色柱状图)。上图为3个国产处理器2015年到2017年两年时间里,单核、4核、16核(无16核的处理器以4核叠加计算) 综合性能提升比率,可以看到黄色代表的厂商 其单核性能都已经翻倍了。(整理者补充:绿色代表的厂商性能提升最不明显,大概因为其处理器硬件并未更新换代,只是软件优化带来了一些性能提升)上图为细粒度的性能中,基本的双精度浮点 加 、乘、 除 运算时间,单位是纳秒,数值越小 成绩越好。 2015到2017年,3家的此项性能 都不如P4。这个测试与软件基本无关,主要反映处理器加法器乘法器等部件的设计水平。上图为上下文切换延迟性能, 单位是纳秒,数值越小越好。包括多线程和单线程上下文切换性能,3家处理器性能一直比P4好,我们分析国产处理器性能低从来不在上下文切换上。有两家2017年性能比2年期有所下降,是正常现象,因为性能是在做不断的平衡。此图为虚拟文件系统延迟,也是越低越好。此图为本地通信带宽,成绩是越大越好。通过管道 ……、通过标准Unix协议、 通过文件的重读内存的读和内存的写入来做通信。我们可以看到带宽这方面,国产处理器都远远的超过了P4。此图为内存的读写延迟,数值越小越好。图上第一项是L1cache延时,国产处理器都不如P4。第二项L2 cache读写延迟,国产处理器除黄色代表厂商外做得比P4好。后面两项为内存写入延迟和读取延迟。此图为磁盘写入性能。单位为kB每秒,数值越高越好。此图为磁盘读取性能,单位为kB每秒,数值越高越好。 磁盘读写性能是我们的长项,3家的国产处理器都远远的超过了P4,特别是有一家厂商(绿色代表厂商)在磁盘读取性上面(非常突出)……这张图片总结了3家处理器厂商在2015年到2017年两年时间里 细粒度性能的 涨幅,平均下来是2.4倍左右。此图为我们自己做的一个用户测试。我们老说 去比Spec CPU 国产处理器也不差呀,可是为什么用起来感觉好像慢呢?我们就做了一个userbench,方法是我们单位使用的国产处理器计算机平台,一个月以来让大家做一个使用情况的统计,比如做一个新word文档大家都一样的。我们做了Word文档,Ppt文档,Excel文档,一百次重启,文件压缩,点对点的文件拷贝,浏览器的使用 浏览ccs的网站……网站,就是平常常用的计算机操作。 图中最后一项就是所有测试加起来的时间,除以10(补充:用时越短越好)。从总时间来看,3家处理器,在2年时间里性能大概都只提高了20%左右,低于前面的硬件细粒度性能提升。原因主要是缺乏软件的配合,缺乏中间件的配合。此图为Trace分析,如打开word文档,看起来我们的cpu性能比P4好,为什么实际用起来还是比P4慢呢? 我们trace了性能数据,红色曲线是我们自己的国产处理器计算机平台,在打开文件的过程中,用户态和系统态所占的百分比,蓝色曲线是P4的。可以看到,在刚开始工作的时候,蓝色曲线比较高(P4)对系统资源的利用比较好,红色就弱一些。这个非常典型,实际3家国产处理器情况都差不多。这就说明软件的优化没有跟上…… 谢谢大家 整理者总结: 程华总师 (出于照顾面子的原因,因为3家厂商代表都参加了计算机大会),在演讲中没有明确指出红 、绿 、黄分别代表哪一家国产处理器厂商。但是演讲的上下文 对照图片,我们不难推断出: 红色代表申威,绿色代表飞腾,黄色代表龙芯。 从江南所所做的性能分析可以看出,无论单线程还是多线程综合性能 ,飞腾都明显领先,申威性能居中,龙芯忝陪末座。 用户实际使用测试结果,仍然是飞腾最强,但龙芯略为优于申威。原因大概是龙芯生态已经很烂了,申威的软件生态更弱。 来源:中国计算机学会, 数字图书馆 《三大国产处理器评测及分析》 演讲视频地址:https://tieba.baidu.com/p/5839106512?pid=121440886896&cid=0&red_tag=0512716996#121440886896
龙芯之MIPS授权问题辨析 看来贴吧还是有那么一点影响力的,在本贴吧揭露龙芯长期蒙骗群众的所谓“买断MIPS”的谎话后,龙芯不得不在UOS开发者大会上把自己获取MIPS授权具体情况公布出来,承认自己是每五年续费一次,而以前龙芯的宣传口径都是所谓“买断MIPS授权”,从来没见过龙芯在公开场合或者公众媒体上提到过五年一续费的事情,所以龙芯“不老实” 这口锅是背稳了。 而所谓”“每5年续费一次,双方不需要重新谈判。协议不能提前终止,除非双方破产。”也是在打马虎眼, 不仔细分析一下又会被它蒙骗。 1、龙芯被迫承认每5年续费一次,但所谓“双方不需要重新谈判”,这个谈判所指的具体对象是啥?龙芯没有明确说明,但我们可以合理推断,肯定应该是龙芯已经获得的授权,因为如果是龙芯此前没有获得的授权,比如MIPS r6,那就不是“重新”谈判,而是“新的”谈判了。 所以,龙芯的这个授权协议跟华为飞腾获得的arm V8指令集授权是类似的,龙芯并不能自动获得r5以后的新版本的授权。 2、再来分析一下:“协议不能提前终止”。 这里的“提前”,是一个时间概念, 是相对正常的、不提前的时间节点而言的。那么这句话至少说明了,有一个时间节点,在此之后就不算提前。很明显这个时间节点就每5年续费的一个周期结束的时候。而所谓“协议不能提前终止”指的就是在这5年的周期内,比如第三年,按照次条款协议不能终止。 既然有“协议不能提前终止”的条款,那么就意味着:如果不提前,“协议可以终止”。 也就是说在5年续费周期结束的时候,MIPS有权结束协议! 3、而所谓“双方不需要重新谈判”,并不意味着MIPS在5年周期结束后一定继续授权龙芯,而只是说明如果mips同意继续授权,那么授权的具体协议照旧,无需再次谈判具体条款而已。
国产通用服务器CPU(ARM64)测评分析 作为第三方测评机构,鹏城实验室最近完成了针对国产ARM64通用处理器的性能测试评估。 本次测试,共测试了5款CPU,其中包括4款进入XC市场的国产ARM64指令集兼容CPU。 考虑到篇幅,这里只介绍大家比较关心的飞腾FT2000+和鲲鹏920,并且主要介绍其整数性能(int)。 被测芯片的参数如下:测试的软件环境如下:由上表可见,FT2000+和鲲鹏920的测试环境是完全一样的,包括操作系统、编译器、以及编译优化参数都完全一致。 报告给出的测试对比,都是使用GCC9.1.0 -O3编译的测试结果。 FT2000+(2.2Ghz)和 鲲鹏920(2.6Ghz 48核)Spec cpu 2017的测试结果对比如下:以下为 ,华为和飞腾官方给出的两种CPU在spec cpu 2006下的测试成绩:注:上图FT-2000+的工作频率为2.3GHz。 下表为两种CPU“整数性能” 在spec17和spec06下测试结果的对比:注:鉴于频率接近可以认为性能增长基本是线性的,所以飞腾的spec06 int speed值由13.5/2.3 *2.2=12.9得出,rate同理。由于没有官方成绩,鲲鹏920的spec06int speed值源自meJustPlay网友,同时也与鲲鹏920的主任架构师夏晶, 每Ghz性能10.8的说法相一致(可能与实际成绩有差异,但不影响最终结论)。 由上表可以看出,在相同测试环境下的spec17测试成绩对比,飞腾显著优于基于官方发布的spec06成绩所做对比。 飞腾在spec17和spec06测试中的多核效率基本一致。鲲鹏在spec17测试时的多核效率则显著优于spec06时的多核效率。 由此可以见,在不同的测试环境下得出的测试成绩,基本没有对比价值。
Peak和Base,看看啥意思 FF6618 KP92013 再看看炼钢术士的测试成绩说明(原文): 1、超频!超频!超频! 宁美主机的默认主频只有1.8GHz,而且自带的固件、操作系统并没有提供睿频的功能。如果处理器主频能够提升到2.2GHz,性能提升22%, 岂不爽歪歪? 在操作系统内核的选择上,我使用了由资深龙芯内核开发者Yang Jiaxun(flygoat)大佬提供的最新版的5.4内核。该内核中增加了处理器主频调节功能,处理器的主频可以提高到2.2GHz。事实证明,龙芯3A4000是可以比较稳定工作在2.1GHz以上的。我的主机曾经在2.2GHz主频下连续运行了11天。 当然,这可能会导致处理器寿命减少,降低系统的稳定性,不推荐普通用户长时间超频使用。 2、在测试中,为了尽可能提高程序的性能,我对编译器的优化选项进行了详细的测试,摸索了对于每个项目最为合适的选项。 FF6618 KP92013 几个事实: 1、作为龙芯的粉丝,作者选择性发布数据,其实base成绩他已经测过,龙芯小吧主一个月前承认,炼钢术士测试 3A4000,即使已经超频,base成绩不到13分 2、作者已经 承认,知乎“原来如此”的SPEC CPU 2006测试也是真实成绩,只是能否使用MSA等MIPSr5指令,以及组双通道内存,对于其性能发挥很重要,在1月份,谁也没有这些条件。 3、作为对比的成绩,不论是之前的飞腾2000/2 还是 Intel X86,每次都是因为时间有限,在炼钢术士这里的待遇都是:”作为对比,我再次在i5-7200U处理器上运行了SPEC CPU 2006测试。由于时间有限,我没有对i5-7200U处理器上的SPEC CPU 2006测试做过多的优化, 只加了-O3 -march=native两个选项,“ 炼钢术士的成绩怎么看: 1、测试者并未清楚的告知读者,他的成绩不是base成绩,并不适合直接与别家的成绩进行对比,peak和超频条件下的成绩,对于一般用户意义不大,进行比较时应主要采用base,所以从这点上看,不能简单说龙芯3A4000达到了19分。 2、龙芯3A4000的配套编译软件、硬件睿频等发布会上宣传的技术仍未提交用户,高度怀疑仍然有没解决的技术问题,没有达到上游要求的成熟度。 3、龙芯3A4000在大部分实际程序中,性能表现像一个超频的3A3000,看7Zip成绩(超频后8000+)就能发现,其真实性能仍落后于对手。 FF6618 KP92013 此外,除了SPECCPU stream以外,知乎之前的文章还测试了: UnixBench 、X11perf 、glmark2 、Octance 、SPECjvm 等项目,既然这个测试者这么有钻研精神,这些测试项目比speccpu简单多了,为啥不跑跑把成绩发出来?还有speccpu rate成绩呢? 结合一个月之前测出base成绩不发,大家有没有想过作者这种选择性发布测试数据的目的?是真的客观公正测试么?
综合对比六大国产CPU厂商,市场竞争格局进一步明晰 FF6618 KP92013 简单总结:综合对比六大国产CPU厂商,市场竞争格局进一步明晰。申威由于过去主要市场在军队,且其产品偏向底层应用及超算领域, Alpha 生态应用较少 预计其可获得的市场份额有限 。 海光、兆芯受制于X86 内核层级授权自主性较弱, 且海光仅获得AMD 服务器授权,暂未获得桌面应用授权, 兆芯由于使用台湾威盛电子的X86 早期授权,产品性能相对落后,且兆芯早期市场开拓不佳 。因此在党政信创市场,预计飞腾、鲲鹏和龙芯三家将成为主导 。 龙芯研发起步最早,党政市场原始份额较大(约占 70以上),国产 整机及 应用适配厂商较多,但MIPS 整体生态 、性能是劣势商用前景较一般,随着鲲鹏进入市场及飞腾逐步成熟, ARM体系的生态和性能优势逐步体现。另一方面,在党政信创市场通过投资给当地带来税收及就业机会是获得份额的一大途径。鲲鹏和中国长城均在多地成立了子公司 ,预计龙芯未来在党政信创领域的市占率会有所下降。鲲鹏当前因为海思受到美国制裁,未来存在一定不确定性,预计其在党政信创市场拓展会有所取舍 。 对行业市场而言,行业市场规模是党政信创市场的数倍,行业市场对CPU性能 、 生态等的要求也远高于信创市场 。因此, 在此前行业国产招标中基本只有鲲鹏 、海光两家获得更多订单, 鲲鹏作为华为海思旗下产品,性能已达到国际先进水平。而ARM生态亦在不断成熟, 若不考虑美国制裁带来的负面影响,其前景最为光明。海光 因获得四年前AMD最先进产品授权, 且经过不断改良加之X86 架构的天然生态优势 ,在行业市场亦获得较多订单。 来源:本文参考自国金证券和网络。
龙芯接受“核高基” 重大专项资助情况(公开资料分析) 下面我根据网上公开的资料,对截止2014年(之后没有公开)龙芯接受核高基资助情况,做一简单的回归总结。 以下信息都是个人从网上搜集后整理,错漏之处,敬请网友不吝赐教。 核高基重大专项,最早从2009年开始,网上有公开材料的一直到2014年。 有关高性能通用处理器的重大专项,涉及龙芯的从2009年开始就有至少2个,分别是: 国家核高基重大专项 “面向服务器/大规模科学计算的高性能多核CPU”,项目编号(2009ZX01028-002-xxx)[ 新型处理器结构研究的项目编号是(2009ZX01028-001-xxx)]; 国家核高基重大专项 “安全适用计算机研制与应用” ,项目编号 (2009ZX01029-001-xxx)。 这两个重大专项都给予了龙芯资助;第一项,龙芯的项目编号是(2009ZX01028-002-003) [2009ZX01028-002-001,2009ZX01028-002-002分别由总参56所和国防科大承担] ; 第二项,龙芯是项目编号是(2009ZX01029-001-002,2009ZX01029-001-003 ),两个项目分别是龙芯“安全适用计算机CPU” 和 “安全适用计算机推广应用”。 此09年的“核高基”项目,关于cpu部分,项目持续时间大致是09年开始到2012年结束。 2011年后,涉及高性能多核/众核CPU的重大专项有: “超高性能CPU新型架构研究” (2011ZX01028-001-xxx),接受该项目资助的单位有 : (2011ZX01028-001-001)国防科大 ,(2011ZX01028-001-002)中科院计算所体系结构国家重点实验室 “超级计算机处理器研发” (2013ZX01028-001-xxx),接受该项目资助的单位有:(2013ZX01028-001-001-001)56所,(2013ZX01028-001-001-002)国防科大 龙芯在2010年后继续接受资助的核高基项目有: “国产服务器操作系统在电子政务领域的推广应用” ,龙芯的项目编号 (2010ZX01036-001-002); “ 支持国产CPU的编译系统及工具链”,龙芯的项目编号(2010ZX01036-001-002); “国产64位软硬件的数控装置及其应用与推广” ,龙芯的项目编号 (2012ZX01029-001-002); “面向移动智能终端的高性能低功耗嵌入式CPU研发” ,龙芯的项目编号 (2014ZX01030101); “抗辐照CPU研发[项目名称存疑]” ,龙芯的项目编号(2014ZX01020201)。 圈内所说的“大CPU”也就是高性能多核处理器,龙芯在承担核高基一期大CPU项目后,后续并没有继续承担高性能多核处理器项目(ZX01028 系列项目)。
几种国产众核通用CPU的 片内互连结构 鲲鹏920:上图是三颗裸晶组成的64核芯片,其中左边两颗为计算die,每颗含32个TSv110核,由4个核组成一个簇,8个簇挂在一个环状总线上,32MB的L3作为一个节点也挂在环上,同样的 存控 也作为一个节点挂在环上。 三颗裸晶之间由 chip间总线实现互连。 环网互连好处是节点间访问延迟短,但不利于核心数目的扩展,环网上如果核心数目过多,在节点访问繁忙时容易造成阻塞。 ======================================================================================飞腾FT2000+:共64核,划分为8个panel,每个panel有两个簇,每个簇有4个662核心共享4MB的L2,没有L3,每个panel配备一个存控MCU。 panel之间使用Mesh网格互连,每个panel内有一个路由单元用于控制Mesh网络的访问。 Mesh网的好处是,扩展性很好,可以方便的扩展到128甚至更多核心。不足之处是 节点间访问延迟较大,尤其是 跨panel时访问延迟会明显增加。飞腾S2500:片内互连和FT2000+高度相似,核心升级为663(增加了对 Meldown 和 Spectre 漏洞的防范)。 另外在每个panel的MCU存控与路由节点间加入了8MB的L3 Cache。(相当于将最早的FT2000的片外L3及存控集成到了片内。)一般情况下每个核心就近访问所在panel的L3和MCU实现访存,特殊模式下也可以跨panel访问MCU,但由于此时访问延迟较大, 跨panel的L3基本失去了意义。 另外S2500还增加了4个片间互连接口,用于实现多路系统。 ======================================================================================申威sw3231:32核,分成两个环装总线,每个环上有8个处理器簇,每个簇有2个申威core3核心共享L2 Cahe。 两个环之间有4条直连通路互连。同时两个环汇集到中心的DLX交叉开关,两个存控簇也连接到DLX,每个存控簇有4个通道的DDR控制器和32MB的LLC。同时实现片间互相的3个接口也连接于该DLX上,可以实现最多4路CPU互连。
我再来谈一下国内自主芯片平台的发展道路 tang5722917 3A50007 先说结论:国内的自主平台的工作重点是软件/客户服务,而不是堆硬件性能。 我觉得大概因为网上大多数的人其实都不是真正的从业者,所以动不动都像手机硬件一样来个跑分。但你们忽视了跑分代表使用体验的前提是因为有统一的操作系统平台来屏蔽硬件差异支持上层应用。而自主芯片平台在软件上的差距远比硬件差距大,所以真要是spec分高就代表实际应用体验,那真是对自主芯片平台的重大利好。 目前国内自主平台的真正客户都是DZJ,期中J这块比较封闭,基本就是几个大所和其各自外围的皮包公司。而DZ,现在都是市场招投标来确定系统集成商,再由系统集成商来做具体的信息工程项目实施。所以不管是哪家自主芯片直接面对其实都是各路系统集成商。而这些所谓的系统集成商就让人一言难尽了,有国企下属的子公司,有研究所的附属公司,更多就是各种各样神通广大的小公司。而这些商业机构可不像贴吧的网友有用爱发电的情怀,如果没有特别指定必然哪家的综合利润高推哪家的平台。 网络有一种说法是极端错误的:我的芯片性能高了,我就能拳打intel脚踢arm,一统各种应用。如果真要是这样,intel早在上世纪90年代被各路risc比如mips r10000打破产了。同时早就有人吐槽过intel与其说是ic公司,不过说是一家兼顾ic设计的软件公公司,如果不算intel的芯片制造部门,intel设计部门里超过百分之九十的员工都是从事软件设计工作。而像英伟达这样的公司其实也差不多,甚至华为的软件部门人数都远比硬件多。 所以是软件决定硬件,而绝不是相反,尤其对那些最多几十号人的小公司。就这点来看兆芯直接赢在起跑线,你直接把兆芯的台式机机/服务器当成五六年前的一般x86硬件就行,而兆芯也确实以这个为卖点,那天兆芯也搞一个“自主”扩展指令,那绝对是脑袋被驴踢了。 而最近几年在国内外共同努力(主要还是国外,尤其是亚马逊的对arm云平台的成熟贡献极大,现在已成为arm云服务的标杆),arm也有成为下一个x86的趋势,所以飞腾未来可期。至于x芯,我只能说自主可控可是是一个卖点,但绝不应该成为唯一卖点, 以上观点其实并没有什么新鲜东西都是些老调重弹。比如某大佬五六年前就说过如下图的话,本人深表赞同。
同样是天玥的电脑,飞腾依然领先.【龙芯吧】_百度贴吧目前这一代龙芯3A4000和飞腾2000/4,在不进行精细调优256位 MSA指令的情况下,同频IPC基本一致,因为主频的差距,3A4000日常各类性能相当于FT2000/4的2/3,同之前多个网友发的测试数据,包括我发的7Zip一致。 在芯片的设计上,龙芯选择了实现特殊向量指令提升SPEC测试数据,这种设计思路存在的问题: 1、面积大、功耗大,面积 功耗均为竞争对手好几倍,如果在公开市场上,这种性能和功耗对比,谁是竞争胜利者根本没有悬念 2、只有个别优化程序可以使用这种指令,MIPS生态已经是日薄西山,在MIPS生态中优化MSA指令提高性能这个事,只有靠龙芯自己承担,而龙芯看起来还没有能力提供一个普遍可用的编译器优化,因此除了spec等个别程序,用户用不上这个费很大面积功耗实现的feature 其实,目前国产处理器面向的应用,还是DZJ办公终端、简单的服务器应用为主,下大力气优化常见的90%程序,才是对用户负责的正途。 既然如此,龙芯为什么要执意搞这种只能跑spec,明显不是用户导向的设计?我猜,背后原因是胡给龙芯的设计师一个spec性能翻倍的目标,他们只好搞这种应试设计,这就是带头人的境界决定了公司和芯片的命运。 2楼 2020-06-15 23:49 太液提督管叉叔: 正常做法应该是提供优化过的编译器和共享链接库。指望普遍深入优化不太现实。 LYLMNF FT2000+12 而且706这个操作也很迷,3A3000连飞腾1500A都打不过,还跟2000/4一起发……这就算被买回去也用的很难受吧 收起回复 7楼 2020-06-16 11:14 太液提督管叉叔: 这有什么迷的。应该是龙芯3A4000还不能出货,所以706发布了对应的型号,但西南计算机公司代工就没有出货。 2020-6-16 11:22回复hcdpz: 不能批量出货,或者有bug无法上批量。2020-6-16 11:46回复LYLMNF: 回复 hcdpz :那龙芯这信创桌面市场75%的市场份额真是危险呢2020-6-16 11:52回复陈英雄HERO: 3A4000 发布了,但是有Bug 不能出货 LYLMNF FT2000+12 笑死,几个常务黑赶紧掏出自己P的蜜汁图谱给大家吸上都活在梦里吧
总结下龙芯这些年的发展目标不明确不专注导致的发展弯路。 总结下龙芯这些年的发展目标不明确不专注导致的发展弯路。 从龙芯刚刚建立,基本就关注龙芯了。 第一波高潮是龙芯确立mips路线,这步走的其实没错,从自主成分来说,ARM多多少少受到约束。 第二波高潮,是龙芯盒子诞生,这是广大中国用户第一次用到龙芯产品,我觉得这个思路是好的,龙芯的基础生态是这个时候建立的,但也诱导龙芯走向深渊的一步。 第三波高潮,是买下mips专利,发展以及的龙芯mips+,也就是说,龙芯要在mips指令集上搞分裂主义,确立全面自主指令集的思路,从当时的角度看,这步走的也没错,只是把自己孤立了。 话题回到第二波高潮,龙芯盒子阶段,用户的反馈与龙芯人的期望,导致使龙芯错误的规划了自身发展路线,使龙芯决定瞄准桌面平台和强大的扩展能力。 这起因是龙芯在图形领域受到制约,市面上公开销售cs5536桥片不支持PCIE,就难以继续兼容扩展主流图形芯片。由于当时龙芯团队对行业认知能力和经验缺乏,所以他们能想到且能买到的只有XGI V2图形芯片,这款芯片的3D能力极弱,若想获得更强劲的图形性能,就要通过面临淘汰的AGP插槽扩展,且当时正处于蓝光大战,主流GPU已经开始支持硬解码,相比,龙芯盒子几乎就是什么都不能干。(其实当时龙芯能干的事情很多,只是对PC的执念太深了) 从此,龙芯迫于跟上主流PC市场,陷入了与自身不匹配的发展计划。起初是购买AMD的RS780+SB系列桥片,这是当时的主流产品,功能强大,且支持PCIE扩展。 拿到RS780以后,龙芯这时突然发现了自身巨大不足,即使给你功能强大的东西,你也用不好用不到,你的CPU本来就弱,生态本来就小,即使有了强大的功能,你也消化不了。何况你是mips构架,AMD原有的那些驱动你用不到,只能提供一些最基本的技术手册,驱动源代码。 AMD本身也是很开心的,结果龙芯采购量小的可怜,手把手教又教不好,AMD自己也不可能专门把资源分配给mips平台上的驱动开发(所以龙芯很长一段时间在rs780平台基础上搞不出可以公开叫卖的产品),因此RS780芯片只能停产。 龙芯团队好不容易能买到先进的桥片,并且花了大量资源试图吃透rs780,结果面临停产,虽然龙芯团队觉得自己被耍了,但肯定不愿意就此放弃。所在在北桥芯片方面,龙芯坚定了既然你停产,我就自己造。 从上面龙芯所有的历程可以看到。龙芯在整合能力不如网络公司,研发能力不如国外芯片巨头的情况下,走了一条不伦不类呃呃呃道路。 其实龙芯在最初扩展图形能力无望的情况下,其实完全可以用他们现有的东西,在2e盒子基础上继续简化,发展出家庭多功能电视盒,根本不用考虑桥片和图形能力不足,也不用求着AMD把自己带歪了。以电视为基础的家庭智能设备发展路线,可以远远领先当时的ARM。 FF6618: 历史过程中间发生了什么我不想深究,带头人的能力品行我不敢评判,但现实就是龙芯起个大早赶个晚集,最早大张旗鼓做国产CPU,现在被国内外对手越拉越远,一直找不到准确的定位:高性能?嵌入式?移动?桌面?服务器?除了自主可控的大招牌,实际哪样对用户有价值? 最近给我突出的感觉就是反差,花大钱开了空前宏大的发布会,喊了一堆口号,却发布了一个落后且与宣传性能不符的产品,最后说用户测性能就是别有用心! 不要用什么性能翻番为落后辩护,2020年一个28nm 4核 50W功耗 实测13分的CPU 就是落后 zhoufa27 SW4212 因为龙芯既不是学术研究也不是商业公司。老板脑子一片浆糊,这样的公司是没有前景的,员工早点跳槽最好。要做学术研究就需要自己从零开始搞指令集,学mips创始人那样,不要老想着蹭别人的生态。全世界大学、研究所、爱好者这样搞的多了去了,也搞的有声有色的。要做商业公司,就老老实实找准用户的需求,给用户提供好用的产品,不要一天到晚想着靠政策吃饭,还一边嫌弃客户不给自己钱搞研发,一边想方设法把质次价高的产品卖给客户。同样计算所出身的渣想,虽然天天被骂没核心技术,但是人家还是有两把刷子的,才能做到PC第一把交椅。而且他家的PC虽然性价比不高,但是售后是真好,对小白用户很友好。而且从IT业来看,渣想的贡献可比龙芯高多了
终于快赶上飞腾2019年的水平了 7zip 16.02版,测试整数性能,越高越好,3A5000 11735 飞腾FT-2000/4 10636,越高越好,3A5000也就比FT-2000/4高大约10% smallpt ,越小越好,飞腾63.68S,3A5000,64.53S,飞腾略快。 飞腾FT-2000/4是2019年9月就发布的产品,2.6G的正式产品的频率下的分数,官方宣布的有3.0G的产品,分数只会比3A5000更高。3A5000连发布都没有,2.5G目前也是官方实验室里的频率,实际量产品的稳定频率能到多少还是个问号。 然后,去年飞腾D2000/8采用中芯国际14nm工艺,八核都整出来了。龙芯还在PPT上的(没发布)的最新一代还在玩四核。功耗暂且不谈,毕竟没有数据。 高兴可以理解,毕竟上一代号称“最强桌面”的,被对手各种花式吊打,这会PPT上的产品总算追上了对手的上一代产品。LYLMNF FT2000+12 2021年12nm、2.5Ghz、四核的3A5000,比2019年16nm、2.6Ghz、四核的FT-2000/4性能高出一点点。 FF6618 KP92013 出来晚一年多,工艺更好,单核面积更大,功耗更高,核数更少,性能超出一点,只能说把4000的牛皮实现了 WorldCoin 就问一句,龙芯3A5000缓存多少M?粉丝和黑粉谁知道的来回答一下。 FF6618: 3A5000 CPU(s): 4 On-line CPU(s) list: 0-3 Thread(s) per core: 1 Core(s) per socket: 4 Socket(s): 1 NUMA node(s): 1 Model name: Loongson-3A5000 CPU max MHz: 2000.0000 CPU min MHz: 225.0000 BogoMIPS: 199.80 L1d cache: 64K L1i cache: 64K L2 cache: 256K L3 cache: 16384K NUMA node0 CPU(s): 0-3 3A4000 ====================== Architecture: mips64 Byte Order: Little Endian CPU(s): 4 On-line CPU(s) list: 0-3 Thread(s) per core: 1 Core(s) per socket: 4 Socket(s): 1 NUMA node(s): 1 Model name: Loongson-3A R4 (Loongson-3A4000) CPU MHz: 1500.00 BogoMIPS: 2990.15 L1d cache: 64K L1i cache: 64K L2 cache: 256K L3 cache: 2048K NUMA node0 CPU(s): 0-3
胡打自脸:老实是最大的捷径 老实是最大的捷径回复 1楼 2021-04-12 19:21 FF6618 胡大嘴谈老实,真是莫大讽刺 2楼 kyokusanagi98: 难道说这话也有错?你可以否定他的错误言论,但不能否定他的正确言论呀 2021-4-13 09:22回复 FF6618: 回复 kyokusanagi98 :这话没错,但他说我感觉很讽刺 2021-4-13 09:35回复 kyokusanagi98: 回复 FF6618 :其实老胡有的思想和言论还是很不错的,可能就是具体实施起来的时候有些差强人意罢了,所以遭到很多人的吐槽 2021-4-13 09:46回复 风之翼: 回复 kyokusanagi98 :别洗了,屡次被打脸还嘴硬 2021-4-13 09:56回复 最爱胖子加菲猫: 回复 kyokusanagi98 :典型的双标 爆炒大小萝卜丁 C8611 孔乙己要不得,不管黑猫白猫抓到老鼠就是好猫。 太液提督管叉叔 C8611 京胡拉得对,龙芯现在的窘势深刻的验证了这句话 最爱胖子加菲猫 SW4212 关于CPU的指令集和微架构这篇文章写的很详细 可以参考http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Fwww.elecfans.com%2Fd%2F1560875.html&urlrefer=376638c25d62bc772aaf54f16db65aab 中国芯时代 C8611 当年他购买MIPS专利授权的时候,社会广泛质疑,他说指令集就是没有技术含量的,不影响龙芯的自主可控,只是关乎生态问题,微架构才是核心技术 。后面其他国产CPU纷纷搞到了更好生态的ARM,X86等架构的授权,自己设计微架构的模式。 现在MIPS没了,他才想起来搞自主指令集 ,于指令集就是性命攸关的,否则“再大再漂亮都可能经不起风雨,甚至会不堪一击”。 不得不佩服申威,这么多年默默无闻的在自主指令集耕耘。同时期的龙芯,抱着MIPS的大腿,从MIPS R2一直跟随到MIPS R5,直到最近MIPS彻底没了,才想到要搞自主指令集。 陈英雄HERO 胡大嘴最不老实 龙芯和兆芯 主要是玩双标让人不爽 满月红色 龙芯没有上实体名单是因为它老实吗?
3a5k感觉不对劲啊。 感觉不对劲啊。回复 1楼 2021-04-13 00:20 来自Android客户端 灰太狼 D20009 貌似这样解释就合理了。回复 2楼 2021-04-13 00:24 来自Android客户端 -chipo- FT2000+12 3A5000 这一代 CPU 的迭代是 Tick。用的还是 GS464V 内核,只是改进了工艺。因此,性能提升主要来源于主频的提高。 收起回复 3楼 2021-04-13 07:08 来自Android客户端 ★☆追梦★☆: 为什么说还是GS464内核,是在准备新的内核吗2021-4-13 09:44回复 我也说一句 FF6618 KP92013 龙芯上代产品怎么样,大家心里其实都清楚,性能宣传有夸大,base应该在15。 我了解到5000确实已有2.5G版本,实测单核22+。前段时间的7Zip成绩也是2.5G跑出来的。除了优化指令译码,还有大cache带来的提升,确实明显进步。 台积电工艺流片,2.5G主频只能说正常偏下,为了不进实体清单,还是不要太高调。 收起回复 4楼 2021-04-13 07:11 来自Android客户端 FF6618: 主频从1.8提升到2.5,性能从接近15提升到22多点,基本按比例 2021-4-13 07:17回复 kyokusanagi98: 回复 FF6618 :5000的单核成绩你都已经拿到了吗,FF? 2021-4-13 09:24回复 FF6618: 回复 kyokusanagi98 :看到了 2021-4-13 09:34回复 ★☆追梦★☆: 预计能正常办公家用吗,比如超大杯的弹幕视频 2021-4-13 09:37回复 FF6618: 回复 ★☆追梦★☆ :用起来可以参考Core2 Q6600或酷睿一代i5 750那一代产品,差距12年左右。 眼里不揉啥: 2.2 25可以了啊,非得瞎吹,老实是最大的捷径,自己当屁话说的 2021-4-13 12:09回复 😚灰太狼😜: 回复 FF6618 :你之前爆料过4000的分数,这回5000可能没机会了。不知道会是谁能爆料。 2021-4-13 14:33回复 FF6618: 回复 😚灰太狼😜 :已经把龙芯排除出本系统采购目录,当然不用再测它了,但整机厂家送给我看还是可以看看的
有人发了龙芯飞腾兆芯几家的厂家跑分 原作者@liang24100722,发在那边被人删了,我帮忙转过来风之翼 D20009 这帮人,觉得一点不利于他们的消息都想掩盖,其实就这图里龙芯的性能,在我看来还有水分呢!实际上可能更差劲! 收起回复 3楼 2021-05-08 17:38 来自Android客户端中国芯时代: FF6618发了厂家的分数,他们说别人造谣。结果后面其他的测试者都证明了FF6618发的数据没有问题。 FF6618 KP92013 2019年那个厂家,也就是测3A4000样片1.6G 12分的那个,前几天测2.5G 3A5000 22分 收起回复 5楼 2021-05-08 19:53 来自Android客户端风之翼: 这个5000的跑分是不是特殊优化了?不然性能提升80%+?架构不变IPC能提升17%?虽然提升后的性能还是不怎么样,但依然值得怀疑!2021-5-8 22:36回复FF6618: 回复 风之翼 :主要是因为一年多后跑spec分向量指令用上了,还有5000有16M的大缓存。其实前几天用7zip算过,相对4000确实只是一个提频。 8200/2*2.5=102502021-5-8 23:21回复风之翼: 回复 FF6618 :怪不得2021-5-9 06:41回复hcdpz: 回复 风之翼 :龙芯5000的操作系统内核,编译器,各种基础库,都没有开源版本,都是龙芯自己捣鼓的,就像AMD的aocc一样,龙芯的gcc也是专门为5000打造的,它跑的分数,等于别家用开源gcc再加上专门优化后的结果。如果拿这个分数和别家在开源主线gcc编译情况的跑分比,显然龙芯占了大便宜。2021-5-9 22:30回复风之翼: 回复 hcdpz :原来如此,作弊一条龙啊!2021-5-10 06:35回复锕铟锶钽: 回复 hcdpz :确实,龙芯比兆芯和飞腾差远了,还得自己优化GCC。兆芯只能直接用Intel编译器,飞腾只能直接用开源的GCC编译器,无法发挥出全部的性能优势。2021-5-11 08:40回复CN: 回复 锕铟锶钽 :这几无测试成绩你认可?我的兆芯7Z测试不认可,你的双标不错。2021-5-11 08:57回复锕铟锶钽: 回复 CN :我在这说相声呢,你看出来吗?2021-5-11 09:03回复太液提督管叉叔: 回复 锕铟锶钽 :只有这样睿智的ID才看得出所有的兆芯跑分只能用ICC,用gcc都编译不通过!
处理器指令集,不是一本武功秘籍 处理器的指令集也经常被人误会是武功秘籍;以为有了指令集就能笑傲处理器芯片江湖。 其实作为一个处理器芯片,能否笑傲江湖,和指令集的关系不那么大。 与武林秘籍不同的是,任何一种CPU的指令集全部是公开的。 所有技术人员都能看到,不论是行业大牛还是入行小白,均可一睹芳容。 获取CPU的指令集,不需要主角光环;不需要掉悬崖,进山洞,甚至不需要高人指点。 上网就能找到,如果找不到,说明这个指令集用的人不多。 那如果找不到,怎么办? 找不到也不要紧,软件工程师直接反汇编一下,就能完全看到运行在这个CPU的每条汇编的二进制码,可以得到这个CPU采用的每条详细指令集。 没有任何的保密需要。 也保密不了。 回复 1楼 2021-05-14 23:28 hcdpz 指令集是公开的,但是指令集本身是有主之地。 虽然公开,但是用这个指令集来设计商用CPU,要交钱,这个叫做指令集授权,我国很多做CPU的公司就获得了指令集授权,从而光明正大的使用这些指令集设计CPU。 有一些不用指令集授权,例如RISC-V,而这也开启了一个先河,就是指令集开源。 所以世界上有两种指令集,私有指令集和开源指令集。 私有指令集,就是你能够知道指令集所有细节,但是不能设计基于此指令集的商用处理器。 开源指令集,就是你能够知道指令集所有细节,但也可以设计基于此指令集的商用处理器。 前者代表如ARM,后者代表如RISC-V。 所以看起来,知道指令集细节没有什么用。 所有指令集都有办法获取细节。 关键是否允许所有人基于此指令集设计相应的商用处理器。 随着risc-v的开源,很多日子过得不如意的指令集也选择了开源,如mips power等都搞了开源联盟,唯一的缺点就是搞得太晚了。 还有一些不如意的指令集没有选择开源,是因为已经死掉了,如sparc alpha等。 这些指令集变成了历史的一部分。 如果指令这个东西不是“武功秘籍”,那是什么? 是硬件架构和软件生态之间的一座桥。 桥的一头是各种CPU处理器微结构设计,桥的另一头是软件及生态。 这个换成“房产领域”,叫做小区及其配套。河的一边是一个新建小区(处理器),而河的另一边是是一个商超,地铁,医院等综合配套(软件及生态)。 现在有一条河将二者隔离开。 而指令集就是连接小区和配套之间的那座桥。 使用某个指令集,就是要复用这些配套的基础设施(软件生态),就类似开发一个新盘,能有好的配套就会被疯狂抢购。 否则没有好的配套,房子就无人问津。 开发建筑容易,而配套却是很长时间的积累。 说这么多,硬核高科技的处理器和卖房子也区别不大。 一个服务器处理器跑分再厉害,没有各种生产力工具和EDA工具支持,也很难被服务器厂商选用。 一个手机处理器跑分再厉害,如果装不了APP和玩各种游戏,也少有用户来买。 买房子,是地段和配套。 处理器,除了性能,功耗,价格。 软件和生态则是一个更重要的评价维度; 根据同一个指令集,但是设计出来的处理器却是千差万别。 可以设计的很简洁,也可以很复杂。 包括:通常一个处理器的设计包括,取指令,译码,执行,写回,访问存储等等,这些都是每个处理器都有的部分。根据对处理器的应用需求不同,一个处理器的架构设计千差万别。 1、流水线的级数:一般级数越多,在同一个制程下,处理器可以运行的频率越高。高性能处理器的流水线可以到十几级,例如玄铁910就有12级流水线。 2、并行发射宽度:并行发射的宽度越宽,则同时可以参与计算的单元就越多,计算的效率就会越高,但是如果指令之间存在依赖关系,那么多余的资源就闲着用不上,只能串行执行。比如,即使有两路逻辑运算单元,如果下一次的计算需要用到上一条指令的结果,也只能串行运行; 3、cache的设计:抛开组相联、全相连等等那些概念不谈,cache就是越大,对于处理器的IO操作越有利,LOAD指令越省周期。正常的一个处理器核,CACHE占用的面积比处理器的那些逻辑的面积还要大,CACHE的就是能够缓存外部存储区的内容;同样数据和指令的获取是否需要CACHE需要根据设计设计。 4、MMU的设计:如果支持OS,那么MMU就是一个省不了的单元,需要把虚拟地址转换成物理地址。 5、多核的架构:一个核能力有限,就堆核来搞,这就容易出现一核有难,八核围观的现象,如何把任务分配到多个核上,让所有核都动起来,这是多核设计的一个关键之处。 上面说了这么多处理器设计方面,和指令集相关的不多。任何一个处理器架构都是需要考虑这些设计方面,和哪种指令集关系不大; 如果我们来看待RISC指令集的时候,我们就会发现,他们之间也是同宗同源 一个通用的RISC的指令,通常指令通常包括下面几种: 算数运算:加减乘除; 逻辑运算:与或非,左移右移; 跳转指令:实现程序的循环和跳转; 比较指令:大于,小于,等于; 内存读写:LOAD、STORE; 特殊寄存器操作:读写特殊寄存器; 除了通用指令之外,还有特殊指令,例如浮点指令,向量指令,特殊定制指令等等 下面是三种指令集为例,是不是看起来很相似? 特别是MIPS和RISC-V指令集相似程度就更高了,像是兄弟。 以这三种指令集为例,编译后,都是32bit的0/1的二进制码; CPU设计就是根据这些0或者1进行译码和运行,得到预期的结果。 不论多高级的软件,最终编译出来,就是这一系列0和1 的二进制码的组合; 软件工程师的工作,则是把写好高级语言,翻译成“0”和“1”。 指令集作为软件和硬件的接口。 这些接口就体现在这些0或者1之间。 一种沟通软件和硬件的编码方式。 “有效沟通”是衡量一个工程师能力的方面之一。 而指令集就是软件和处理器硬件核心的沟通方式,没有之一; 天下武功出少林。 天下的RISC的指令集也是极其类似, 指令集同宗同源,但是又不断与时俱进; 如果一个大侠定义了一套武功(指令集),降龙十七掌,这十七掌有十七个招式,就是加,减,乘,除,左移,右移等等 实际行走江湖时,很多时候,一招是解决不了大的boss,这个时候就需要用到前面的十七招组合,才能最大限度的提升掌法的威力; 大侠就给定制一项新的招式(指令),降龙第十八掌,叫做“亢龙有悔” 这个深得指令集设计的真髓。 如果不定义第十八掌“亢龙有悔”,则前面“十七掌”需要运行17个周期。 现在我们定义了一条新的指令“亢龙有悔”。一个周期就解决问题。效率提升了17倍。 电影《苏乞儿》中,周星驰扮演的主人公苏乞儿最后一掌“亢龙有悔”解决掉大boss,悟到了第十八掌是前十七掌的组合。苏乞儿通过这些基本招式的组合成额外的一招,提升了掌法的威力,是我国古代优秀的指令集设计者。 但是,作为CPU设计来说,增加这一条指令也是有代价的,代价就是增加了更多的晶体管,造成了面积、成本及功耗增加。 应用需求推动指令集的升级和扩展是指令集发展中最常见的扩展。 例如为了加速AES加密的效率;ARMv8 推出了 cryptographic extention,不但是AES,其他每种加密算法都有相应的扩展指令;X86同样也做了类似的事情:做了AES-NI指令; 目前 AI比较火,所以ARM V9 在ARM V8的基础上添加了一些AI的加速指令,虽然细节未知,通过SIMD的指令扩展,应该会有类似矩阵乘法加速指令。intel AVX512也做了类似的事情,支持AI的加速。 这些指令是有助于CPU来有效的应对AI的应用挑战,但还是被很多体系结构领域的大神认为是“鸡肋”,这个就是见人见智的事情了。 新的指令能否加速AI的应用是有疑问的。 但新的指令带了更多开销却毋庸置疑,这些额外的扩展指令会额外增加很多的晶体管,也就是会增加面积,成本,功耗。 而这些额外增加的晶体管在很多常用场景下并不发挥作用,代价增加还可能不带来性能的增加因为用不上。 需要解决新的问题,就需要新的指令的出现。这个就是新的指令的由来。 从这个意义上说,目前的好多AI专用处理器,都是自己定义了一套适合AI处理的指令集,例如,矩阵乘,卷积等操作。 指令集不但是同源的,而且是不断发展的。 处理器面对的场景越来越多,新的指令也就是层出不穷。 原有指令固然需要继续兼容,新推出的也不一定得到广泛的支持;对于同一个指令集,一个处理器也不需要支持全部完备的指令集,而是根据需要选择来支持; 指令集的发展从来没有结束,也没有尽头。 处理器想要更高效,就需要不断添加新的指令来解决新的问题。 新的指令的支持带来了新的面积,功耗,成本,软件等代价。 而处理器设计本身,就是 trade off 的艺术。 效率和开销之间的平衡。 这个就是宿命。 和指令集相关又无关的宿命。 而如何打破这些宿命。 则需要处理器设计工程师自身的能力和智慧。 艮其身 指令集说土一点,就是方言,,有些人说英文,有些人说普通话, 有些人说上海话,有些人说闽南话,, 说的人多少,代表生态或市场,势力,,, 这种方言势力是历史的产物,需要时间与市场培养,,, 有些人认为可以创造个世界语,全部通吃,拿这个当优势,,, 结果是只能成为小众语言,或没了影子了,, 还有些人说,自己可以说三四种语言,有优势,各种圈都吃得开,哈哈。 拿这种极端优势,当成绝对的优势, 以为这种能弄成新的方言区,根本就是说笑话。 回复 8楼 2021-05-15 09:30 FF6618 如果把指令集当做语言比喻,那指令集手册可以算作词典。如果一门语言,连词典都没出的时候,就敢吹自己创造了多少新词(但谁也不知道具体是啥)。刚刚出了一本基础词典,没有第二家用时,就敢吹自己要成为第三语言区,这不是搞笑么?
MIPS基础架构的第5版(“R5”)包含了重要的功能,包括虚拟化simd MIPS基础架构的第5版(“R5”)包含了重要的功能,包括虚拟化和SIMD(单指令多数据)模块。 亮点 基于多年开发的MIPS体系结构的主要版本,包括下一代基于MIPS的产品的重要功能。 MIPS SIMD Architecture (MSA)架构模块为广泛的应用提供了更多的计算能力。 Scalable Virtualization (VZ)可扩展虚拟化模块为从小型微控制器到高端企业的一系列应用提供安全的硬件虚拟化。 Enhanced Virtual Addressing (EVA) 增强型虚拟寻址技术为大型现代工作负载扩展了可用内存空间。 流行的多线程和DSP数字信号处理器扩展现在作为模块集成在基本的微处理器体系结构中。回复 1楼 -chipo- FT2000+12 Release 5 ("R5") of the se architecture incorporates important functionality including virtualization and SIMD (Single Instruction Multiple Data) modules. Highlights Major release of the MIPS architecture-based on years of development-includes significant functionality for next-generation MIPS-Based™ products MIPS SIMD architecture (MSA) module provides more computational capability for a wide range of applications Scalable Virtualization (VZ) module provides secure hardware virtualization across a range of applications from tiny microcontrollers to high-end enterprise Enhanced Virtual Addressing (EVA) technology extends available memory space for large modern workloads Popular multi-threading and DSP extensions are now integrated as modules within the base MIPS architecture 回复 2楼 2020-02-04 17:13 -chipo- FT2000+12 曾经的是 基于MIPS32/64R3(共216条基础+311条DSP指令) ,通过MIPS架构的UD1进行扩展 基础扩展LoongEXT(共148条指令) 如定义乘除、多核同步、128位访存、CAM 虚拟机扩展LoongVM(共5条指令) 支持云计算需要的多操作养统快速切换 二进制翻译扩展LoongBT(共215条指令) 支持X86/ARM到LoonglSA的高效翻译 向量指令扩展LoongSIMD(共1014条指令) 128位(32位模式)及256位(64位模式)向量指令 最新的是 基于MIPS32/64 R5(共279条基础+159条DSP指令+900条SMID+37条加解密) 基础扩展LoongEXT(共186条指令) 如定义乘除、多核同步、128位访存、CAM 二进制翻译扩展LongBT(共157条指令) 支持X86/ARM到LoonglSA的高效翻译 向量指令扩展LoongSIMD(共477条指令) 128位(32位模式)及256位(64位模式)向量指令 好了 ,问题来了那些少掉了指令是被废弃了 还是 ???? 怎一个乱字了得。回复 3楼 2020-02-04 17:28 FF6618 KP92013 回顾一下3A2000发布时的文章 龙芯发布新一代四核CPU:自主指令集来了 观察者网 据快科技报道,今天,龙芯201新品发布暨合作伙伴大会在北京朗丽兹西山花园酒店举办,从会场刚刚传来最新消息,新一代四核处理器3A2000、3B2000正式发布。其实3B2000已经在6月底亮相,主要应用于双路8核以及四路16核国产服务器。而3A2000此次则是首次与外界见面,它对标的是Intel\AMD消费级产品。 除了自主架构GS464E,龙芯这次还有一个创举是自主指令系统LoongISA。LoongISA指令系统在MIPS64架构500多条指令基础上,在基础指令、虚拟机指令、面向X86和ARM的二进制翻译指令、向量指令四个方面增加了近1400条新指令。 龙芯技术人员称,耗时三年研发的GS464E综合技术水平达到了与Intel的第三代酷睿IvyBridge及AMD的Steamroller相当的水平,而微结构是CPU最核心技术,是决定性能、功耗、成本、安全性的最重要因素。 该人员还提到,龙芯自2010年市场转型以来取得一些成绩,也遇到一些问题,比如与其他处理器主频只差1倍,但性能差10倍这种问题,都是龙芯接下来要去努力改善的。 回复 4楼 FF6618 KP92013 看看铁流这篇文章中有没有误导? MIPS开源后龙芯获得主导MIPS生态建设的的历史机遇 铁流 发布时间:19-01-0513:23在一次对龙芯首席科学家胡伟武的采访中,有细心的网友发现,龙芯3A4000的展板上出现了MIPS64 R5的字样,因而有网友表示:龙芯偷偷去买了MIPS64授权,言论中还带一些嘲讽和酸味。 前不久,MIPS宣布开源,从现有的资料显示,MIPS这次开源主要是针对MIPS64 R6的,那么,龙芯的MIPS授权到底处于什么情况?是否还偷偷的买了MIPS64 R5?还需要再花钱买MIPS指令集授权么? 龙芯课题组成立于2001年,最初,胡伟武老师是非常欣赏Alpha的设计,是打算借鉴Alpha指令集搞一套自己的东西的。但胡伟武的师兄表示,现在龙芯课题组就十几个人,一间40平方米的实验室,仅仅是一个学术研究课题组而已,根本没有能力自己搞一套体系,因而就选择了当时仅次于X86的MIPS。 在早期学术研究阶段,龙芯是没有获得MIPS指令集授权的,不过,根据法律规定,少量用于科研和教学这类非商业活动一般是不属于专利侵权的范畴,全球很多大学在教学和做科研课题时候都有用MIPS的,且龙芯在很长一段时间一直没有商业化量产,更多是一款学术产品。因而在当时有没有MIPS授权都无所谓,并不能成为一些舆论攻击龙芯的黑点。之后,ST花3000万买下龙芯5年的生产代工权,每生产一片给龙芯2美元专利费,如果存在知识产权纠纷,ST也不可能这么做。 在2008年金融危机后,美国股市一泻千里,科技股更是成为重灾区,本身就和X86竞争中处于明显劣势的MIPS在无法从股市中吸血的情况下,已经难以为继,准备卖身。而在这个时候,龙芯果断选择出手,购买了MIPS指令集永久授权。由于时机挑的好,龙芯谈的条件非常优惠。 那么,为何不是把MIPS收购,而只是购买指令集永久授权呢? 主要是两个原因,第一是龙芯很穷,买不起,第二是这种收购不可能通过美国政府的审查。 由于MIPS逐渐边缘化,因而在谈判时候底气也有限,龙芯拿到的条件是相当优惠的。 比如ARM指令集授权很贵,但龙芯只花了很少很少的钱买MIPS指令集授权。 又比如ARM买指令集授权后,是不能把自己开发的IP核对外授权的,但龙芯可以对外授权自己的IP核。 还比如ARM指令集更新后需要另外花钱买,龙芯则不需要,MIPS64 R5/R6这些更新龙芯都能继续用,不需要再买。 而且在MIPS开源后,据小道消息披露,龙芯用MIPS,已经完全免费了。铁流也向Wave Computer的员工求证,得到的回复也是开源后龙芯全部免费用。 究其原因,铁流猜测和MIPS一直被边缘化有关。在Imagination持有MIPS时期,一直没有投入多少资源进行发展,导致在高性能CPU上已经被龙芯超越,且龙芯在MIPS的生态建设上贡献良多,已经开始引领MIPS的生态建设,像几个重要的API,以及MIPS的JAVA虚拟机、GS引擎等都是龙芯贡献的,而且龙芯还是实际的维护者,像MIPS的GCC编译器、Linux内核等,龙芯也贡献了大量的代码。 面对这样一个合作伙伴,MIPS自然会给出更加优厚的条件,龙芯和MIPS谈判的时候自然会有更多底牌和筹码,获取更加优惠的条件。加上以前龙芯在生态建设上的不懈努力,在MIPS开源之后,龙芯有望进一步加大MIPS生态的话语权,甚至是主导MIPS生态建设。 收起回复 6楼 中国芯时代: 德邦总管:如果真的龙芯引领MIPS生态,那么何必需要升级到MIPS R5呢?龙芯基于MIPS R3+自主扩展指令集不香吗?过个几年等MIPS R3里的专利都过期了,就真的相当于是自主指令集了。2020-2-4 19:16回复 CN: 回复 德邦总管 :R5指令多些用途,功能加强了,龙芯想用R5不行吗,龙芯也只用到R5,在MIPS指令用于桌面、服务器方面,你说下谁引领2020-2-7 11:04回复 中国芯时代: 回复 的撒旦法师法03 :跟随还差不多,跟在MIPS后面亦步亦趋的,自主扩展指令集为啥不香了呢?2020-2-7 16:10回复 CN: 回复 德邦总管 :兆芯跟随x86很香吧,龙芯的自主指令比采用的MIPS基本指令多很多,你感觉龙芯扩展的指令不香吗,2020-2-7 16:37回复 太液提督管叉叔: 回复 的撒旦法师法03 :根本不是这样。 MIPS基础指令279条,DSP指令159条,SIMD指令900条,37条加解密,5条虚拟化。 龙芯自己的扩展只有基础扩展186条(多核协同和CAM),二进制翻译157条,SIMD扩展477条。 龙芯的扩展指令集不止是少数,而且离开MIPS根本就不能构成一套指令2020-2-7 19:29回复 我也说一句 还有1条回复,点击查看 不要加班 C8611 回复 7楼 2020-02-04 20:50 来自Android客户端 FF6618 KP92013 铁流为啥被人骂,看看这篇文章中的问题: 1、ARM买指令集授权后,是不能把自己开发的IP核对外授权的,但龙芯可以对外授权自己的IP核。 贵州华芯通虽然没有做下去,但是证明拿到ARM指令集授权高通的IP核可以授权给华芯通。 2、MIPS64 R5/R6这些更新龙芯都能继续用,不需要再买。 没有确切的证据证明这一点,不过个人认为MIPS不会签这种协议的,这把自己公司未来技术都预售了。 3、在MIPS开源后,据小道消息披露,龙芯用MIPS,已经完全免费了。 事实是开源R6版本不影响之前版本的授权费用,每隔几年的授权费是免不了的,果然是小道消息。 4、在MIPS开源之后,龙芯有望进一步加大MIPS生态的话语权,甚至是主导MIPS生态建设。 MIPS开源的R6版本,和龙芯没啥关系,龙芯继续授权R5,原因是其自身扩展的指令在技术和生态上,还是不如R5,这点从4000相对3000在虚拟化、SIMD的提升上就能看出来。 5、最初,胡伟武老师是非常欣赏Alpha的设计,是打算借鉴Alpha指令集搞一套自己的东西的。 这一点,从来没有发现其它材料佐证,难道是老胡对铁流的面授机宜? 6、龙芯果断选择出手,购买了MIPS指令集永久授权。 永久授权但是要定期缴费,同时采用完全美国技术的该授权也要遵守美国政府出口管制,说不定哪天就不可抗力了 铁流文章中承认的情况: 把MIPS收购,这种收购不可能通过美国政府的审查。 这点说的没错,前几年有中资参与的基金收购原来的MIPS母公司,也需要把MIPS剥离。 收起回复 8楼 2020-02-04 21:12 贴吧用户_Q6yGKU7: 已经不看铁流大作了,那真是呕心力作(恶心腻作)2020-2-4 22:49回复 我也说一句 X37B FT2000/46 不愧是FF大神 FF6618 KP92013 看这句话: 而且在MIPS开源后,据小道消息披露,龙芯用MIPS,已经完全免费了。铁流也向Wave Computer的员工求证,得到的回复也是开源后龙芯全部免费用。 学学铁流的话术: 据小道消息(编瞎话自己没责任) 向Wave Computer的员工求证(哪个员工,反正不告诉你,记得以前还说向xx公司高管求证,好像谁都认识,其实啥也不能确认) 开源后龙芯全部免费用(就是不告诉你开源的R6,全世界都免费用,不多龙芯这一家,就不告诉你R2-R5还是不免费!这就叫选择性引导,一个全部 免费 真是敢说) 收起回复 10楼 2020-02-04 21:40 良民端好621811: 回复 FF6618 :舆论引导是这样的啦。我觉得马前卒的 睡前消息 这个节目挺好的。2020-2-4 22:37回复 -chipo-: 铁流的话,随意的很!2020-2-5 10:38回复 LYLMNF: 回复 骁龙2212 :把那个帖子挖出来看看呗2020-2-5 12:15回复 chipo-: 回复 LYLMNF :恐怕够呛了,贴吧里,2017年以前的帖子都没了。2020-2-5 12:49回复 mygo358: 回复 -chipo- :此人就是就是技术盲,他的话术都是引用朋友或我认识的行内人士,没有一个是他自己验证的。2020-2-22 15:00回复 我也说一句 还有6条回复,点击查看 kyokusanagi98 KP920s8 现在看见胡大嘴就恶心,天天还自嗨得很,尤其在台上演讲得时候好像觉得自己是乔布斯一样,说什么自建生态,你在建吗? 收起回复 12楼 2020-06-24 09:40 mygo358: 以前对他印象可以的,现在来看问题确实有,都是还是对搞科技的人抱有敬畏之心的。2020-6-24 14:32回复 披萨卷大葱666: 你终于认清某大嘴的真相了,问的好,他自建啥生态了,顶多把.net之类的迁移过来,这就成自建了?2020-6-24 15:43回复 我也说一句 小狗和小猴 羞耻汉芯1 真好奇这么多翻译指令龙芯想拿来干啥 回复 13楼 2020-06-24 15:16 来自Android客户端 FF6618 KP92013 前几天MIPS快破产的消息,引起一些人兴奋,其实: 1、MIPS倒了,龙芯会彻底失去在国际开源软件领域最后的一点生态,只能依靠自己那几号人搞移植,而龙芯封闭生态的质量和发展进度堪忧,这恐怕不是好事 2、因为美国政府的原因,龙芯不可能收购MIPS,这个MIPS会永远成为龙芯的鼻环被人牵着,而且是老美直接牵,不像arm还有缓冲 3、老胡在书中承认,每隔5年需要交授权费,这说明以前MIPS永久授权的说法是永久续费的意思 4、龙芯是增加了增加近1400条新指令,并不想承认MIPS的渊源,但我了解其自扩指令并不成功,涉及侵权并低效的X86和ARM二进制翻译指令且不说,虚拟机指令和向量指令龙芯本想自己搞,但效果不行,2019年KVM好不容易调通效率只有80%多。所以龙芯3A4000实际上又采纳了MIPSr5版本中的VZ和MSA,靠着这两种指令的加持,龙芯才有可能把speccpu“优化”提高,才有可能有实用的KVM虚拟机。这样来看,龙芯仍旧在吸纳MIPS技术,MIPS倒了,龙芯除了宣传上得意,又有何实际好处? 回复 14楼 2020-07-03 11:25 -chipo- FT2000+12 龙芯瞎折腾了一圈自主指令集的结果就是,Linux 的虚拟机不支持 3A3000。后来 3A4000 改回用 MIPS 官方的 R5 虚拟化方案。真是呵呵了! 想当初那么高调的宣传虚拟化技术,其实在 Loongnix 以外的操作系统上根本跑步起来。UOS 统信、Fedora 龙梦,都是从 3A4000 开始支持虚拟化的!因为上游支持啊! 收起回复 15楼 2020-07-03 20:53 来自Android客户端 中国芯时代: 还要当初更高调宣传过的二进制翻译技术,不管什么指令集他翻译一下就可以支持了。2020-7-3 20:56回复 太液提督管叉叔: 回复 德邦总管 :做一些针对性设计提高模拟效率是可能的。2020-7-4 14:47回复 我也说一句 -chipo- FT2000+12 真没想到,解决了 MIPS 却没解决芯联芯。 回复 16楼 2021-06-03 19:47 来自Android客户端 当家 KP920s8 龙芯在只有r4授权的情况下,实现了一些r5才有的功能,不知道是不是科技的进步 回复 17楼 2021-06-03 20:14 来自手机贴吧 FF6618 KP92013 3A4000实现了一些MIPS有专利的指令,才把虚拟机 向量搞利索,交授权费是应该的,这点如果龙芯拖欠是没道理的,毕竟现在3A4000还在销售。 3A5000短时间内改出来,从测试成绩上看与3A4000设计差不多,这点龙芯自己也承认(tick-tok里的tok) 龙芯想靠改指令集规避MIPS专利,从而不再交授权费, 但是芯连芯提出来,龙芯行为超出了授权范围,比如宣传可以随便改自由发展MIPS,完全自主新指令集等,3A5000也是MIPS发展而来, 自由发展MIPS是虚假宣传也没啥争议,这点授权协议白纸黑字写着没跑。 因此目前的问题焦点是:新的loongarch是否是从MIPS架构改造而来,用没用专利技术? 这点就比较罗生门了,问题已经提出需要龙芯有效回应,但是不是说所有的risc都差不多么?不是说100%效率运行MIPS么,那么结构不可能和MIPS不相似吧,这能洗白? 为了XC市场、上市发财,我估计最可能结果就是破财消灾,并发个两方能接受下得了台的声明,鱼死网破并不符合双方利益。 过几天芯联芯得钱签个不公开协议不再挑事,龙芯吧继续夸龙芯从胜利走向胜利,无惧专利流氓威胁云云
首页 1 2 下一页