hcdpz
hcdpz
关注数: 46
粉丝数: 135
发帖数: 4,723
关注贴吧数: 31
J10一战成名,扒一扒背后的芯片历史 当年J10通过验收进入量产的时候,美国对我们实行了芯片禁运,J10战机的CPU被卡脖子,断了粮。nudt微电子所临危受命,成功研制出国产替代CPU:FT50,这也正是“飞腾CPU”的诞生机缘。
高通胜诉!无需向Arm授权费 .周五,美国特拉华州联邦法院的陪审团裁定,高通没有违反与半导体行业关键参与者Arm之间关于芯片设计许可的协议条款。 Arm针对高通的诉讼以无效审判告终,陪审团做出了混合裁决,在一个关键问题上做出了有利于高通的裁决,称高通已对其中央处理器芯片进行了适当的授权。 经过两天九个多小时的审议,美国联邦法院的八人陪审团未能就高通在 2021 年以 14 亿美元收购的初创公司 Nuvia 是否违反了与 Arm 的许可条款的问题达成一致裁决。 但陪审团认定高通并未违反 Nuvia 与 Arm 的许可。陪审团还发现,高通使用 Nuvia 技术生产的芯片是高通进军个人电脑市场的核心,而这些芯片是根据高通与 Arm 达成的协议而获得适当授权的,这为高通继续销售这些芯片扫清了道路。 高通在一份声明中表示:“陪审团证明了高通的创新权利,并确认本案涉及的所有高通产品均受到高通与 Arm 签订的合同的保护。” 这场法律对峙源于高通在2021年以14亿美元收购初创公司Nuvia,其中包括了与Arm现有协议所涵盖的技术。 现在判决确认,高通将这项技术整合到其产品中并不需要支付额外的许可费。 高通是 Arm 最大的客户之一,也是长期合作伙伴,但随着两家公司在计算机处理器行业成为竞争对手,它们之间的矛盾也日益加深。 这场纠纷非常重要,因为世界上许多最大的科技公司都依赖 Arm 授权的芯片架构,并将其融入高通的产品中,从计算机到汽车。 判决公布后,Arm 股价在盘后交易中一度下跌 6.6%,随后回升至较早前收盘价 132.15 美元下跌约 1.9%。高通股价在盘后交易中上涨约 2%。
飞腾 D3000工信部四院测试成绩 中国电子技术标准化研究院对D3000进行了性能测试,结果如下:
D3000畅玩3A大作--飞腾“九译”首秀 飞腾 最新CPU: D3000 ,畅玩3A大作游戏《艾尔登法环》 。 基于飞腾自研的 二进制翻译 工具 “九译” ,流畅运行X86版本的游戏。 这也是 “九译”在公众视野的首秀。 视频链接 :http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.bilibili.com%2Fvideo%2FBV1Y6HseuE26%2F&urlrefer=a74e611a8d53b481cb6874a034a1ce74
飞腾D3000跑黑神话悟空! 【飞腾D3000国产ARM平台跑国产3A大作!黑神话悟空运行实测!-哔哩哔哩】 https://b23.tv/7kAbU8thttp://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fb23.tv%2F7kAbU8t&urlrefer=3718ffe885958b97e09ee6776ae47a3d
OpenBenchmarking : D3000.Vs.3a6000 数据来源:OpenBenchmarking 原始链接: http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fopenbenchmarking.org%2Fresult%2F2407232-NE-2407040NE22%26rmm%3DARMv8%2BCortex-A72%252CRockchip%2BARMv8%2BCortex-A76%252CRK3588%252CRK3566%252Cjh7110%252CBCM2837%252CE2000Q%252Cth1520%252Cbcm2711%252Ca311d%252Cs905d3%252Cs5p6818%252Crtd1395%252CH6%252CH616%252CRK3568%252Csunrise%2Bx3%252Cbcm2&urlrefer=3263b51e221bd19e9c4ee01e45e2acc4
电信24年集采,国产CPU占比超67.5% 创历史新高! C114 来自中国电信官网消息,中国电信服务器(2024-2025年)集中采购项目正式启动。公告显示,本次集采项目共13个标包,预估采购量为15.6万台。 值得一提的是,经C114简单计算,G系列,也就是国产化系列数量达到10.53万台,占比达到67.5%。这是一个再创新高的数字,也是一个里程碑式的数字,国产化率突破半数大关,并且远超50%。 2020年,电信采购近20%的国产化服务器。在2021年的集采中,将国产化比例提到26.7%。在2023年的AI服务器集采中,国产化的比例接近50%。 本次集采国产占比达到67.5%。 具体来看,本次集采的国产服务器。国产ARM架构是主力,如果不算标包8混合服务器的数量,占比接近50%,目前的主要解决方案厂商包括鲲鹏、飞腾等;其次是“国产”X86(海光),占比8.7%,如果算上混合服务器的数量,应该能超过10%。 整体而言,国产ARM和“国产”X86的占比超过66%。 可能是为了进一步扶持国内产业生态,此次中国电信将LoongArch架构、永丰架构(兆芯)、SW架构(申威)的方案单独分配标包,明确份额。虽然采购量与ARM以及C86有数量级差距,但也体现了中国电信培养更具韧性供应链的决心
虫芯爆出致命bug,虫粉急了 那个“哇啦哇啦”乱叫的家伙。护主心切,胡说八道噶黑竞争对手。 pcie问题是张冠李戴,S5000C根本没这问题。至于造谣128核当16核用就是拿厂商当傻子了,S5000C本来就有16核版本,真有这个问题直接换16核不就行了? 至于所谓LLC同步有问题也是瞎扯,根本不存在。最多就是因为跨DIE,延迟会大一些带宽受限,性能会受影响。但根本不是虫芯这种完全无法稳定工作(对服务器是致命的)BUG。 再说了虫芯的所谓服务器CPU,全是多DIE+小水管互联的结构,跨DIE延迟、带宽只会比飞腾更差!
中科曙光董事长被立案 曙光董事长 李国杰,被证监会立案
飞腾862与A77核心IPC对比 按geekbench成绩算了下所谓IPC: 单核总成绩IPC, 飞腾FTC862 比 A77高了8.67%。 Navigation,Object Remover 两个子项,飞腾862比A77高出了近40%。 差异如此之大,隔壁硬要做睁眼瞎,也是没谁了
飞腾D3000,性能涨三倍 飞腾D3000,性能涨三倍
打死不放SPEC17rate1的原因
3a6000实际不到31:扒一扒虫芯的定向优 虫芯最近放出了些侥幸逃脱制裁的3a6000样片,还把spec06所谓IPC吹到了十分夸张的17.2分。 著名的龙吹 隔壁的G吧 ,更是喊出了“强到没朋友”的胡话。 龙芯20年来,一贯靠所谓编译优化,欺骗观众。 当年的龙芯2号,实测性能太差,无法通过评审。只好找软件所搞所谓编译优化,spec2000居然从不到300分“优化”到了500分,才勉强通过验收。从此便患上了编译依赖,从3a2000、3000、到3a4000,全是靠打鸡血的编译器+peak值,才勉强跟上竞争对手使用开源主线gcc的测试成绩。 虫芯玩儿这种不公平对比的花招,玩儿了20年。前十几年做美国mips的舔狗,好歹还有开源主线的mips版gcc,只要下一个“公版”gcc,龙芯的底裤就会被揭穿;在舔MIPS这段时期,虫粪们的说词是:公版gcc对x86、arm有优化,对mips没有优化,所以用公版gcc不公平。 实际上各个架构的gcc,大家前端代码都一样,只有后端涉及指令描述和流水线描述的很少一部分代码是不同的。使都用公版gcc来对比spec,实在非常公平的。 到了虫芯5000,美爹MIPS被虫芯这个扫把星舔死了。虫芯只好拿mips套个皮,再从risc-V偷点东西揉进去,就有了所谓的longarch指令集。这种自娱自乐的自嗨玩具,gcc上游自然不会来适配,所以就不存在弄阿磕的“公版gcc”。这下虫芯可抓住机会了:反正没有公版gcc可以做对比,就可劲的往gcc里打鸡血。 弄出个5000,spec06 吹到了26.7分,号称IPC超过10分了。其实虫5000和4000微架构几乎完全一样,全靠提频和大了一倍的L3缓存提高成绩。 实际上,有专业的机构 使用开源主线的gcc代码,自己构建过 弄阿磕的gcc。在“公版”gcc 下,2.5G的虫5000,spec06int 只有20.4分,所谓IPC只有8分上下。跟胡教主在论文中不得不坦白的虫4000真实成绩14.9分, “IPC”基本一致。 而虫6000的鸡血分数 43.1,靠的是胡教主所谓编译补课,实际就是定向优化的鸡血打得更足了。在前两天的“业绩说明会”上,胡教主不得不坦白:虫芯的gcc专门针对spec2006做了优化。翻译成人话就是,龙芯的gcc已经为spec06打满了鸡血。而针对spec17的鸡血,则是“还在开展中”,也就是隔壁 常说的 “还没优化好”。 按隔壁那个G吧的测试,使用和虫芯5000相同的编译器,虫芯6000只有40.1。 虫芯5000在相同的编译环境下,也是那个G吧测得出 26.6分。 而虫5000在使用公版代码的gcc下,成绩是 20.4。 所以可以推算出 :虫芯在公版代码构建的gcc下,成绩只有 20.4*40.1/26.6=30.75分。 所谓IPC只有不到 12.3分而已。 spec17 单线程性能,那个G吧死活只肯放出 speed成绩。 原因很简单,spec17 的speed允许使用omp多线程,即使设置thread为1,鸡贼的虫芯gcc也可以偷偷的使用自动并行技术,把本来单线程的任务变成多线程执行,大幅提高跑分。 而spec rate 测试,则完全禁用多线程运行。这也是为何 专业的CPU测试都是使用spec17 rate=1 成绩,来反映CPU真实的单线程性能。在spec本身禁用多线程运行的情况下,虫芯的鸡血编译无法作弊, 跑出的成绩会将虫芯的底裤扒光。这就是隔壁那个G吧,即使在被人不断逼问下,也不敢放出spec17 的rate 1成绩的真实原因。 同时,因为spec06没专门限制多线程运行,speed和rate的区别仅仅是同时运行的测试份数不同。所以虫芯的鸡血gcc可以肆无忌惮的用多线程跑speed测试,然后瞒天过海,宣称自己单线程性能如何如何牛逼。实际这些分数就是个作弊的虚假成绩而已。
网信办官微:查处新铁流等典型案例 长期以来某芯收买的水军,以铁流,新铁流,铁君等用户名,长篇累牍造谣,污蔑竞争对手,手段卑鄙,性质恶劣。此次国家网信办的清朗行动,重拳出击,打击清扫此类渣滓,大快人心!
虫芯工具链spec06定向优化,又添证据…… 上次,知乎大V测虫芯,证实了虫芯的系统和工具链是面向spec06跑分定向优化过的: https://tieba.baidu.com/p/8374090685?pid=147435036788&cid=0#147435036788 在隔壁歪屁股王 G秃的野鸡测试中,虫芯5000在官方宣布退休多年的spec06中成绩大幅领先。 然鹅,业界通用反映单线程性能的 现役benchmark: SPEC2017 int rate 1成绩,虫芯却还不如发布好几年的FT2000/4 在 2.6G下的成绩。 https://tieba.baidu.com/p/8418497580 以上实事足以反映虫芯的所谓的跑分,尤其早被官方下架的spec06 跑分,都是定向优化的结果;甚至连新一点的现役通用测试spec17,虫芯的优化都不甚给力,确实是定向得不能再定向了。
简评隔壁的所谓“spec测试” 隔壁的G吧,最近有搞了一堆所谓“测试”,引得隔壁的井蛙、虫粪们好一阵兴奋的蠕动,有不少都直接高潮了。 这次隔壁G吧,好不容易加上了spec17的测试,但细心的观众很容易发现这些超算 奇怪的地方。 虫芯3A5000的测试 ,有speed 1也有speed 4,还有rate 4。可偏偏唯独没有: 大家普遍用来衡量单线程性能的rate 1测试。 下面介绍一下背景知识: spec17与spec06不同,spec06的speed就是rate=1时的测试;而spec17的speed和rate完全不同,speed测试允许使用OpenMP进行多线程加速,即使测试时设置thread=1,一些机智(鸡贼)的编译器,一些专门优化后的OpenMP库,还是可以“偷偷的”使用多线程运行。所以包括anandtech在内各测试机构测试单线程性能,已及各个cpu研发机构展示核心性能,使用spec17都是以 rate 1的成绩作为衡量处理器单线程性能的标准。 下面我们再来看看,隔壁G吧测试虫芯3a5000,spec17 int的结果:spec17 int rate 1 隔壁G吧是特地没测(没敢放),图中 的rate1 2.97分的结果是知乎“军民团结如一人”测得的。 每个子题结果则是根据肖俊华老师的spec17 rate1 peak值按比例计算得到。 可看到:speed 测试 所谓单线程"Thread=1" 和 4线程的结果差距很小,多核效率仅28%。 而:rate测试,rate 1和 rate 4,结果的差异就很正常,多核效率则达到了虫芯罕见的 87%。 为啥说罕见?虫芯3a5000的spec06,按隔壁G吧的测试 单核26.5和多核81.2,多核效率约76%,显著低于spec17 rate的多核效率。而同样是spec06,飞腾2000/4的多核效率是61.1/(17.2*4)=88.8%即使核心更多的D2000,多核效率也到了约82%。 然鹅,诡异的是 :虫芯spec06的多核效率明显较低,spec17 rate的多核效率确大幅增加变得十分正常!? 加之据我了解,某国产OS长沙曾经使用自己构建的编译器和系统,测试过3a5000,其spec06 int成绩仅20分出头。 我们有理由怀疑:虫芯的编译器和库(都是龙芯背地里捣鼓的)做了些“奇怪的”“优化”。把本应单线程运行的测试“变成了”多线程运行,通过这种机智的方式,获得了比较漂亮的分数。
知乎大V测虫芯,证实定向优化 知乎被授予专业勋章的IT大V,Glavo。测试虫芯5000除SPEC CPU外的大量benchmark。结论是不如同频N5105,IPC基本等于2、3代酷睿,或者是A75到A76之间。远不如虫芯宣传的性能。这个性能,基本和某国产操作系统厂商自测3a5000 ,spec06int 仅20.4分对上了。 唯一可能的解释就是,虫芯的所谓GCC实际是SPEC定向优化过的。名曰GCC实际相当于ICC之于Intel。
FT3000早已流片研发成功 几年前飞腾PPT有关于FT3000的规划,某些犯贱的虫芯粉丝又把它翻出来叫嚣“打脸”按图上规划,FT3000是在2021年左右完成研发。 实事上FT3000基本按时完成了研发,并成功运用在某高性能计算机上了。 依据公开的信息,证据如下:gfkd的roadmap上FT3000已经是实物照片状态,并可以看出流片时间大约在2020到2021年。之所以没有在飞腾公司商品化销售,据我了解是因为 成本、功耗等原因。 毕竟FT3000的主要目标是面向HPC的,有面积功耗都很高的SVE单元。
龙芯 又双叒 “国产最强了” 2023年4月发布 3D5000,spec2006 int rate 425分(毫无疑问用了龙芯专门优化的编译器和OS), 某来自美洲北方的“网友”,又双叒 高喊:龙芯有了国产最强服务器CPU。
华为2022年年度报告会 财联社APP #华为2022年年度报告会##持续更新#: 1、【华为:2022年收入达到6423亿元 净利润下滑68.7%至356亿元】#华为2022年研发费用1615亿##华为2022年收入6423亿元##华为2022年净利润356亿# 2、【华为徐直军:#2023年是华为生存发展的关键之年#】 3、【孟晚舟:华为数字能源和云计算业务初具规模】 4、【华为首度披露智能汽车业务收入 2022年营收21亿元】 5、【华为孟晚舟:华为持续开放鸿蒙、鲲鹏、昇腾、云服务等平台能力 生态伙伴已达4万多个】 6、【#华为回应盈利下滑#:研发投入在加大】 7、【华为轮值董事长徐直军:6G现在还只是个概念 何时到来还不清晰】 8、【华为徐直军:任何国产半导体企业都可以使用国产EDA工具设计14纳米以上的芯片】 9、【华为孟晚舟:我的个人案件已画上句号】#孟晚舟称个人案件已画上句号# 10、【#华为回应任正非重申不造车#:问界生态汽车商业模式不变】 11、【#华为5G手机何时回归#?徐直军:要等美国商务部许可】 12、【孟晚舟:华为不会改变持续吸引全球最顶尖人才的业务策略】 13、【孟晚舟:华为不把公司命运系于个人身上】 14、【徐直军:正在查处有些部门、个人滥用华为品牌 #严禁华为品牌作为汽车品牌#】 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fs.weibo.com%2Fweibo%3Fq%3D%2523%25E5%258D%258E%25E4%25B8%25BA2022%25E5%25B9%25B4%25E5%25B9%25B4%25E5%25BA%25A6%25E6%258A%25A5%25E5%2591%258A%25E4%25BC%259A%2523&urlrefer=d6be9f84ff049ac685a02754f4e58979
ARM超算的应用软件生态 总体而言,ARM 指令集兼容架构在 HPC 领域的应用生态是相对完备的,在重要的科学计算领域中无论是商业软件还是开源软件均有 ARM 指令集版本。 以国家超级计算长沙中心的天河新一代系统为例,已成功部署了 Lammps、Abinit、VASP、Gromacs、CP2K 等基础科研软件,WRF 等气象海洋软件,OpenFoam、NekTar++ 等制造仿真开源软件和 YH-ACT、YH-Aero、YH-SAS、YH-MAX 等天河生态工程计算软件,tensorflow、tensorflow-lite 等人工智能软件,opencv、graph500 等图计算软件,以及beagle、bookleaf、fftw、Laghos、numpy、atlas 等数学库,与基于 x86 架构的超算系统对科学计算应用的支持覆盖率相当。
所谓arm断供,是媒体的瞎炒作 ARM面向服务器的处理器核IP,分 N系列和 V系列。 N系列是面向数据中心云计算的通用处理器,更加注重 性能与 功耗与 面积的平衡。 V系列是面向高性能计算(超算)的处理器,更加偏向提高绝对性能,特别是浮点性能。 目前arm已经公开发布的 服务器核心 有:N1 、N2,V1 性能是 V1> N2 >N1;尤其是 浮点性能 V1已经高达 24分/Ghz(spec06 fp) 。 亚马逊的 gravition 2 芯片和 ampere G80 芯片 ,使用的是 N1核心。国内 中兴也研发了基于N1核心的芯片,主要用于基站。 亚马逊的gravition 3芯片,则使用了 V1核心。 倚天710是全球首款基于 N2核心的服务芯片。 NVIDIA 的Greece 芯片 据说是基于尚未公开发布的 V2 核心,浮点有消息说超过 30分/Ghz 由于V系列 超强的浮点性能,而arm的高性能服务器核心都是在美国奥斯汀设计,属于美国技术。美国政府禁止向中国出售可能用于超算的技术和产品。 所以 arm V系列核心“从一开始” 就是对中国任何机构、公司禁售的,这是业内众所周知的事情。 妓者总喜欢搞些耸人听闻的新闻。实事是 V系列早就对中国禁售,N系列一直都是对中国开放的。
啥叫定向优化,虫芯不打自招 虫芯5000的Unixbench分数奇高,完全与其性能不成比例。一看就是benchmark定向优化,虫粪不承认,那就来个实锤吧:
虫芯4000,spec 14.9分的出处 看隔壁无能狂怒的样子好可爱,我来添点实锤
统信 Vs 麒麟 :2022上半年财报 统信上半年: 营收6千多万; 亏损3亿多!
龙芯半年财报 龙芯中科发布半年度报告: 上半年实现营业收入为3.48亿元,同比 下降 38.24%; 净利润8876.33万元,同比下降1.55%; 报告期内,工控类芯片实现营业收入1.78亿元,同比增长69.92%; 信息化类芯片实现营业收入8424.55万元,同比 减少 77.75%。
FT1500 的性能 FT1500是飞腾基于sparc指令集的最后一款处理器。 曾经被使用在天河二号超算上。 隔壁那位一贯丧心病狂造谣的G吧,为了抹黑飞腾居然硬把Sparc T2的spec06算成8.5/G, 简直是无知又无耻。 下面列出 FT1500的官方成绩,以正视听。
龙芯中科2022一季度财报 现金流枯竭! 一季度为 负1.9亿元,负债经营。
龙芯5000的Spec17 peak成绩 图片来自。计算机学会的会议,中科院计算所的肖俊华老师演讲PPT,根据上下文,成绩为peak值。
飞腾大爆料 在今天的中国计算机学会青年精英研讨会上,飞腾总经理窦强博士,报告了飞腾最新情况,首次爆出飞腾处理器核的性能,微结构,乱序资源 ,以及risc-v核,和专用二进制翻译软件。
关于国产E级超算权威消息 国家超级计算重大专项专家组 组长:钱德沛院士 的报告——后E级计算:挑战和对策 比较详细的介绍了中国超算近年的发展情况,以及公开证实我国已经研制成功E级超算。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.bilibili.com%2Fvideo%2FBV1FR4y1P7Aj&urlrefer=d4558c5b41b98137ed21b135cceeb132
飞腾用户体验实录 【你敢信这是国产系统?这么丝滑了吗!!??原神最高画质走起!!-哔哩哔哩】 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fb23.tv%2Fnx8NPg2&urlrefer=943a229c1fdd1075586cceea410ceddf UP主是zf工作人员,也是国产cpu和操作系统的实际用户。 通过学习,up主使用国产飞腾cpu,不但日常工作不在话下。工作之余还可以玩玩大型安卓游戏“原神”, 也能通过二进制翻译流畅运行x86版 QQ和微信。
飞腾2000/4用户体验实录 【你敢信这是国产系统?这么丝滑了吗!!??原神最高画质走起!!-哔哩哔哩】 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fb23.tv%2Fnx8NPg2&urlrefer=943a229c1fdd1075586cceea410ceddf UP主是一位zf工作人员,在换用国产CPU+OS后,经过学习,把系统玩儿得很溜。 日常工作不在话下,还能玩儿安卓大型游戏“原神”, 以及通过二进制翻译流畅运行X86版的QQ、微信。
转贴:某芯2021年PC处理器的销售额跌了不少【国产cpu吧】_百度贴... 因为上市,信息公开了.其中的信息化类芯片,就是PC处理器,整个行业在大幅增长,某芯的销量却大幅减少. 某芯2021年PC处理器的销售额跌了不少【国产cpu吧】_百度贴吧 来自:http://tieba.baidu.com/p/7783679981?sharefrom=tieba
飞腾FT2000/4通过ExaGear转译运行x86测试 测试机器硬件:飞腾FT2000/4 ARM64架构4核CPU,8G内存,显卡AMD HD 8670 软件:银河麒麟v10sp1+eltechs版exagear+wine6.0.2+d3dx9 一、国际象棋跑分 设置线程超过2程序会死锁,故只测试单核和双核 (一)单核(二)双 核二、CPU-Z 虚拟CPU识别为至强Xeon三、茶壶跑分 (一)400x300小窗,帧数在190~260之间波动(二)1920x1080,稳定60帧
这就叫定向优化 G2狡辩一大堆, 实际原因很简单,因为 spec06 龙芯十几年来孜孜不倦的定向优化,打鸡血的水平相当牛皮。 smallpt和c-ray还不够热门,龙芯没空做定向优化,所以真实水平就暴露了。
飞腾CPU服务器首次入围中国移动、中国电信集采 《科创板日报》4日讯,《科创板日报》记者从飞腾公司获悉,其腾云S2500双路服务器日前已通过运营商测试,并且基于飞腾“腾云S2500”芯片的服务器入围了近期中国移动和中国电信的服务器集采项目。据公司相关人士介绍,这是飞腾公司首次进入运营商服务器领域,不过最终落地规模还需要看实际需求,“飞腾下一代服务器芯片产品将在性能、接口、IO等方面进行提升,适用不同场景对算力的需求”
飞腾FT2000/4试玩~暗黑破坏神2 【[国产CPU]飞腾FT2000/4测试~暗黑破坏神2[银河麒麟ExaGear]-哔哩哔哩】http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fb23.tv%2FOGImag4&urlrefer=ed047a0d3e29dc0b77bf0bacb9659124
隔壁一群自嗨蛙,把我逗笑了 jemalloc是最最最 常见的的优化手段,spec官网上公开的成绩都可以搜出一大把使用jemlloc的。 还在那儿瞎叫唤啥库可以作弊。 之前一口咬定别人的成绩是假的,现在又说 使用jemalloc 不干净,双标到了极致,龙芯tmd整个系统+库+编译器都是自己关门狂加激素弄出来的,按他们这个标准肯定是最脏的了。 不信, 拿开源主线的代码重新编译个系统和编译器,再跑跑分看,我敢保证被吹上天的3A5000不会超过20分。
包云岗老师的RISC-V 香山CPU成绩出来了 香山:是中科院计算所包云岗老师团队,开发的一个RISC-V 处理器。第一版香山的核心代号“雁西湖”,采用乱序执行、11级流水、6发射。采用28nm台积电工艺预计达到1.3Ghz主频,性能预估为7/Ghz(SEPC2006) 一月初香山流片回来,经过调试目前已经可以运行spec06测试。成绩是:最高稳定频率1Ghz,sepc2006整数5.97分.
ARM—PC崛起!销售占比达创纪录的9.5%! 变天了!x86架构最大对手崛起: 如今的你,会认真考虑入手一台配备ARM架构处理器的PC电脑吗? 这个问题放在两年前,恐怕多数人都会摇摇头。可是随着苹果AppleSilicon战略的执行,也就是抛弃以Intel为代表的x86平台,转向基于ARM的自研M系芯片,答案风向似乎开始调转了。实际上,ARMPC的成功不仅仅停留在M1系列处理器剪视频、修图等强大生产力表现上,也有销量佐证。 在MercuryResearch的2021年四季度PC统计中,基于ARM处理器PC在所有PC总出货销量中的占比达到了9.5%的新高,同比增加了61个百分点,环比增加1.2个百分点。 销量中的占比达到了9.5%的新高,同比增加了61个百分点,环比增加1.2个百分点。 尽管这其中有少量Chromebook,但机构强调,大部分贡献都来自苹果Mac。 事实上,高通做ARMPC比苹果更早,然而成绩欠佳。不过,在吸收了NUVIA团队后,高通表示将打造足以抗衡苹果的全自研笔记本处理器,2022年出样,明年商用。 未来的PC市场,有好戏看,不再是x86独霸的天下了。
包云岗教授科普:指令集与处理器 近日,网络上出现对RISC-V与开源处理器存在误读的文章,让一些读者产生困惑。本文将对处理器的指令集、微架构实现与开源模式等概念以及和RISC-V的联系等进行解读,希望能帮助广大读者更好地理解开源处理器。以下为几个要点: 指令集规范(Specification)和处理器实现(Implementation)是两个不同层次的概念,要区分开。指令集(ISA)是规范标准,往往用一本书或几张纸来记录描述,而处理器实现是基于指令集规范完成的源代码。RISC-V是一个指令集规范。 我们可以基于x86/ARM/ RISC-V指令集,进行处理器微架构设计和实现形成源代码,并通过流片最终形成芯片产品。其中指令集规范与处理器实现的知识产权是独立的,不能混为一谈。(详见第二、三节) "RISC-V是开源的"表示指令集规范是开源、开放和免费的(open and free),这与x86与ARM指令集有本质不同,但并不是指具体的处理器实现也都是开源免费的。 基于RISC-V指令集规范,既可以由开源社区来开发开源免费版的处理器实现(如Berkeley开发的Rocket核等),也可以有商业公司开发收费授权版的处理器实现(如国内平头哥玄铁910、芯来N200核与优矽渭河WH-32核等)。(详见第三节)
国产E级超算,已获官方证实
天河3的一点侧面消息 第三场特邀报告中,国防科技大学的唐滔老师进行了题为《天河超级计算机的异构编程模型与优化》的报告。唐老师对异构编程以及天河超算进行回顾,重点介绍了近期在最新一代天河系统上的异构编程和编译方面的工作,并对超算平台上编程和编译技术的发展进行展望。
纪念U
window版微信,ft麒麟的用户们早就自己搞定了 麒麟系统有一个所谓官方版微信,实际是网页版套壳。 还有麒麟+飞腾可以直接运行安卓版微信 wine+windows版微信 deep打包的wine+windows版微信(这个最好用)
基于飞腾,申威CPU,世界最强超算本年3月已问世 基于飞腾,申威CPU,世界最强超算本年3月已问世
HPCC2021 走漏了消息 著名的HPC 专业网站nextplatform,发布了中国两台E级超算的消息。中国超算系统中一直在发挥作用的自主CPU和自主加速器,目前已经得到加强, 使得中国在率先实现了两台E级超级计算机。 位于无锡的国家超级计算中心,将公布一些引人注目的消息。这些消息是:基于国产Sunway超级计算机的量子模拟结果。这个消息不仅因为计算结果,而且因为新机器的可能架构和庞大的规模而引人注目。当然,值得注意的不止这一点,因为美国和中国正在进行全球半导体军备竞赛,这改变了我们传统上比较全球超级计算能力的性质。我们一直在思考中国实现数据中心计算独立的漫长道路,HPC只是其中的一种工作负载。 长期以来,超级计算界已经习惯于在世界最强大系统的500强名单上公开结果,各国都在积极争夺霸主地位。然而,随着紧张局势达到顶峰,实体清单掩盖了国际竞争精神。我们可以期待中国对一些戏剧性的系统飞跃 保持缄默。包括该国已经在2021年突破了(真正的/LINPACK)exascale的障碍,事实上不只一台机器算力达到了E级。 我们得到来自某顶级权威(在匿名的情况下)的消息,2021年3月在神威 "Ocean lite "(海 光)系统上运行了LINPACK测试,该系统是目前Top500排名第四的“神威太湖之光”机器的后续产品。结果产生了1.3 exaflops 的峰值性能,在理想的35兆瓦功率下 ,有1.05E 的持续性能。 我们已经公布了我们所知道的关于“神威 海光”架构的一点信息,今年早些时候(以及现在,在没有经过验证的系统信息的情况下),我们的猜想是,这台新机器是芯片工艺微缩的结果,它的每个节点增加到了有2倍的计算单元从而获得了2倍的性能,通过加倍的节点数(当然还有其他工程),无锡江南计算所可以创造一个exascale系统。很明显,他们已经做到了。 江南计算所利用这4200万个处理器核的超算系统,正在量子模拟生产中进行持续的超大规模计算,我们今天通过年度超级计算大会(SC21)前的预览了解到这一点。太湖之光的后续产品能够运行一个可以在整个机器上并行化的量子模拟。这种模拟也是人工智能/ML训练和推理工作负载的好兆头,因为它突出了混合精度数学的广泛使用,包括16位浮点性能,据说有4.4 exaflops。 在不深入研究所有量子细节的情况下,无锡团队与清华大学和上海量子科学研究中心的合作者一起开发了基于张量的随机量子电路模拟器,该模拟器针对计算密度进行了优化,可以 "将谷歌 ‘悬铃木’的模拟采样时间从之前声称的1万年减少到304秒。" 这只是一个预览摘要,关于这个结果的细节并不多,但值得一提的是,在11月中旬发布详细介绍模拟的论文时,我们或许会发现什么。 同一权威机构证实,在中国进行的第二次exascale级别的Linpack测试结果,来自国防科技大学的天河三号。这个系统我们在2019年5月就已经预览过了。天河三号达到了与神威海光几乎相同的性能,峰值为1.3 exaflops,持续 性能超过exascale flops。我们还不知道天河三号的功率,但我们能够确认:这台机器是基于Phytium公司的飞腾系列处理器(实际是FT-3000), FT处理器基于Arm 指令集,天河三号的加速器名为“Matrix”。(为了清楚起见,飞腾有点像 Intel的服务器处理器"至强",它是Phytium公司的一个CPU品牌)。 这并不是一个新的架构。 2015年我们第一次看到Phytium的HPC野心时曾经分析过,新的飞腾处理器是对 "火星 "64核FT-2000/64架构的后续深挖。当时我们就认为 "火星 "处理器一直是为中国的超级计算机准备的。当然,飞腾也不得不与时俱进了。为天河超算增加真正 "动力 "的“Matrix”加速引擎,仍然基于我们在天河二号A(当时的另一台顶级超级计算机)中看到的Matrix 2000 DSP加速器的更新变体,它被称为Matrix-2000+加速器(实际是Matrix 3000)。天河二号A的研发人员花了很大的功夫来适配GPDSP加速器的软件堆栈。国防科技大学将把所有这些努力换成一个性能相当好的体系结构,尤其是在LINPACK测试性能上。 记得这个Phytium的出现和天河2A系统的Matrix 2000 DSP加速器的出现,是因为当时美国对中国超算机构的禁运而不能按计划使用英特尔至强Phi处理器。 可以看出,在这两个超大规模系统上,架构的变化不大:芯片元件和节点增加了一倍。这并不是要减少努力,但我们不怀疑会出现新的架构,因为另一个即将到来的消息--根据我们同一消息来源,一个中国的未来计划,旨在到2025年提供一个20 exaflops的超级计算机:消息来源在美国,但他了解中国国内的情况。 当我们在这个寒冷的国际政治气候中艰难行进时,有一点需要记住:也许我们再也不能指望以同样的方式对国家竞争力有一个清晰的、前500名超级计算机名单了。如果一直是美国竞争对手的中国在运行LINPACK,但不公开结果,那么这个几十年来一直是高性能计算进展象征的名单的有效性和国际重要性会发生什么变化?中国会失去什么?炫耀不是仅仅一个而是两个验证过的百亿亿次级系统,既能产生峰值也能产生持续的结果,难道不符合国家利益吗? 这里有一些微妙的东西需要考虑:美国橡树岭国家实验室即将推出的 "前沿 "超级计算机预计将以峰值1.5 exaflops和1.3个exaflops左右的预期持续性能首次亮相。也许中国已经决定悄悄地泄露它是真正的第一个研发成功E级超算的国家,而不必公布可能显示美国机器的性能数字稍好的基准测试结果。这只是一个值得思考的问题。 而且这里还有一个微妙的细节:我们的消息来源证实,中国的两个E级超算系统(世界上第一个)的LINPACK正式测试是在2021年3月。针对飞腾信息技术公司实体清单是什么时候出现的? 正好在2021年4月! 政治活动奇怪而混乱。但我们的消息来源证实,中国是第一个研制成功百亿亿次级超级计算机的国家,而且有两套这样的机器,基于两种不同的(但完全是中国本土的)架构。 在没有美国芯片的情况下,很明显,禁运将在短期内满足美国政府对中国利用美国技术促进其核项目发展的担忧。但从长远来看,这是中国加速芯片开发、以及晶圆厂建设的主要动力,也是半导体战争所需的所有引擎,即使尚未沸腾,也将继续酝酿。
安培 128核服务器CPU性能 anandtech对Ampere 最新的128核处理器进行了全面的测试。也对比了Ampere上一代80核处理器以及AMD和Intel的主力服务器CPU。以上是spec cpu 2017 rate测试,但rate=1,所以可以等于是单线程性能。 注意上图Ampere有两个型号的对比,分别是80核3.3Ghz的Q80-33,128核3Ghz的M128-30。 这两款CPU核心完全相同,都是arm公版的N1核,NOC也都是基于arm的CMN600,;区别除了核心数目,运行频率不同,最重要的一个区别是:M128的SLC这里也就是L3被阉割为Q80的一半,从32MB减小为16MB。 因此我们可以对比一下两款核心完全相同的CPU,在L3容量变化时所谓IPC的变化情况。由上图可以看到 3.3Ghz的Q80-33,spec17 int的所谓ipc是:5.20/3.3=1.57576。 而3Ghz的M128-30,spec17 int的所谓ipc是:4.39/3=1.46333。 由此可以得出: L3由16MB 增加到 32MB,都是N1核心, spec17 int 实测IPC增加了 7.68%。
分享贴子
分享贴子
美国要求台积电、三星 提交订单、销售等内部信息 集微网消息,美国正施压于芯片制造商如台积电和三星等,要求其提交库存、订单、销售等内部信息,此举将造成后者在与美国公司的价格谈判中处于不利地位。 据《韩国经济日报》报道,23日,美国商务部长吉娜·雷蒙多(Gina Raimondo)在白宫主办的全球半导体峰会上表示,政府需要更多关于芯片供应链的信息,以提高危机的透明度,并确定造成短缺的确切瓶颈。 雷蒙多在接受路透社采访时表示:“我们的工具箱里还有其他手段能够让他们向我们提供数据。我希望我们不会到这一步。但如果必须的话,我们会做到的。” 白宫给全球芯片制造商45天时间来回应这一自愿性的要求,让这些公司陷入了困境,因为有关销售、库存和客户的信息往往被视为公司机密。 三星电子、台积电等全球代工企业没有公开客户名单。 尽管这些跨国公司非常不愿意提供内部数据,但它们不太可能成功地回避这一要求,因为美国政府正在考虑采取法律措施。 有消息称,美国政府正在考虑使用《国防生产法》(DPA)来强制企业提交数据。该法案授权总统要求企业接受国防所需材料的合同,并对合同进行优先排序,还允许总统指定禁止囤积或哄抬价格的材料,迫使工业扩大基础资源的生产,并将原材料用于国防。 全球半导体业界,特别是美国以外的半导体企业担心,美国的信息要求可能会在很大程度上对美国企业有利。 韩国一位业内人士表示:“三星和台积电向美国政府提交的信息,有可能泄露给英特尔等美国企业。”
突发! 【孟晚舟即将回到祖国】新华社北京9月25日电 经中国政府不懈努力,当地时间9月24日,孟晚舟女士已经乘坐中国政府包机离开加拿大,即将回到祖国,并与家人团聚。
龙芯的鸡血白瞎了…… 先睹为快!国产CPU、能效性能基准工具 | CNCC2021 CNCC2021【计算性能&能效基准评测与优化】技术论坛将于【10月30号8:30-12:30】在深圳国际会展中心【CC204B】召开。 【六大CPU厂商、清华大学、中科院、上海交通大学、中国标准化研究院及中国电子技术标准化研究院,将从产、学、研不同角度共同为您分享性能基准工具的设计方法论及评测经验,以及两款工具将为中国计算产业带来的巨大价值】 计算性能基准评测与优化是提升系统能力的重要手段,一款好的基准评测工具可以为系统优化提供指引方向。但如何开发一款性能基准工具,并能够客观、公平评价不同计算平台的计算能力却是一个难题。基于此,国内处理器厂商、整机厂商、评测机构及学术机构共同投入研发,分别完成了相应的计算性能基准工具。计算性能基准工具重点考察处理器、内存子系统及编译器的能力,能效基准工具主要用来对服务器的性能功耗比进行考察。同时,在工具研发过程中形成了一套公平、合理、科学的Benchmark设计方法论,也基于开发的工具对众多主流计算平台进行了性能评估与分析。计算性能基准评测与优化体系的建立对国产计算产业的发展具有重要的牵引意义。
XC龙芯用户的心声 转自某群的图片,截图里都是XC真实用户,每个ID群昵称都有使用的计算机类型。可以说是反映了拿xc计算机作为生产力工具的实际用户的心声。
这个视频最生动的解释了啥叫:跑分定向优化 龙芯的G吧, 啊 、不对,龙芯吧的G吧,最近不断跑出些鸡血跑分,让自嗨众高潮不断。 当然 ,对龙芯不利的跑分G吧是不会露出来的,比如最新版麒麟v10下3a5000的跑分,龙芯G吧就以无法安装为由搪塞过去了。 龙芯的3a4000,龙芯呕心沥血定向优化了2年,终于勉强算圆上了当初吹的牛,这也证明了麒麟os龙芯版,库和编译器都是出自龙芯之手。当然,MIPS已经被龙芯抛弃了,之前的鸡血功夫算是白瞎了。 不过,定向优化的跑分好看,最多也就是宣传的时候占点便宜。机器真正到了用户手中,用户的感受到的性能才是决定处理器能否成功的根本。 B站的up主“半岛的风车”以前主要做龙芯的视频,也在视频中不断宣传龙芯,基本可以算是个龙粉了。 如今这期视频,他做了飞腾D2000的体验测试,也跑了一下分,他的Unix多核只跑了3800,还不如龙芯3a5000的4核跑分(飞腾官方~4900)。但是一通用下来,“半岛的风车”最后的结论却是:飞腾的软件体验比龙芯(3a5000)好太多! 这就是为啥,龙芯成天吹自己国产最强,到头来市占率却是 节节下滑,据某业内人士透露,目前龙芯市占几乎跌破20%,而且看趋势还在进一步下滑中。 因为,用户的眼睛是雪亮的。通过定向优化,跑分是好看了;可就算用户听信龙芯的宣传,一开始选择了龙芯,实际用下来,完全不是龙芯吹嘘的那样;所谓希望越大失望越大,龙芯的定向优化把跑分鸡得越高,用户实际体验后失望就越大、对龙芯的印象就越差。如今xc用户越来越多,龙芯的口碑自然也是一日不如一日,市占率光速下滑 当然就是顺理成章的事情了。 正所谓:天作孽犹可闵,自作孽不可活。 龙芯不断的跑分定向优化,恰恰是搬起石头砸到自己的脚上。
龙芯占,比不打自招 北京百分之百就是吹牛,各大部委飞腾占了大头。 莫非龙芯的北京不包括中央部委? 依然30%以上,好像很自豪的样子?
申威处理器最新进展 3231最大功耗100w,实际运行普通应用在60多不到70瓦的功耗。sw3231和2017年主流服务器cpu性能对比。sw即将完成的8核桌面芯片831831核421的对比基于第四代核心core4,正在研发的64核cpu 8A芯片,支持单核双线程(跟鲲鹏930的规划比较像)在研的8A芯片:sw6432与目前最新的3231性能对比E级超算的众核CPU,sw39000,单颗芯片双精度浮点峰值性能大于10T。正在芯片研发阶段的core4核心性能,12是模拟器分数,胡向东首席在报告中坦陈,实际芯片可能在10分多。sw第五代核心core5的研发计划胡向东首席科学家,比较实在,在此节谦虚说道达到core4已经可以到达10分,但还没有完成补课。总的感受,胡向东老师是个务实,实在人,sw的成绩说得都很谦虚,都是说距离世界先进水平还有相当大的距离。 sw面临的挑战也没有回避,都是直言坦陈。 相形之下,另一位胡首席就是一通天花乱坠,号称马上顶到天花板了……
飞腾CPU上运行x86架构的Windows程序 近日,大家一直期待的流行社交软件——微信(wine)正式登陆统信UOS arm平台应用商店。 这是统信团队通过deepin-wine技术迁移的首款arm应用,将进一步丰富arm应用生态。 deepin-wine是实现在统信UOS上运行x86架构的Windows程序的技术。 本次发布的微信(wine)就得益于统信团队在deepin-wine技术上的钻研与积累,使统信UOS具备跨平台运行应用的能力。当前上架的微信是32位版本,仅支持FT2000。 目前,飞腾FT2000处理器平台的统信UOS用户在应用商店中搜索“微信”即可进行安装使用。支持消息收发、文件收发、语音通话、视频通话等功能,流畅的操作体验与x86体验同样丝滑。
Box64 模拟器发布 Arm64 Linux 版本 Box64 模拟器的帮助下,在 ARM 设备上运行 x64 Linux 程序。想试试吗? Box86 是一个流行的 X86 模拟器,刚进行了一次巨大的升级。发布了 Box64,也就是对应的 ARM64 版本。 可能你还不了解这个模拟器,Box64_86 允许你在 ARM 系统上运行 32 或 64 位的 X86/64 Linux 程序。换句话说,它能让你在树莓派或者 树莓派替代品 上运行 Linux 桌面程序。 幸运的是,现在我们有 Box86 和 Box64 的支持,无论你的 ARM 系统是什么类型。 你可能听说过苹果的 Rosetta 2,它是一个翻译层,允许为老款 Mac(Intel X86 处理器)设计的应用程序在新的 M1(ARM 处理器)驱动的 Mac 上运行。Box64 与之类似,允许为 X86 设计的应用程序运行在 ARM Linux 设备上。 由于它的 Dynarec 模块,它能够做到这一点,同时又是 100% 开源的、免费的,而且速度惊人。它通过重新编译 ARM 程序来提升速度,这意味着和其他 ARM 原生应用一样快。 但是,即使 Box64 无法重新编译应用,它仍然可以使用即时模拟,也有令人印象深刻的结果。 许多树莓派用户很熟悉 Box86,这是一个大约一年前发布的类似程序。二者最大的区别是 Box86 只兼容 Arm32,而 Box64 只兼容 Arm64。 这就是 Box64,一个非常棒的兼容层,允许你在 ARM 电脑上运行 x86_64 应用。 如果你问我认为 Box64 怎么样,我会说这是一个绝对的游戏规则改变者。在难以置信的性能和巨大的潜力之间,这个兼容层肯定会在未来的 ARM 电脑中扮演一个重要角色。 如果你想知道它的工作原理,以及如何开始使用它,请查看其 GitHub 页面/github.com/ptitseb/box64。 就这样吧,现在你自己去潜入其中并测试吧。
1
下一页