hcdpz hcdpz
关注数: 46 粉丝数: 135 发帖数: 4,723 关注贴吧数: 31
高通胜诉!无需向Arm授权费 .周五,美国特拉华州联邦法院的陪审团裁定,高通没有违反与半导体行业关键参与者Arm之间关于芯片设计许可的协议条款。 Arm针对高通的诉讼以无效审判告终,陪审团做出了混合裁决,在一个关键问题上做出了有利于高通的裁决,称高通已对其中央处理器芯片进行了适当的授权。 经过两天九个多小时的审议,美国联邦法院的八人陪审团未能就高通在 2021 年以 14 亿美元收购的初创公司 Nuvia 是否违反了与 Arm 的许可条款的问题达成一致裁决。 但陪审团认定高通并未违反 Nuvia 与 Arm 的许可。陪审团还发现,高通使用 Nuvia 技术生产的芯片是高通进军个人电脑市场的核心,而这些芯片是根据高通与 Arm 达成的协议而获得适当授权的,这为高通继续销售这些芯片扫清了道路。 高通在一份声明中表示:“陪审团证明了高通的创新权利,并确认本案涉及的所有高通产品均受到高通与 Arm 签订的合同的保护。” 这场法律对峙源于高通在2021年以14亿美元收购初创公司Nuvia,其中包括了与Arm现有协议所涵盖的技术。 现在判决确认,高通将这项技术整合到其产品中并不需要支付额外的许可费。 高通是 Arm 最大的客户之一,也是长期合作伙伴,但随着两家公司在计算机处理器行业成为竞争对手,它们之间的矛盾也日益加深。 这场纠纷非常重要,因为世界上许多最大的科技公司都依赖 Arm 授权的芯片架构,并将其融入高通的产品中,从计算机到汽车。 判决公布后,Arm 股价在盘后交易中一度下跌 6.6%,随后回升至较早前收盘价 132.15 美元下跌约 1.9%。高通股价在盘后交易中上涨约 2%。
3a6000实际不到31:扒一扒虫芯的定向优 虫芯最近放出了些侥幸逃脱制裁的3a6000样片,还把spec06所谓IPC吹到了十分夸张的17.2分。 著名的龙吹 隔壁的G吧 ,更是喊出了“强到没朋友”的胡话。 龙芯20年来,一贯靠所谓编译优化,欺骗观众。 当年的龙芯2号,实测性能太差,无法通过评审。只好找软件所搞所谓编译优化,spec2000居然从不到300分“优化”到了500分,才勉强通过验收。从此便患上了编译依赖,从3a2000、3000、到3a4000,全是靠打鸡血的编译器+peak值,才勉强跟上竞争对手使用开源主线gcc的测试成绩。 虫芯玩儿这种不公平对比的花招,玩儿了20年。前十几年做美国mips的舔狗,好歹还有开源主线的mips版gcc,只要下一个“公版”gcc,龙芯的底裤就会被揭穿;在舔MIPS这段时期,虫粪们的说词是:公版gcc对x86、arm有优化,对mips没有优化,所以用公版gcc不公平。 实际上各个架构的gcc,大家前端代码都一样,只有后端涉及指令描述和流水线描述的很少一部分代码是不同的。使都用公版gcc来对比spec,实在非常公平的。 到了虫芯5000,美爹MIPS被虫芯这个扫把星舔死了。虫芯只好拿mips套个皮,再从risc-V偷点东西揉进去,就有了所谓的longarch指令集。这种自娱自乐的自嗨玩具,gcc上游自然不会来适配,所以就不存在弄阿磕的“公版gcc”。这下虫芯可抓住机会了:反正没有公版gcc可以做对比,就可劲的往gcc里打鸡血。 弄出个5000,spec06 吹到了26.7分,号称IPC超过10分了。其实虫5000和4000微架构几乎完全一样,全靠提频和大了一倍的L3缓存提高成绩。 实际上,有专业的机构 使用开源主线的gcc代码,自己构建过 弄阿磕的gcc。在“公版”gcc 下,2.5G的虫5000,spec06int 只有20.4分,所谓IPC只有8分上下。跟胡教主在论文中不得不坦白的虫4000真实成绩14.9分, “IPC”基本一致。 而虫6000的鸡血分数 43.1,靠的是胡教主所谓编译补课,实际就是定向优化的鸡血打得更足了。在前两天的“业绩说明会”上,胡教主不得不坦白:虫芯的gcc专门针对spec2006做了优化。翻译成人话就是,龙芯的gcc已经为spec06打满了鸡血。而针对spec17的鸡血,则是“还在开展中”,也就是隔壁 常说的 “还没优化好”。 按隔壁那个G吧的测试,使用和虫芯5000相同的编译器,虫芯6000只有40.1。 虫芯5000在相同的编译环境下,也是那个G吧测得出 26.6分。 而虫5000在使用公版代码的gcc下,成绩是 20.4。 所以可以推算出 :虫芯在公版代码构建的gcc下,成绩只有 20.4*40.1/26.6=30.75分。 所谓IPC只有不到 12.3分而已。 spec17 单线程性能,那个G吧死活只肯放出 speed成绩。 原因很简单,spec17 的speed允许使用omp多线程,即使设置thread为1,鸡贼的虫芯gcc也可以偷偷的使用自动并行技术,把本来单线程的任务变成多线程执行,大幅提高跑分。 而spec rate 测试,则完全禁用多线程运行。这也是为何 专业的CPU测试都是使用spec17 rate=1 成绩,来反映CPU真实的单线程性能。在spec本身禁用多线程运行的情况下,虫芯的鸡血编译无法作弊, 跑出的成绩会将虫芯的底裤扒光。这就是隔壁那个G吧,即使在被人不断逼问下,也不敢放出spec17 的rate 1成绩的真实原因。 同时,因为spec06没专门限制多线程运行,speed和rate的区别仅仅是同时运行的测试份数不同。所以虫芯的鸡血gcc可以肆无忌惮的用多线程跑speed测试,然后瞒天过海,宣称自己单线程性能如何如何牛逼。实际这些分数就是个作弊的虚假成绩而已。
简评隔壁的所谓“spec测试” 隔壁的G吧,最近有搞了一堆所谓“测试”,引得隔壁的井蛙、虫粪们好一阵兴奋的蠕动,有不少都直接高潮了。 这次隔壁G吧,好不容易加上了spec17的测试,但细心的观众很容易发现这些超算 奇怪的地方。 虫芯3A5000的测试 ,有speed 1也有speed 4,还有rate 4。可偏偏唯独没有: 大家普遍用来衡量单线程性能的rate 1测试。 下面介绍一下背景知识: spec17与spec06不同,spec06的speed就是rate=1时的测试;而spec17的speed和rate完全不同,speed测试允许使用OpenMP进行多线程加速,即使测试时设置thread=1,一些机智(鸡贼)的编译器,一些专门优化后的OpenMP库,还是可以“偷偷的”使用多线程运行。所以包括anandtech在内各测试机构测试单线程性能,已及各个cpu研发机构展示核心性能,使用spec17都是以 rate 1的成绩作为衡量处理器单线程性能的标准。 下面我们再来看看,隔壁G吧测试虫芯3a5000,spec17 int的结果:spec17 int rate 1 隔壁G吧是特地没测(没敢放),图中 的rate1 2.97分的结果是知乎“军民团结如一人”测得的。 每个子题结果则是根据肖俊华老师的spec17 rate1 peak值按比例计算得到。 可看到:speed 测试 所谓单线程"Thread=1" 和 4线程的结果差距很小,多核效率仅28%。 而:rate测试,rate 1和 rate 4,结果的差异就很正常,多核效率则达到了虫芯罕见的 87%。 为啥说罕见?虫芯3a5000的spec06,按隔壁G吧的测试 单核26.5和多核81.2,多核效率约76%,显著低于spec17 rate的多核效率。而同样是spec06,飞腾2000/4的多核效率是61.1/(17.2*4)=88.8%即使核心更多的D2000,多核效率也到了约82%。 然鹅,诡异的是 :虫芯spec06的多核效率明显较低,spec17 rate的多核效率确大幅增加变得十分正常!? 加之据我了解,某国产OS长沙曾经使用自己构建的编译器和系统,测试过3a5000,其spec06 int成绩仅20分出头。 我们有理由怀疑:虫芯的编译器和库(都是龙芯背地里捣鼓的)做了些“奇怪的”“优化”。把本应单线程运行的测试“变成了”多线程运行,通过这种机智的方式,获得了比较漂亮的分数。
华为2022年年度报告会 财联社APP #华为2022年年度报告会##持续更新#: 1、【华为:2022年收入达到6423亿元 净利润下滑68.7%至356亿元】#华为2022年研发费用1615亿##华为2022年收入6423亿元##华为2022年净利润356亿# 2、【华为徐直军:#2023年是华为生存发展的关键之年#】 3、【孟晚舟:华为数字能源和云计算业务初具规模】 4、【华为首度披露智能汽车业务收入 2022年营收21亿元】 5、【华为孟晚舟:华为持续开放鸿蒙、鲲鹏、昇腾、云服务等平台能力 生态伙伴已达4万多个】 6、【#华为回应盈利下滑#:研发投入在加大】 7、【华为轮值董事长徐直军:6G现在还只是个概念 何时到来还不清晰】 8、【华为徐直军:任何国产半导体企业都可以使用国产EDA工具设计14纳米以上的芯片】 9、【华为孟晚舟:我的个人案件已画上句号】#孟晚舟称个人案件已画上句号# 10、【#华为回应任正非重申不造车#:问界生态汽车商业模式不变】 11、【#华为5G手机何时回归#?徐直军:要等美国商务部许可】 12、【孟晚舟:华为不会改变持续吸引全球最顶尖人才的业务策略】 13、【孟晚舟:华为不把公司命运系于个人身上】 14、【徐直军:正在查处有些部门、个人滥用华为品牌 #严禁华为品牌作为汽车品牌#】 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fs.weibo.com%2Fweibo%3Fq%3D%2523%25E5%258D%258E%25E4%25B8%25BA2022%25E5%25B9%25B4%25E5%25B9%25B4%25E5%25BA%25A6%25E6%258A%25A5%25E5%2591%258A%25E4%25BC%259A%2523&urlrefer=d6be9f84ff049ac685a02754f4e58979
HPCC2021 走漏了消息 著名的HPC 专业网站nextplatform,发布了中国两台E级超算的消息。中国超算系统中一直在发挥作用的自主CPU和自主加速器,目前已经得到加强, 使得中国在率先实现了两台E级超级计算机。 位于无锡的国家超级计算中心,将公布一些引人注目的消息。这些消息是:基于国产Sunway超级计算机的量子模拟结果。这个消息不仅因为计算结果,而且因为新机器的可能架构和庞大的规模而引人注目。当然,值得注意的不止这一点,因为美国和中国正在进行全球半导体军备竞赛,这改变了我们传统上比较全球超级计算能力的性质。我们一直在思考中国实现数据中心计算独立的漫长道路,HPC只是其中的一种工作负载。 长期以来,超级计算界已经习惯于在世界最强大系统的500强名单上公开结果,各国都在积极争夺霸主地位。然而,随着紧张局势达到顶峰,实体清单掩盖了国际竞争精神。我们可以期待中国对一些戏剧性的系统飞跃 保持缄默。包括该国已经在2021年突破了(真正的/LINPACK)exascale的障碍,事实上不只一台机器算力达到了E级。 我们得到来自某顶级权威(在匿名的情况下)的消息,2021年3月在神威 "Ocean lite "(海 光)系统上运行了LINPACK测试,该系统是目前Top500排名第四的“神威太湖之光”机器的后续产品。结果产生了1.3 exaflops 的峰值性能,在理想的35兆瓦功率下 ,有1.05E 的持续性能。 我们已经公布了我们所知道的关于“神威 海光”架构的一点信息,今年早些时候(以及现在,在没有经过验证的系统信息的情况下),我们的猜想是,这台新机器是芯片工艺微缩的结果,它的每个节点增加到了有2倍的计算单元从而获得了2倍的性能,通过加倍的节点数(当然还有其他工程),无锡江南计算所可以创造一个exascale系统。很明显,他们已经做到了。 江南计算所利用这4200万个处理器核的超算系统,正在量子模拟生产中进行持续的超大规模计算,我们今天通过年度超级计算大会(SC21)前的预览了解到这一点。太湖之光的后续产品能够运行一个可以在整个机器上并行化的量子模拟。这种模拟也是人工智能/ML训练和推理工作负载的好兆头,因为它突出了混合精度数学的广泛使用,包括16位浮点性能,据说有4.4 exaflops。 在不深入研究所有量子细节的情况下,无锡团队与清华大学和上海量子科学研究中心的合作者一起开发了基于张量的随机量子电路模拟器,该模拟器针对计算密度进行了优化,可以 "将谷歌 ‘悬铃木’的模拟采样时间从之前声称的1万年减少到304秒。" 这只是一个预览摘要,关于这个结果的细节并不多,但值得一提的是,在11月中旬发布详细介绍模拟的论文时,我们或许会发现什么。 同一权威机构证实,在中国进行的第二次exascale级别的Linpack测试结果,来自国防科技大学的天河三号。这个系统我们在2019年5月就已经预览过了。天河三号达到了与神威海光几乎相同的性能,峰值为1.3 exaflops,持续 性能超过exascale flops。我们还不知道天河三号的功率,但我们能够确认:这台机器是基于Phytium公司的飞腾系列处理器(实际是FT-3000), FT处理器基于Arm 指令集,天河三号的加速器名为“Matrix”。(为了清楚起见,飞腾有点像 Intel的服务器处理器"至强",它是Phytium公司的一个CPU品牌)。 这并不是一个新的架构。 2015年我们第一次看到Phytium的HPC野心时曾经分析过,新的飞腾处理器是对 "火星 "64核FT-2000/64架构的后续深挖。当时我们就认为 "火星 "处理器一直是为中国的超级计算机准备的。当然,飞腾也不得不与时俱进了。为天河超算增加真正 "动力 "的“Matrix”加速引擎,仍然基于我们在天河二号A(当时的另一台顶级超级计算机)中看到的Matrix 2000 DSP加速器的更新变体,它被称为Matrix-2000+加速器(实际是Matrix 3000)。天河二号A的研发人员花了很大的功夫来适配GPDSP加速器的软件堆栈。国防科技大学将把所有这些努力换成一个性能相当好的体系结构,尤其是在LINPACK测试性能上。 记得这个Phytium的出现和天河2A系统的Matrix 2000 DSP加速器的出现,是因为当时美国对中国超算机构的禁运而不能按计划使用英特尔至强Phi处理器。 可以看出,在这两个超大规模系统上,架构的变化不大:芯片元件和节点增加了一倍。这并不是要减少努力,但我们不怀疑会出现新的架构,因为另一个即将到来的消息--根据我们同一消息来源,一个中国的未来计划,旨在到2025年提供一个20 exaflops的超级计算机:消息来源在美国,但他了解中国国内的情况。 当我们在这个寒冷的国际政治气候中艰难行进时,有一点需要记住:也许我们再也不能指望以同样的方式对国家竞争力有一个清晰的、前500名超级计算机名单了。如果一直是美国竞争对手的中国在运行LINPACK,但不公开结果,那么这个几十年来一直是高性能计算进展象征的名单的有效性和国际重要性会发生什么变化?中国会失去什么?炫耀不是仅仅一个而是两个验证过的百亿亿次级系统,既能产生峰值也能产生持续的结果,难道不符合国家利益吗? 这里有一些微妙的东西需要考虑:美国橡树岭国家实验室即将推出的 "前沿 "超级计算机预计将以峰值1.5 exaflops和1.3个exaflops左右的预期持续性能首次亮相。也许中国已经决定悄悄地泄露它是真正的第一个研发成功E级超算的国家,而不必公布可能显示美国机器的性能数字稍好的基准测试结果。这只是一个值得思考的问题。 而且这里还有一个微妙的细节:我们的消息来源证实,中国的两个E级超算系统(世界上第一个)的LINPACK正式测试是在2021年3月。针对飞腾信息技术公司实体清单是什么时候出现的? 正好在2021年4月! 政治活动奇怪而混乱。但我们的消息来源证实,中国是第一个研制成功百亿亿次级超级计算机的国家,而且有两套这样的机器,基于两种不同的(但完全是中国本土的)架构。 在没有美国芯片的情况下,很明显,禁运将在短期内满足美国政府对中国利用美国技术促进其核项目发展的担忧。但从长远来看,这是中国加速芯片开发、以及晶圆厂建设的主要动力,也是半导体战争所需的所有引擎,即使尚未沸腾,也将继续酝酿。
美国要求台积电、三星 提交订单、销售等内部信息 集微网消息,美国正施压于芯片制造商如台积电和三星等,要求其提交库存、订单、销售等内部信息,此举将造成后者在与美国公司的价格谈判中处于不利地位。 据《韩国经济日报》报道,23日,美国商务部长吉娜·雷蒙多(Gina Raimondo)在白宫主办的全球半导体峰会上表示,政府需要更多关于芯片供应链的信息,以提高危机的透明度,并确定造成短缺的确切瓶颈。 雷蒙多在接受路透社采访时表示:“我们的工具箱里还有其他手段能够让他们向我们提供数据。我希望我们不会到这一步。但如果必须的话,我们会做到的。” 白宫给全球芯片制造商45天时间来回应这一自愿性的要求,让这些公司陷入了困境,因为有关销售、库存和客户的信息往往被视为公司机密。 三星电子、台积电等全球代工企业没有公开客户名单。 尽管这些跨国公司非常不愿意提供内部数据,但它们不太可能成功地回避这一要求,因为美国政府正在考虑采取法律措施。 有消息称,美国政府正在考虑使用《国防生产法》(DPA)来强制企业提交数据。该法案授权总统要求企业接受国防所需材料的合同,并对合同进行优先排序,还允许总统指定禁止囤积或哄抬价格的材料,迫使工业扩大基础资源的生产,并将原材料用于国防。 全球半导体业界,特别是美国以外的半导体企业担心,美国的信息要求可能会在很大程度上对美国企业有利。 韩国一位业内人士表示:“三星和台积电向美国政府提交的信息,有可能泄露给英特尔等美国企业。”
这个视频最生动的解释了啥叫:跑分定向优化 龙芯的G吧, 啊 、不对,龙芯吧的G吧,最近不断跑出些鸡血跑分,让自嗨众高潮不断。 当然 ,对龙芯不利的跑分G吧是不会露出来的,比如最新版麒麟v10下3a5000的跑分,龙芯G吧就以无法安装为由搪塞过去了。 龙芯的3a4000,龙芯呕心沥血定向优化了2年,终于勉强算圆上了当初吹的牛,这也证明了麒麟os龙芯版,库和编译器都是出自龙芯之手。当然,MIPS已经被龙芯抛弃了,之前的鸡血功夫算是白瞎了。 不过,定向优化的跑分好看,最多也就是宣传的时候占点便宜。机器真正到了用户手中,用户的感受到的性能才是决定处理器能否成功的根本。 B站的up主“半岛的风车”以前主要做龙芯的视频,也在视频中不断宣传龙芯,基本可以算是个龙粉了。 如今这期视频,他做了飞腾D2000的体验测试,也跑了一下分,他的Unix多核只跑了3800,还不如龙芯3a5000的4核跑分(飞腾官方~4900)。但是一通用下来,“半岛的风车”最后的结论却是:飞腾的软件体验比龙芯(3a5000)好太多! 这就是为啥,龙芯成天吹自己国产最强,到头来市占率却是 节节下滑,据某业内人士透露,目前龙芯市占几乎跌破20%,而且看趋势还在进一步下滑中。 因为,用户的眼睛是雪亮的。通过定向优化,跑分是好看了;可就算用户听信龙芯的宣传,一开始选择了龙芯,实际用下来,完全不是龙芯吹嘘的那样;所谓希望越大失望越大,龙芯的定向优化把跑分鸡得越高,用户实际体验后失望就越大、对龙芯的印象就越差。如今xc用户越来越多,龙芯的口碑自然也是一日不如一日,市占率光速下滑 当然就是顺理成章的事情了。 正所谓:天作孽犹可闵,自作孽不可活。 龙芯不断的跑分定向优化,恰恰是搬起石头砸到自己的脚上。
Box64 模拟器发布 Arm64 Linux 版本 Box64 模拟器的帮助下,在 ARM 设备上运行 x64 Linux 程序。想试试吗? Box86 是一个流行的 X86 模拟器,刚进行了一次巨大的升级。发布了 Box64,也就是对应的 ARM64 版本。 可能你还不了解这个模拟器,Box64_86 允许你在 ARM 系统上运行 32 或 64 位的 X86/64 Linux 程序。换句话说,它能让你在树莓派或者 树莓派替代品 上运行 Linux 桌面程序。 幸运的是,现在我们有 Box86 和 Box64 的支持,无论你的 ARM 系统是什么类型。 你可能听说过苹果的 Rosetta 2,它是一个翻译层,允许为老款 Mac(Intel X86 处理器)设计的应用程序在新的 M1(ARM 处理器)驱动的 Mac 上运行。Box64 与之类似,允许为 X86 设计的应用程序运行在 ARM Linux 设备上。 由于它的 Dynarec 模块,它能够做到这一点,同时又是 100% 开源的、免费的,而且速度惊人。它通过重新编译 ARM 程序来提升速度,这意味着和其他 ARM 原生应用一样快。 但是,即使 Box64 无法重新编译应用,它仍然可以使用即时模拟,也有令人印象深刻的结果。 许多树莓派用户很熟悉 Box86,这是一个大约一年前发布的类似程序。二者最大的区别是 Box86 只兼容 Arm32,而 Box64 只兼容 Arm64。 这就是 Box64,一个非常棒的兼容层,允许你在 ARM 电脑上运行 x86_64 应用。 如果你问我认为 Box64 怎么样,我会说这是一个绝对的游戏规则改变者。在难以置信的性能和巨大的潜力之间,这个兼容层肯定会在未来的 ARM 电脑中扮演一个重要角色。 如果你想知道它的工作原理,以及如何开始使用它,请查看其 GitHub 页面/github.com/ptitseb/box64。 就这样吧,现在你自己去潜入其中并测试吧。
1 下一页