kxjljm kxjljm
关注数: 0 粉丝数: 16 发帖数: 1,319 关注贴吧数: 7
关于BIS最新代工限制的解读 简单看了一下美国BIS昨天(15号)发布的最新代工限制。不得不说美帝真心是律师治国,文件跟保险合同一样又臭又长,半天找不到重点。 14/16nm节点以下的先进工艺代工(使用了FinFET技术就算)列入管制范围 受批准的IC设计公司不收限制,基本就是常见的美国和台湾地区IC设计厂。总部不在EAR D:5组别的国家地区(美国武器禁运国)和澳门的厂家可以经审查后获得批准(你问香港?香港已经被美国国内立法撤销独立关税区地位,视为中国内地)。 如果芯片在Fab封装,受批准的Fab可以为豁免名单外的IC设计商代工并出口,但需要满足:(1)近似晶体管数目不超过300亿;(2)如果封装不包含HBM,2027年前不超过350亿,2029年前不超过400亿。 如果芯片在第三方封装,受批准的封测厂可以为豁免名单外的IC设计商封测并出口,但需要满足:(1)近似晶体管数目不超过300亿;(2)如果封装不包含HBM,2027年前不超过350亿,2029年前不超过400亿。 总部不在EAR D:5组别的国家地区(美国武器禁运国)和澳门的Fab和封测厂可以经审查后获得批准。 当然,IC设计公司本身不能是被BIS制裁对象。 所以大部分消费级芯片暂时可能安全,主要还是针对数据中心用途的高性能计算芯片。不过很多国内造车新势力之前搞的自研智能驾驶芯片怕是要G了,比如蔚来那个神玑NX9031,座舱芯片还好。
关于美国BIS最新政策的解读 扒了一天英文文件,总算是看了个大概。 首先涉及GPU限制的3A090这一项内容没有变化 a. 具有一个或多个数字处理单元的集成电路且满足以下以下任意一项的 a.1 4800或更高的“总处理性能”(Total processing performance,TPP) a.2 1600或以上的“总处理性能”并且5.92或以上的“性能密度”(Performance density) b. 具有一个或多个数字处理单元的集成电路且满足以下以下任意一项的 b.1 “总处理性能”大于等于2400小于等于4800并且“性能密度”大于等于1.6小于等于5.92 b.2 总处理性能”大于等于1600并且“性能密度”大于等于3.2小于等于5.92 技术备注 1、“总处理性能”(Total processing performance,TPP)=2*Mac(Multiply Accumulate,乘积累加运算)TOPS/TFLOPS*操作位宽bit 2、Mac TOPS/TFLOPS按理论最大值计算,如果IC有进行多种位宽运算的能力,按最大的一种计算 3、集成电路同时提供稀疏和密集矩阵处理能力的,按密集矩阵计算TPP 4、“性能密度”等于TPP除以平方毫米计算的可用die面积,包括使用非平面晶体管架构工艺节点制造的逻辑器件所有区域 但是非数据中心产品不受3A090管制,TPP大于4800的非数据中心产品受NAC例外许可证管制。(这次还新增了ACA例外许可证,但是和咱们没有太大关系) NAC许可证适用于中国澳门和D:5国家组(含中国),中国香港已经被视作中国大陆一样的区域。 RTX 4090有512个Tensor Core,Boost频率2.52G。Ada Lovelace和Ampere(不含GA100)的Tensor Core都是128个FMA对于FP16,FMA被认为是两个运算(乘和加)。 所以RTX 4090的TPP=128*2*2.52G*512*16=5285TOPS,RTX 4090超标的主要是Tensor算力,CUDA算力暂时安全。 之前这个NAC许可证没有实施细节,所以NVIDIA可能也没有申请,而是直接切出了合规的RTX 4090D来替代出口。现在把申请的程序都给了出来,并且提出将根据申请“逐案审查”,所以非数据中心产品有放宽的可能。这应该是NVIDIA运作的结果,毕竟下一代智能驾驶芯片DRIVE Thor是2000TOPS的int8算力,妥妥超标。 至于最近炒的很热的70T Weighted TeraFLOPS这个,纯属某微博小V不学无术看叉了眼。这个本身归属4A003,主要用来限制用于科学计算(不是AI)的超级计算机。Weighted TeraFLOPS衡量的是Adjusted Peak Performance这个指标,适用于64bit以及更高精度的浮点运算。然而消费级GPU的FP64算力都被严重阉割过,在NVIDIA游戏卡上基本都是1/64的FP32算力,离这个指标还差得远呢。况且这个作为瓦森纳协定的内容很早之前就有,而且根据技术进步一直在上调阈值,所以不存在因这个受限的情况。
阿里平头哥三篇论文入选ISCA2020 IT之家3月25日消息 3月25日,计算机体系结构顶会ISCA 2020公布了论文入选结果,阿里平头哥三篇论文入选,创国内芯片企业纪录。 IT之家了解到,三篇论文分别展示了平头哥半导体在玄铁910处理器、计算存储一体化及AI硬件基准测试等方面的研究成果。 ISCA是计算机体系结构领域最权威的会议之一,包括谷歌、英特尔、英伟达等企业在ISCA上发表的多项研究成果都已在半导体行业广泛应用。平头哥此次入选三篇论文(包括两篇合作论文),成为ISCA历史上论文入选最多的中国企业。据了解,其中一篇论文首次阐述了玄铁910的设计方法。玄铁910为平头哥首款产品,也是目前业界性能最强的RISC-V处理器。论文提到,为解决RISC-V性能瓶颈,玄铁910率先将多发射乱序内存访问技术引入RISC-V架构,并通过自适应混合分支处理技术以及多通道、多模式数据预取技术大幅提升了指令及数据访问带宽。· 第三方测试平台数据显示,玄铁910已达到业界主流商用高性能架构的水平。该论文团队表示,“玄铁910不仅突破了RISC-V处理器的性能边界,也为RISC-V打开了新的应用场景,玄铁系列处理器已经实现了终端、边缘端及云端场景的全覆盖。” 在另外两篇论文中,平头哥分别与提出了一种可解决存储墙问题的“基于近存储体架构的可编程硬件和软件架构”,及与谷歌、微软、Facebook等科技公司联合研发的MLPerf推理基准0.5版本,这是目前业界主流的AI硬件性能测试平台。 ISCA 2020将于6月在西班牙举办,今年共有421篇投稿,最终77篇论文入选,接收率为18%。
1 下一页