mygo358 mygo358
关注数: 53 粉丝数: 101 发帖数: 6,727 关注贴吧数: 72
14号发射的三体计算星座让中国有了在太空计算的人工智能计算系统 随着太空计算卫星星座14日在酒泉卫星发射中心成功发射,我国整轨互联太空计算星座“三体计算星座”正式进入组网阶段。   这是之江实验室主导构建的“三体计算星座”的首次发射,也是国星宇航“星算”计划的首次发射。本次发射的一箭12星,最高单星算力达744TOPS(每秒744万亿次计算),整体具备5POPS(每秒5千万亿次计算)在轨计算能力和30TB存储容量。“三体计算星座”是由之江实验室协同全球合作伙伴共同打造的千星规模的太空计算基础设施,建成后总算力可达1000POPS(每秒百亿亿次计算)。 “星算计划”由2800颗算力卫星组网,将构建未来天地一体化算力网络。 首发星座12颗计算卫星采用国星宇航自研的智能网联卫星平台,除配套了国星宇航自研的AI载荷外,还搭载了之江实验室星载智能计算机等太空计算软硬件和天基模型,实现了“算力上天、在轨组网、模型上天”,每颗卫星均搭载了星载智算系统、星间通信系统,具备太空计算、太空互联能力,首发星座在轨计算能力达到5POPS,星间激光通信速率最大可达100Gbps,星座组网后将形成全球最强的太空计算能力。 据了解,本次首发入轨的12颗计算卫星均搭载了星载智算系统、星间通信系统,能够实现整轨卫星互联,具备太空在轨计算能力,将构建天地一体化网络。卫星同时搭载了80亿参数的天基模型,可对L0-L4级卫星数据进行在轨处理,将执行异轨卫星激光接入、天文科学观测等在轨试验任务。 通常,卫星需先将数据传回地面,再由地面数据处理中心对其进行解析,这种“天感地算”的模式受限于地面站资源、带宽等因素,仅有不到十分之一的有效卫星数据能传回地面,且存在数据时效差等问题。解决这一问题正是之江实验室构建“三体计算星座”的出发点。 “对于之江实验室而言,不是简单地发卫星,我们是要构建太空计算星座,把算力送到太空,实现计算卫星之间的互联互通,进而把人工智能送上天。”中国工程院院士、之江实验室主任王坚表示。 计算星座的突破离不开太空计算软硬件技术的攻克。之江实验室承担了首发任务星载智能计算机等太空计算软硬件和天基模型的研制工作。国星宇航承担了智能网联卫星平台研发和整星研制工作。氦星光联承担了激光通信终端的研制工作。 作为计算卫星的核心载荷,之江实验室研究突破的星载智能计算机把卫星算力从T级提升到 P级,实现10-100倍的提升。星载高通量路由器作为星座天地网络互联的核心设备,将完成星间、星地和星内百G比特高速率、低延迟网络传输。天基分布式操作系统就像“星座资源管家”,能对星座的算力、存储、网络等资源进行统一管理,实现在轨计算任务编排调度及应用状态监测。首发卫星搭载的80亿参数天基模型是业内首个多任务模型,为星座增加了智慧大脑,能够调度卫星协同处理多源遥感数据,在轨自主完成对地观测任务。
美国商务部全球禁用昇腾芯片限制 AI 芯片用于中国 AI 模型 当地时间 5 月 13 日,美国商务部正式发文,废除拜登政府此前推出的《人工智能扩散规则》(AI Diffusion Rule),并同时宣布一系列强化全球半导体出口管制的新措施。这一举动在全球科技产业引发震动,凸显美国在人工智能和半导体领域战略的重大调整。 AI Diffusion Rule 于 2025 年 1 月 15 日由拜登政府发布,原定于 5 月 15 日生效。该规则将全球国家和地区划分为三个层级,实施差异化的先进人工智能芯片出口管控。然而,美国商务部工业与安全局(BIS)指出,这项规则一旦实施,不仅会对美国本土企业施加 “繁重的监管负担”,扼杀美国创新活力,还会因将众多国家降格为 “二级技术合作对象”,严重损害美国与数十个国家的外交关系。BIS 透露,将通过《联邦公报》发布正式撤销通知,并在未来推出替代规则。 美国商务部负责工业和安全的副部长杰弗里・凯斯勒(Jeffery Kessler)明确指示 BIS 执法官员,停止执行拜登政府的 AI 扩散规则。他强调,特朗普政府将与全球 “可信赖的伙伴国家” 携手,构建大胆且包容的人工智能技术战略,在保障关键技术不落入对手手中的同时,推动美国 AI 技术的创新与国际合作。凯斯勒批评拜登政府的 AI 政策 “考虑欠妥、适得其反”,对美国的技术优势和国际合作关系造成负面影响。 在废除 AI 扩散规则的同时,BIS 宣布了三项旨在加强海外 AI 芯片出口管制的新举措: 全球禁用华为 Ascend 芯片:BIS 发布指导意见,明确在世界任何地区使用华为 Ascend 芯片均被视为违反美国出口管制条例,试图从全球层面阻断华为芯片技术的应用拓展。 限制 AI 芯片用于中国 AI 模型:BIS 发出警告,若美国 AI 芯片被用于训练或干扰中国人工智能模型,相关企业将面临严重后果,进一步强化对中国 AI 产业发展的技术封锁。 供应链反制指南:美国商务部要求美国企业重新审视供应链合作伙伴,强化审查机制,防范技术转移风险,确保美国半导体技术在全球供应链中的绝对主导地位。 美国商务部宣称,此次行动是为了确保美国在人工智能创新领域的前沿地位,稳固其全球 AI 主导权。但分析人士指出,美国此举实质是在全球科技竞争加剧的背景下,以单边主义手段维护自身科技霸权,新措施可能进一步扰乱全球半导体产业链的正常秩序,加剧全球半导体产业链的分化与重构,引发更多国家对自身科技产业安全的担忧,促使各国加速推动半导体技术的自主研发与供应链多元化布局 。
昇腾 910C正式大规模商用 昇腾 910C正式大规模商用4.10 华为云生态大会发布 CloudMatrix 384 超节点,对标英伟达NVL72,超节点总算力高67%(对比 NVL72),网络互联总带宽高 107%,内存总带宽高 113%。采用 CloudMatrix 384组网的集群,可以做到万卡线性度>95%,MFU达55%,长稳定训练 40 天不中断。 CloudMatrix 384 超节点由昇腾 910C 组网!组网参数来看,该版本的 910C 单卡参数为:单卡算力:781.25 Tflops单卡内存总带宽:3200 GB/s(8*HBM2e)单卡 GPU 互联带宽:400GB/s(同 910B,因封装限制)解读:这是昇腾 910C 正式大规模商用落地的里程碑,CloudMatrix 384方案体现了华为的系统级思维,在先进工艺受限,以堆叠换性能,不拘泥于单点性能的高低,而是从系统层级出发,实现更好的系统体验。 CloudMatrix 384 超节点可对标 NVL72,而 910C 单卡则可对标 NV H100,为国产 AI GPU 在纯训练端实现了突破!往长看,我们认为华为 AI GPU 将按照“训推一体+纯训练”的组合,保持迭代。 从 7nm 制程的 910 系列:训推一体:910纯训练:910C(C 即 Chiplet,将两颗训推一体芯片拼接,成为纯训练芯片)下一代将是 6nm 的 920 系列:训推一体:920纯训练:920C国产 AI GPU 在训推一体和纯训练市场都有了国产替代方案!昇腾超节点释放单卡性能,昇思迭代增强软硬协同 1、投资建议。CloudMatrix 384超节点发布,其采用新型高速总线升级互联带宽,单卡decode吞吐对标H100。昇思Mindspore 2.6全面支持类Deepseek V3/R1 MOE架构模型,系统吞吐率提升2.8倍。伴随硬件性能提升与软件架构迭代,国产AI算力芯片需求有望加速增长。 2、硬件:CloudMatrix 384超节点发布,国产AI算力基础设施升级。根据2025年4月10日举办的华为云生态大会,CloudMatrix 384超节点采用新型高速总线,通过统一内存编制、通信升级互联带宽,有效提升推理性能。根据硅基流动微信公众号,384超节点可在单用户20TPS前提下,实现单卡decode吞吐1920 tokens/s,与H100性能相当。并且CloudMatrix 384超节点高速互联带宽有望加速国产算力卡向训练场景突破。 3、软件:昇思发布Mindspore 2.6,加速开发大模型一体化部署方案。根据2025年4月12日举办的昇思开发者大会,MindSpore 2.6全面支持类Deepseek V3/R1 MOE架构模型:(1)支持高性能MOE预训练,性能提高30%;(2)发布新的后训练学习套件GRPO等,支持deepseek,千问等模型的GRPO训练以及DRO/PPO等算法,支持训推一体;(3)适配支持vLLM原生接口,支持Deepseek V3/R1 Int8量化,新增10+推理融合大算子,系统吞吐率提升2.8倍。并且昇思联合北大、openeuler提供大模型一体化软件方案,整合deepseek、Mindspore、openeuler、VLLM开源组件,支持大模型快速部署服务。未来昇思生态将持续演进,预计Mindspore 2.7将支持大EP并行能力,实现多模态生成模型Day0迁移,将进一步加速Altas 800 A3超节点推理速率。 来源今日头条ID:全产业链研究
国产AI芯片破局:国产TCB设备首次完成CoWoS封装工艺测试 DeepSeek的突破性进展,让中国在AI产业领域似乎迅速缩小了和美国的差距,然而整个国产大模型的运行仍高度依赖英伟达的芯片支持。尽管国产GPU设计能力迅速提升,但随着台积电对中国大陆的供应限制,高端GPU的国产化制造成为中国AI产业发展的关键挑战,尤其是CoWoS先进封装制程的自主化尤为紧迫,目前中国大陆产能极少,且完全依赖进口设备,这一瓶颈严重制约着国产AI发展进程。在此背景下,普莱信智能开发的Loong系列TCB设备,通过与客户的紧密合作,率先完成了国产AI芯片的CoWoS-L测试打样,实现了国产TCB设备在AI芯片CoWoS封装领域的首次突破。 CoWoS封装——AI芯片高密度集成的基石 随着AI大模型、自动驾驶、高性能计算(HPC)的爆发式增长,传统芯片封装技术已无法满足算力密度和能效比的需求。台积电推出的CoWoS( Chip-on-Wafer-on-Substrate)技术,通过将逻辑芯片、高带宽内存(HBM)、硅中介层等异构元件三维堆叠集成,成为AI芯片的“终极封装方案”。其核心优势在于: 1、超高密度互联:利用硅中介层实现微米级TSV(硅通孔)互连,布线密度较传统2D 封装提升10倍以上,突破数据传输瓶颈; 2、极致能效比:HBM与GPU/ASIC芯片的“近存计算”架构,将数据传输功耗降低50%,显著提升能效比; 3、卓越异构集成能力:突破传统封装限制,支持多芯片、多工艺节点(如7nm逻辑芯片+40nm硅中介层)混合封装,为芯片设计提供更大自由度。 TCB设备——CoWoS封装的心脏与技术制高点 在CoWoS封装流程中,热压键合(Thermal Compression Bonding, TCB)是决定良率与性能的核心环节。其作用包括: 1、精准连接:以微米级精度将芯片与中介层或基板对准,通过热压实现铜柱凸点(Cu Pillar)的共晶键合; 2、热应力控制:在高温高压下平衡芯片翘曲,避免微裂纹或界面分层; 3、多层堆叠:支持HBM与逻辑芯片的多次键合,确保信号完整性。 应用于CoWoS封装的热压键合(TCB)设备,精度要求极高,通常不低于±1.5μm,甚至新一代的TCB设备,精度要求达到亚微米,要在这种对温度、压力严格控制环境下,实现稳定的精度和力控,全球现在只有国际少数几家半导体设备巨头能生产TCB设备,如新加坡ASM Pacific、美国Kulicke & Soffa,韩国Hanmi等。同时,随着AI芯片尺寸增大(如英伟达GB200芯片达130×90mm),设备需支持更大键合面积、更高精度及多芯片同步对准,及对无助焊剂封装的要求,Fluxless的键合与自适应翘曲补偿技术成为未来趋势。 全球CoWoS市场爆发式增长,中国需求激增与产能瓶颈并存 据Yole Développement预测,2023年全球CoWoS封装市场规模已突破35亿美元,未来三年将以年均42%的复合增长率快速扩张,预计2026年市场规模将超100亿美元。其中,AI芯片贡献超70%需求——仅英伟达H100/H200、AMD MI300X等旗舰产品,单颗芯片即需1-2片CoWoS中介层,而2024年全球AI芯片出货量预计达150万颗,拉动CoWoS产能缺口持续扩大。 中国作为全球AI芯片第二大市场,CoWoS封装需求正急速攀升:华为昇腾910B、寒武纪思元590、壁仞BR100等国产AI芯片已进入CoWoS量产阶段,单颗芯片中介层需求达2-4片;互联网巨头(如百度、阿里)自研AI芯片亦加速导入CoWoS。 据测算,2024年中国大陆CoWoS封装市场规模将达8亿美元,2026年有望突破25亿美元,年增长率超70%。但核心瓶颈在于包括TCB设备在内的关键设备100%依赖进口,且美国可能将高端TCB设备纳入对华半导体设备禁令,导致产能扩张计划面临“无米之炊”风险。 美国禁令倒逼国产化,TCB设备成AI芯片制造破局关键 美国商务部工业与安全局(BIS)已将CoWoS相关技术列为“重点关注领域”,若对TCB设备实施出口管制,中国大陆先进封装产线或将陷入停滞。例如:ASM Pacific已暂停向部分中国客户供应TCB系列设备;Besi的LAB设备对中国客户实施“逐案审查”。在此背景下,TCB设备国产化不仅是商业需求,更是AI芯片供应链安全的生死线。 普莱信智能——中国TCB设备的“破壁者” 普莱信智能作为国内唯一具备CoWoS级TCB设备自主研发和生产能力的企业,其技术突破彻底改写了国产设备“跟随者”的角色: 其与客户联合开发的Loong系列TCB设备,采用自研“超精密高温纳米运动平台”和“多光谱视觉定位系统”,实现在450度高温,升温速率150度,降温速率50度,±1μm的芯片贴装精度,支持130×130mm超大芯片键合,较国际同行同级别设备效率提升25%;Loong系列兼容晶圆级(12英寸)、板级(620×620mm)封装,支持HBM堆叠等全流程工艺;本次工艺测试的完成,标志着国产TCB设备正式迈入一个全新的阶段。 更值得期待的是,普莱信正在加速研发下一代Fluxless TCB设备,目标将精度提升至±0.3μm。随着中国CoWoS产能的爆发,普莱信有望在2026年抢占国内TCB设备市场的重要份额,成为全球高端封装装备领域的“中国名片”。 3月26-28日,SEMICON China展会期间,普莱信(展位号:N1-1285)将携TCB热压键合机Loong(国产唯一HBM/CoWoS键合设备)、巨量转移式板级封装设备XBonder Pro、高速夹焊系统Clip Bonder、多功能超高精度机DA403等亮相。
青禾晶元破局先进封装全球首台混合键合设备亮相 随着半导体工艺逼近2纳米物理极限,传统制程微缩面临诸多挑战。在此背景下,先进封装技术成为延续摩尔定律、实现“超越摩尔”的核心路径,而混合键合(Hybrid Bonding)凭借高密度互连与低功耗特性,被视为下一代封装技术的制高点。值得注意的是,全球高端键合设备市场几乎被海外巨头垄断 ,国内高端键合设备基本上全部依赖进口,这是悬在中国半导体产业头上的达摩克利斯之剑。 3月12日,青禾晶元正式发布全球首台独立研发的C2W&W2W双模式混合键合设备SAB 82CWW系列,打破国际巨头技术垄断,标志着国产高端键合设备迈入全球第一梯队。该设备通过一体化架构设计,首次实现C2W(芯片-晶圆)与W2W(晶圆-晶圆)双模式协同,为半导体行业提供“灵活+高效”的全新解决方案。 在先进封装领域,混合键合技术(Hybrid Bonding)因其高密度互连、低功耗和高性能的特点,成为了行业关注的焦点。然而,长期以来,企业在进行混合键合制程时,往往面临一个关键抉择:选择芯片对晶圆(C2W)还是晶圆对晶圆(W2W)技术路线。 C2W路线:支持芯片筛选和异构集成,灵活性高,但每颗芯片都需要精准定位,产能受限。 W2W路线:追求极致效率,适合小芯片的批量键合,但在大芯片良率波动大。 青禾晶元的SAB 82CWW系列设备通过全球先进的一体化架构设计,打破了这一“非此即彼”的困局。设备支持C2W和W2W双模式混合键合,实现两种技术路线的“协同进化”。这种创新设计不仅提升了研发效率,还显著降低了设备运营的复杂性和成本。 SAB 82CWW系列的核心优势 1. 高度灵活的模块化设计 SAB 82CWW系列采用了采用了高度灵活的模块化设计理念,这种设计允许客户根据具体需求,快速配置不同的键合模式。无论是专注于研发阶段的小批量、多品种实验,还是面向量产的大规模、高效率生产,这个通用平台都能适配。 2. 多尺寸兼容与超强芯片处理能力 设备支持8英寸和12英寸晶圆的兼容切换,能够处理厚度最薄至35微米的超薄芯片,并通过自动更换夹具,兼容0.5×0.5mm至50×50mm的芯片。独创的芯片边缘夹持技术,避免了芯片正面的颗粒污染,显著提升了生产良率和可靠性。 3. 高精度对准与智能化偏移补偿 设备提供片间同轴和红外穿透两种对准方式,键合精度分别可达±300nm和±100nm。智能化偏移补偿技术能够实时检测键合片的偏移情况,并通过内置算法自动调整键合位置,确保高精度键合的稳定性和一致性。 4. 成本与效率的双重提升 相比分别采购C2W和W2W设备,SAB 82CWW系列可将设备投资成本降低30%,占地面积减少60%,并大幅缩短研发转量产的时间周期。 赋能多领域应用,推动行业创新 SAB 82CWW系列设备在多个关键领域展现出强大应用潜力,通过混合键合技术提升存储器密度和速度,优化信号和功耗;通过高精度键合技术助力Micro-LED显示提升亮度和能效,支持高性能显示;通过异构集成不同工艺节点芯片大幅提升SoC与Chiplet架构的算力密度,优化性能并降低成本;同时,还将光子集成电路与电子集成电路异构集成,实现高速、低功耗的光电共封装解决方案,满足人工智能、5G和自动驾驶等技术对高速数据传输和处理的需求。 重构全球键合生态:从设备到工艺,一站式服务助力可持续发展 受益于半导体行业的快速增长和先进封装技术的普及,未来键合设备市场将迎来更加广阔的发展前景。然而当前海外企业仍然占据整个市场的90%以上份额,国产化率不足5%。这种高度垄断的格局,使得国内先进封装领域长期受制于人。青禾晶元新一代混合键合设备SAB 82CWW系列的发布,将打破EVG等国际龙头在高端混合键合等关键工艺的独家供应,保障国内3D封装产能安全;同时促进产业链上下游本土设备与封装企业间的深度协同,加速Chiplet、存算一体等新架构落地。 作为一家专注于高端键合装备研发制造与精密键合工艺代工的企业,青禾晶元始终坚持以“装备制造+工艺服务”的双轮驱动模式,为全球半导体产业链提供先进键合技术解决方案。通过“设备+代工”的模式,青禾晶元将重构全球键合生态,为用户提供一站式服务,助力本土半导体产业的长期可持续发展。
中国发明无硅芯片!速度和功耗突出,或重塑全球芯片格局! 近日,一则振奋人心的消息在全球科技界引发了轩然大波:中国科研团队成功发明了无硅芯片,其性能表现卓越,堪称 “速度最快、功耗最低”,有望重塑全球芯片格局。这一重大突破,不仅为中国在芯片领域的发展注入了强大动力,也为全球半导体产业的变革带来了新的可能。 2 月 14 日,《自然 - 材料》杂志发表了一项来自北京大学团队的研究成果,该团队开发出了全球首款无硅芯片。这款芯片的诞生,标志着芯片技术领域迎来了一次革命性的飞跃。与英特尔和台积电最新的 3 纳米芯片相比,这款无硅芯片的速度提升了 40%,能耗却降低了 10%,如此出色的性能表现,使其被誉为 “迄今为止速度最快、能耗最低的晶体管”。 长期以来,芯片行业一直受困于一个两难困境:在追求高性能的同时,难以兼顾低功耗。然而,北京大学彭海琳教授团队的这项研究成果,成功打破了这一魔咒。彭海琳教授在接受采访时表示:“如果芯片创新基于现有材料被视为‘走捷径’,那么我们开发的二维材料晶体管就相当于‘换道超车’。 ” 该团队彻底摒弃了传统芯片的基础材料 —— 硅,转而采用铋(Bismuth)基材料构建晶体管。自 20 世纪 60 年代以来,硅一直是芯片的基础材料,英特尔创始人戈登・摩尔提出的 “摩尔定律”,即芯片上的晶体管数量大约每两年翻一番,推动着整个芯片产业不断向前发展。但随着科技的进步,“摩尔定律” 逐渐失效。 当晶体管尺寸不断缩小,硅基芯片面临着三大难题:短沟效应,使得晶体管栅极难以有效控制电流;量子隧穿现象,导致电子 “穿墙而过”,增加了漏电风险;功耗墙问题,微缩带来的功耗飙升,让芯片发热严重。尤其是当工艺进入 3 纳米节点以下(约为一根头发丝直径的两万分之一)时,这些问题变得愈发难以克服。 那么,彭海琳团队是如何突破这些限制的呢?他们的秘密武器是一种名为 Bi₂O₂Se(硒氧化铋)的二维材料,这种材料仅有几个原子厚。此外,团队还采用了一种全新的晶体管架构 —— 全环栅场效应晶体管(GAAFET)。 传统晶体管如同水流通过平面管道,而近年流行的鳍式场效应晶体管(FinFET)类似水流通过凸起的鳍片,与之不同的是,GAAFET 就像水流完全被管道包围,对电流的控制更加精准。这种架构的改变,如同从高楼大厦式的设计转变为连接桥梁式的设计,使得电子流动更加顺畅。具体来看,这种新型晶体管具有诸多神奇之处:其沟道超薄,仅 1.2 纳米厚,相当于几个原子叠加的厚度;Bi₂O₂Se 与栅氧化物 Bi₂SeO₅之间形成了近乎完美的 “天然” 平滑界面,几乎不存在缺陷;工作电压极低,仅需 0.5 伏特,远低于硅基芯片的要求;电子迁移率超高,高达 280 cm²/Vs,电子能够在其中 “畅行无阻”。目前,研究团队已经利用这种晶体管构建了非门、与非门和或非门等基本逻辑单元,充分证明了其在实际计算中的应用潜力。 这项研究成果不仅是技术上的重大进步,更是一种战略上的突围。众所周知,先进芯片制造技术受到严格的出口管制,在这种情况下,彭教授坦言:“虽然我们走上这条路是出于当前制裁的必要性,但这也促使研究人员从全新的角度寻找解决方案。这种方法并非在现有技术道路上追赶,而是开辟全新赛道,实现‘换道超车’。” 不过,从实验室突破到大规模生产,仍面临诸多挑战。例如,如何实现晶圆级大规模制造,怎样使新技术与现有硅基工艺兼容,以及如何有效控制生产成本和提高良品率等。尽管如此,北京大学团队已经展示了晶圆级单片三维集成(M3D)的可能性,为未来大规模生产带来了希望。近年来,该团队在《自然》系列期刊上发表了多篇重要论文,如 2023 年报道的世界首例外延高 κ 栅介质集成型二维鳍式晶体管,而此次的二维环栅晶体管则是他们研究的进一步突破。 全球半导体巨头如英特尔、台积电和欧洲微电子中心(IMEC)都在积极研发二维环栅晶体管,而北京大学团队率先取得突破性进展。彭教授表示:“这表明二维环栅器件在性能和能耗上优于先进硅基技术,它满足国际器件和系统路线图(IRDS)对埃米节点的算力与功耗要求。” 可以说,这一成果不仅仅是中国一个团队的成功,更有可能成为改变整个芯片产业未来走向的关键技术飞跃。就如同蒸汽机引发了第一次工业革命、内燃机推动了第二次工业革命、硅基芯片引领了信息革命一样,这种新型铋基二维芯片有望引领下一轮科技变革,为人工智能、量子计算等前沿领域的快速发展提供强大助力。未来,随着相关技术的不断完善与应用拓展,其对全球芯片格局的重塑作用值得期待。
0.85毫米超薄做到1TB!长江存储晶栈4.0杀入手机 首次支持UFS 4.1 除了SSD固态硬盘,UFS嵌入式存储也将是长江存储的重点方向,深圳闪存市场峰会上就公开了三款强大的新品。 UC420: 长江存储首款支持UFS 4.1标准的嵌入式闪存芯片,首次基于晶栈4.0架构。 容量可选256GB、512GB、1TB,也是长江存第一颗1TB UFS芯片。 但是,它的厚度只有0.85毫米,超薄的封装使之非常适合折叠屏手机。 即便如此,仍然可以做到饱和带宽与满血性能,堪称业界标杆,非常适合旗舰机型。 此外,它还可以满足各家AI旗舰手机的特色功能定制。 2024年底,长江存储发布了首款基于新一代晶栈4.0闪存架构的PCIe 5.0 SSD产品致态TiPro9000,无论性能还是功耗发热都趋于完美,但官方对新架构并未做过多介绍。 在深圳举办的2025年闪存市场峰会上,长江存储首次公开揭秘了晶栈4.0闪存架构的诸多细节。 2018年以来,场景存储的晶栈架构已经演化了四个大版本,存储密度越来越高,可靠性越来越稳,IO速度越来越快,目前已达3600MT/s,同时不断引入新的先进工艺和技术,这一代就加入了SCT。 晶栈4.0延续了背面源极连接(BSSC),采用混合晶圆键合结构,20孔垂直通道设计,持续改善生产效率,并提高产量。 其中,晶栈4.0 TLC产品代号X4-9060,致态TiPro9000用的就是它。单Die容量512Gb,密度比上代X3-9060提升了超过48%,是已量产同类产品中密度最高的,IO速度也提升了50%。 同时,新闪存高效易用,在设计上兼容前两代X2/X3-9060,可以快速迁移。 晶栈4.0 QLC产品代号X4-6080,比上代X3-6070密度提升了42%,单Die容量从1Tb翻番到2Tb(512GB),单盘容量可以轻松做到4TB甚至更大。 同时,IO速度提升了50%,吞吐量提升了147%,耐久度提升了33%。 晶栈4.0的堆叠层数未公开。 三星已做到286层,设计完成400+层,明年量产。 美光量产232层,下一步276层。 铠侠现为218层,最近已宣布332层。 SK海力士已宣布321层,并率先量产300+层。 铠侠/西部数据为218层,不过西部数据闪存业务已拆分给闪迪。
海思推出的SAR ADC AC9610 最近海思推出了一款SAR ADC,就实现了高采样率和高分辨率的“双高”指标,刷新了国产ADC的性能极限。 海思这次推出的SAR ADC型号为AC9610,采样率达到2MSPS,可确保精准捕获μs级瞬态信号;采样精度更是达到24bit,可精准识别0.5uV弱小信号的差异;INL误差仅为±0.9ppm。 同时凭借创新的低噪声设计,该芯片在2MSPS采样率下可达到103.5dBFS的SNR,在1Ksps采样率时更是高达138dBFS,即便在强干扰环境下依然能够分辨目标信号与噪声信号。通过先进的封装设计技术,AC9610支持-40°C~125°C宽温工作,同时保证低温漂,确保工业复杂环境下仍能正常运行。 当然,除了工业应用,医疗设备、高端仪器仪表、精密传感器等都需要用到高采样率高采样精度的ADC。海思表示,医疗装备领域中无论是关乎疾病精准诊断的医学影像设备,如 CT、MRI,还是用于生命体征监测的各类仪器,数据采集的速度与精度直接关联着患者的生命健康,只有准确且迅速地捕捉生理信号,才能为临床决策提供可靠依据。 SAR ADC(Successive Approximation Register Analog-to-Digital Converter,逐次逼近寄存器型模数转换器)是通过逐次逼近的方式将模拟信号转换为数字信号,广泛应用于嵌入式系统、传感器接口、工业控制等领域。 SAR ADC的优势在于其结构相对简单,功耗较低,转换速度较快,适用于不需要极高转换速率的应用场景。此外,它们不需要复杂的抗混叠滤波器,因为它们本质上是采样-保持设备。 相比Delta-Sigma ADC,SAR ADC速度更快,延迟更低,但一般分辨率较低(Delta-Sigma ADC一般在24位以上)。由于其平衡的性能和低功耗特性,SAR ADC成为许多嵌入式系统的首选ADC类型,适用于多通道、高速、中等精度场景,比如工业控制、数据采集系统等。 ADC在采样率和分辨率两个核心参数上,基本上可以说是“平衡的艺术”。当提升了采样率,分辨率就难以避免地降低;而提高了分辨率,采样率就需要下降。一个生活中常见的场景就是:HDMI2.1标准的线缆,可以最高支持8K/60Hz的视频传输,而当分辨率下降到4K时,就可以传输120Hz的视频。 所以海思AC9610的推出,在SAR ADC高速的优势下,兼顾24位的高精度,在采样率和采样精度上同时实现了高指标,突破了SAR ADC性能的限制,追赶上国际领先水平。更高性能的ADC,能够为工程师提供新的解决方案,真正实现高速高精度的精密信号采集系统。 实际上高精度、高采样率ADC,过去也是国产模拟芯片的一个短板之一。高速ADC/DAC市场几乎被TI、ADI(收购Maxim)二家公司所垄断,占国内市场超过90%份额。同时,在美国的出口管制清单中,也包含了一些高分辨率、高速ADC产品,比如采样速率400MSPS以上的12-14bits ADC。 这次海思推出的AC9610,从规格和参数指标推测,可能是对标ADI此前推出的AD4630-24。这款ADI的SAR ADC产品同样具备2MSPS采样率,24bit采样精度以及0.9ppm的INL精度,SNR典型值为105.7 dB。 随着国产替代的需求,国内近年来其实也有不少厂商推出了技术指标能够对标海外领先水平的产品,包括芯海、思瑞浦、圣邦微、纳芯微、联影微电子等都推出了丰富的工业、车规应用的ADC产品,并已经实现大规模的出货应用。写在最后 高性能高精度ADC在工业自动化、医疗设备、高端测量仪器中是关键部件,ADC直接影响到设备的工作性能。作为模拟芯片中的重要一环,要做好ADC并不容易。除了本身在工艺、设计上需要有多年的技术迭代积累,如何在市场上与早已成熟的海外大厂产品进行竞争,这需要国内模拟芯片厂商紧贴市场需求,坚持正向研发。 在过去几年时间里,随着国产替代需求的爆发,本土模拟厂商已经加速了高性能ADC产品的开发,目前在工业、汽车、医疗等应用领域都基本已经实现覆盖。 而高端的ADC产品专利壁垒较大,同时更加需要制造端和设计端的紧密协同,相信在本土模拟芯片厂商的努力下,国产高端ADC的“空白”将会越来越少。
华为云全新一代通用计算增强型云服务器C9实例正式开启公测 华为云全新一代通用计算增强型云服务器C9实例,正式开启公测。作为华为云C系列旗舰级云服务器,C9实例基于华为云全新分布式QingTian架构打造,搭载最新一代处理器,采用智能化双通道技术,在计算、存储、网络性能上实现跨越式升级,为互联网、金融、游戏、政务、科研等行业提供更高效、更安全、更可靠的云端计算服务。 搭载最新一代处理器,计算性能飞跃 C9实例采用最新一代处理器,全核睿频3.6GHz,最大规格支持376核,计算性能较上一代提升30%。内置多款硬件加速器,为高性能计算、AI深度学习和推理、视频编码等场景提供强劲算力支持,帮助企业加速业务创新。高性能存储,加速数据价值释放 C9实例存储性能较上一代提升60%,IOPS提升至180万,同时提供最大120Gbps的存储带宽。无论是实时数据分析,还是高并发数据访问,C9实例都能以卓越的性能满足企业需求。 此外,C9实例将单个虚拟机支持挂载的云盘数量从60块提升至192块,单虚拟机存储容量可达数PB级别,为需要处理海量数据的业务场景提供了更大的灵活性和可扩展性,助力企业释放数据价值。 网络性能升级,打造流畅业务体验 C9实例网络性能较上一代提升100%,最大内网带宽240Gbps,网络包转发能力最高可达8000万。基于华为云QingTian软硬协同卸载技术,C9实例提供更加普惠的低时延、高性能vRoCE网络。对于网络性能要求极高的实时交互场景,例如游戏服务器、科研计算集群等,C9实例均能够带来流畅、稳定的网络体验。 高可靠性设计,保障业务无忧运行 C9实例引入内存热备技术,内存故障秒级切换备份,能够有效降低物理服务器宕机概率,确保业务连续性。同时,依托华为云瑶光智能调度系统提供反亲和性组、故障域等故障自动隔离技术,通过多重冗余设计,避免单点故障导致的业务中断。 安全可信,守护核心数据安全 C9实例基于TPM可信根构建从硬件到软件的防篡改机制,支持虚拟机vTPM和安全启动,对于已经使用TPM功能的应用无需改造,可以轻松迁移上云。 通过QingTian Enclave技术为敏感数据提供机密计算环境,以及传输链路加密、云盘加密、访问控制、安全审计等多重防护机制,C9实例为企业核心数据构筑全方位安全防护体系,满足金融、政务等对数据安全要求极高的行业需求。 即刻体验,开启云端创新之旅 华为云通用计算增强型云服务器C9实例现已开放公测,诚邀广大企业客户和开发者开通体验。访问华为云官网,了解更多C9产品信息并申请公测资格!
套刻精度解读 套刻精度(OverlayAccuracy)的基本含义时指前后两道光刻工序之间彼此图形的对准精度(3σ),如果对准的偏差过大,就会直接影响产品的良率。对于高阶的光刻机,一般设备供应商就套刻精度会提供两个数值,一种是单机自身的两次套刻误差,另一种是两台设备(不同设备)间的套刻误差。 套刻精度的具体指标 On Product Overlay (OPO):产品上的套刻精度,通常要求在3nm以内。 Dedicate Chuck Overlay (DCO):同一台设备自己套自己的精度,要求在1.6nm以内。 Mix-and-Match Overlay (MMO):不同设备之间的套刻精度,要求小于2.5nm。 光刻机是一个非常庞大的光学系统,任何内部或者外部微小的差错都会影响最终效果,光的世界里,错了就是错了,有误差就是有误差。 那么如果是同平台,同光源波长放一起做比较,那么影响精度最主要的原因,则是在线量测精度和双工件台运动精度。双工件台,也就是ASML的独门绝技 “TWINSCAN”平台技术,让ASML保持竞争力的最大秘诀!图案在被曝光到晶圆前,必须对晶圆进行精准量测。量测和曝光都需要时间,为了减少每个过程需要的时间提升效率,为什么不在曝光一个晶圆的同时,对后一个晶圆开始进行量测和对准工作呢?就这样,TWINSCAN系统诞生了,TWINSCAN系统:一个负责前期对准量测,另外一个负责曝光TWINSCAN是第一个也是唯一一个具有双晶圆工作平台的光刻系统。晶圆被交替地装载到TWINSCAN平台上,当一个平台上的晶圆正在曝光时,另一个晶圆被装到二号平台进行对准和测量,然后两个平台交换位置,原来在二号平台的晶圆进行曝光,而一号平台的晶圆完成卸载。然后,新的晶圆被装载,进行对准和测量工作。这种量测对准和曝光同时进行的并行方案能极大提高光刻机单位小时内的产能,这帮助台积电们极大提高生产效率,提升最终效益。 2001年,首个采用这种革命性技术的TWINSCAN双晶圆平台系统出货了——TWINSCAN AT:750T型光刻机。750T型光刻机使用的是波长为248nm的KrF光源系统,支持130nm工艺的生产。不久,ASML的i线光刻机也引入了双晶圆平台,即TWINSCAN AT:400T;随后这项技术又引入到更高端的193nm的ArF光刻机上,即TWINSCAN AT:1100。因此从i线到KrF线,TWINSCAN系统跨越ASML各个平台型号的光刻机,扩大了技术范围,让所有芯片层都能在新平台上曝光。ASML的持续创新能力为TWINSCAN平台的分辨率、套刻精度和产率提供了渐进式的改进——以平台升级、新系统升级和现场升级等不同方式,总之客户怎么舒服怎么来。 因此双工件台的运动精度在某种程度上,是光刻机对准精度的关键中的关键! 解双工件台的工作过程也让人感觉到不可思议,这就是科技的力量。它们每时每刻都在高速运动,静止的状态瞬间急加速然后瞬间急停下达到的它应该停的位置上,精确度令人叹为观止。如果按照瞬间的加速度算,已经超过火箭发射升空的速度,下一刻精准的停在位置上,不能出现任何差错,因为这种速度下任何差错都没办法弥补。错了虽然不至于整片晶圆报废只能重来,但是这样差错多几次,赶紧跑路吧,工程师直接提着40米大刀来砍人了。双工件台就这样加速-急停-加速-急停,不断重复这一过程,同时保持长期稳定工作的状态。因此双工件台这套系统某种意义上讲,决定了光刻机最大产能,以及它的精度,在光刻机的世界里这个叫Overlay——套刻精度。以NXT 1980Di为例,官方给的参数是DCO≤1.6nm,MMO≤2.5nm。除了这两个机器参数之外,实际工艺参数叫OPO,这个大概是3nm。 OPO是On Product Overlay的意思,产品上的套刻精度,因为芯片制造工艺有点类似盖楼的过程,相当于上次曝光和现在的对齐精度,这个精度是3nm以内,这个OPO和使用者水平有关系。DCO是Dedicate Chuck Overlay的缩写,相当于同一台设备自己套自己的精度,这个是1.6nm以内。MMO是Mix-and-Match Overlay的缩写,相当于不同设备之间的套刻精度,这个可以做到小于2.5nm。 还记得多曝工艺吗?多曝工艺其中有很重要的一步,就是把原本一块掩膜板图形,拆分两块分两次曝光,以此来得到更小的图形。显然,不管是OPO还是DCO,还是MMO,这几个参数共同决定了你能不能用多曝工艺,以及量产之后的曝光图形的一致性,和上下层最终的对准精度。如果不管是哪个参数不够看,那么多次曝光做出来的图形,一定是歪歪扭扭,惨不忍睹,一塌糊涂,别说良率了,估计整个晶圆都得报废。 所以双工件台,从某种程度上来讲,是除了光源,物镜系统之外,最重要的关键部件。它的稳定性,对准精度,平均无故障运行时间直接影响着光刻机的实际工作状态,甚至影响整个FAB的工艺水平和产能。 因此一片晶圆上需要曝光多达数百个单元(Field),而先进的光刻机一个小时能曝光超过300片硅晶圆,同时保证每一次曝光量都是相同的。假设一片12英寸晶圆上有300个单元面积需要曝光,那么相当于一天曝光2160000次,一年788400000次,双工件台以及整个设备的稳定性和效果一致性是个巨大的考验,
氟化氩就指的是一种气体 氟化氩气体,俗称ArF气体,是由氩和氟组成的化合物,无色无味,具有高化学稳定性和反应活性,在光刻和半导体行业中,它用于深紫外光刻工艺,实现高精度分辨率。氟化氩气体推进了多种工业的技术革新,是准分子激光设备中激光发生器的关键气体。 氟化氩气体是通过在受控条件下将氩气 (Ar) 与氟气 (F2) 结合而产生的。所得ArF气体是一种无色无味的物质,具有很高的化学稳定性和反应活性。它以其对紫外线 (UV) 的强烈吸收而闻名,特别是在深紫外线 (DUV) 范围内。在光刻和半导体行业中,ArF 气体用于一种称为深紫外光刻 (DUV 光刻) 的工艺,以在集成电路制造过程中在硅晶片上创建复杂的图案。 ArF 气体的高紫外线吸收能力可实现精确且精细的分辨率,从而可以生产更小、更强大的微芯片 光刻机,按照不同的用途及光源有多种分类,现在大家说的主要是紫外光刻机,我们这里提到的主要有DUV深紫外光及EUV极紫外光,DUV光刻机是目前大量应用的光刻机,波长是193nm,光源是ArF(氟化氩)准分子激光器,从45nm到10nm工艺都可以使用这种光刻机,而EUV极紫外光波长是13.5nm,EUV光刻机主要用于7nm及以下节点。 氟化氩的光波长有193nm,在某种方式下可以完成7nm制程工艺的电路刻画,但要想更加精细,就非常困难了。所以,国内的芯片厂家7nm以上制程工艺的芯片是可以生产的,但要想继续精细制程工艺,就没有办法了。 根据瑞利准则公式和实践结果,193nm光刻机的分辨率是波长的三分之一,能用来做65nm的芯片。浸润式光刻机的134nm波长,按规律可以做45nm的芯片。但是镜头在水里效应提升,又通过OPC补偿算法 (光罩上图形的角上,弄成特定的复杂形状而非原来的方形,最终成像反而会更接近方形) ,最终分辨能力提升到了28nm。这就是经典的28nm芯片的由来,坊间有所谓“28nm光刻机”的说法,其实是193nm的光源。 28nm及以上制程的传统芯片,里面的晶体管是MOSFET,可以理解为一种平面的晶体管,有个控制门Gate,从上往下这“一个方向”施加电压,控制晶体管的0-1导通状态。28nm指的是Source和Drain两个栅极之间的宽度,整个晶体管有100nm以上这么宽。 FINFET晶体管就升级成“立体”的,比MOSFET的一个方向的平面影响要灵敏,所以FINFET晶体管的功耗更低、主频更快。但是这个晶体管,就要象鱼鳍一样,造出往上伸出的薄薄的fin,工艺要复杂多了。FINFET晶体管在wafer上也还是一层,并没有堆出几层来,众多晶体管还是平面排列的,只是fin是立体结构对控制电压敏感了。 用DUV浸润式光刻机和FINFET晶体管工艺,可以造7nm-14nm制程的芯片。主要的办法是多重曝光,最多是四重曝光。简单地比喻,先在wafer上造出28-28-28-28nm这样间隔的线条,然后挪动14nm,再来做一套28-28-28-28nm间隔的线条,就能用双重曝光组合出14-14-14-14nm间隔的线条。如果四重曝光,就能组合出7-7-7-7nm间隔的条纹。当然这只是类比,实际要复杂得多,但是基本原理就是把本来一张光罩做的事,拆成很多张光罩来做。到7nm,工艺就非常麻烦了,光罩数量需要非常多,但是业界优秀的公司居然真的用DUV光刻机实现了7nm芯片量产。 值得注意的是,28nm及以上的传统芯片,它的“制程”是实打实的,说28nm真实栅极距离就是28nm。而先进芯片的7nm-14nm,包括再往下的5nm、4nm、3nm芯片,栅极宽度并不是标称的值。各家制造芯片的公司各自声称,根据功耗等性能指标的改进,按摩尔定律算出来一个“等效面积” (PPA,Power Performance Area) ,说是7nm,实际测量可能是10nm。英特尔说的10nm工艺就是实在的,说是10nm,指标相当于别家的7nm了。 可以看出,用DUV光刻机来做7nm芯片,已经“穷尽”了招数,才能用193nm的光源,得到7nm的效果。浸润式、镜头改进、OPC补偿、多重曝光、晶体管立体化、等效面积,这才从193nm光源形式上实现了7nm的效果。用DUV光刻机加工先进芯片,工艺非常麻烦,良率低、成本高。
IDEA研究院张宏波团队研发的编程语言Moonbit在国外引发热潮 根据介绍,MoonBit (月兔)专为云计算、边缘计算设计,是一个用于云计算和边缘计算的 WebAssembly 端到端编程语言工具链,集开发、编译、测试、部署于一体 —— 涵盖了通用程序语言设计、编译器、构建系统、IDE、部署工具等。在语言设计、编译器和构建系统上实现高度的垂直整合,为用户提供更佳的开发体验和性能,致力打造未来世界级的基础软件生态。 主要优势 生成与现有解决方案相比显著更小的 WASM 文件 更高的运行时性能 先进的编译时性能 简单但实用的数据导向语言设计 相比于主流语言,Moonbit 具备后发优势,如基于 Webassembly 设计同时支持多后端,生成代码的性能高、体积小。Moonbit 还具备高效的增量式代码解析和类型检查;多范式编程,函数式内核 + OOP 风格;多层次的中间代码优化;低延迟的智能化 IDE 等特性。未来,Moonbit 计划新增 Trait system,高效稳健的内存管理和垃圾回收机制等机制,完善标准库 + 生态,提供更好的 FFI 调用机制,结合 AIGC 技术等。 MoonBit(月兔)由粤港澳大湾区数字经济研究院(IDEA 研究院)基础软件中心负责人张宏波领导的团队开发,目标是打造下一代智能开发平台。 张宏波本人不仅为多种编程语言做出了贡献,包括 OCaml、ReScript(原 ReasonML/BuckleScript)和 Flow,还曾是 Rescript 语言工具链几乎所有关键组件的作者,包括高速编译器、标准库以及构建系统等。 MoonBit 目前处于 Pre-alpha 阶段,属于实验性质。大家可以在 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Ftry.moonbitlang.com&urlrefer=cccc731e7293b13d8b5300aead5a6622 获取 IDE 环境,无需安装任何软件,也不依赖任何服务器。 文档:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fgithub.com%2Fmoonbitlang%2Fmoonbit-docs&urlrefer=a2c5eb7edd013e1a8d188dcc8a95b7d4 MoonBit 负责人张宏波称,MoonBit 编译器预计在 2024 年第二季度末达到 Beta 状态,到时将会正式公开。
世界首颗AI全自动设计CPU 中科院计算所等机构推出了世界首个完全由AI设计的CPU芯片,不仅比目前GPT-4所能设计的电路规模大了4000倍,而且性能也达到了与Intel 486相当的水平。 中科院计算所的处理器芯片全国重点实验室及其合作单位,用AI技术设计出了世界上首个无人工干预、全自动生成的CPU芯片——启蒙1号。 这颗完全由AI设计的32位RISC-V CPU,相比GPT-4目前所能设计的电路规模大4000倍,并可运行Linux操作系统,且性能堪比Intel 486。 而这项研究,更是有望颠覆传统的芯片设计流程! 为了减少人力和资源投入,研究人员采用AI技术直接从测试用例的输入-输出(IO)自动生成CPU设计,无需工程师提供任何代码或自然语言描述。 该方法在5小时内生成了超过4,000,000个逻辑门的32位RISC-V CPU——启蒙1号(见图1),比目前GPT-4所能设计的电路规模大4000倍。 该CPU于2021年12月流片,回片后成功运行了Linux操作系统和SPEC CPU 2000程序,其性能与Intel 486 CPU相当。 启蒙1号是世界上首个无人工干预、全自动生成的CPU芯片。该方法甚至自主地发现了包含控制器和运算器等在内的冯诺依曼架构,为后续发现人类未知的体系结构优化知识提供了参考。 可以看出,相关工作主要聚焦于生成单个模块或小规模CPU,其规模与实际CPU芯片还有多个数量级的差距。 中科院计算所团队及其合作单位(包括中科院软件所、中科大、寒武纪公司等)所提出的方法生成了超过4,000,000个逻辑门的完整RISC-V CPU,相比目前GPT-4所能设计的电路规模大4000倍。 同时,该工作在符号主义的框架下从理论上保证了功能正确性,颠覆了传统流程中的逻辑设计和功能验证环节。 未来,通过符号主义、行为主义及连接主义等不同人工智能路径的交叉探索,自动生成的CPU有望在5年或10年内达到甚至超越人类专家所设计的CPU,彻底颠覆现有的芯片设计流程。
计算产品基础算力测试基准工具CPUBench 计算产品性能基准测试是支撑计算产品性能迭代优化、牵引计算产业能力提升的重要工作。为了推动计算产品性能基准工具在市场中的应用,计算产品性能基准工作组在线上组织召开“计算产品基础算力测试基准工具CPUBench宣讲会”,本次宣讲会由中国电子技术标准化研究院主办,中国电子工业标准化技术协会新一代计算标准工作委员会、开放计算标准工作委员会承办,绿色计算产业联盟(GCC)协办。中国电子技术标准化研究院信息技术研究中心陈海针对基础算力基准工具CPUBench工作进展进行了介绍,集成电路测评中心钟伟军博士针对基础算力基准工具CPUBench的设计、测试与分析进行了详细阐述。 为准确评估计算系统的真实性能,解决传统性能基准工具存在的问题,弥补国内在性能测试技术研究及基准工具研制方面的经验不足,由处理器厂商、整机厂商、评测机构及学术机构在2020年共同成立了计算产品性能基准工作组。经过较长时间的研究、设计、开发、验证等阶段,工作组于2021年世界计算大会上完成了计算产品基础算力测试基准工具CPUBench的发布,当前工作组成员单位也已突破80家 计算产品基础算力测试基准工具CPUBench定位于对通用计算场景下的CPU、内存子系统以及所依赖的编译器进行综合计算能力评估。考虑到多种计算架构平台的性能评测需求,目前已经移植到x86_64、aarch64、ppc64le、sw_64和loongArch64等指令集架构的处理器平台,覆盖飞腾、海光、合芯、鲲鹏、兆芯、龙芯、申威、超微、英特尔等不同单位处理器产品,可运行在Debian、KylinOS、openEuler、Redhat、SUSE、UOS等基于Linux的操作系统,兼容AOCC、BiSheng、Clang、GCC和ICC等编译环境。计算产品基础算力测试基准工具CPUBench安装包提供针对不同指令集架构的内置依赖库,简化测试环境部署过程,提高了工具的易用性。 计算产品基础算力测试基准工具CPUBench的测试负载选择考量了诸多因素,首先,测试负载应来自于实际的应用场景,具有较高的业界认可度和影响力。其次,还要综合评估各负载于多架构平台的移植成本、计算密集程度、编程语言、稳定性、公平性、知识产权等因素。另外,基准工具整体的微架构特征覆盖度、业务领域覆盖度、不同负载之间的差异性同样作为重要的选择依据。基于原始业务应用,设计并实现一个可用的测试负载也是一个复杂的过程,不光要移除掉除业务核心计算逻辑外的其他代码部分,如网络、图形、I/O操作、依赖于特定架构的汇编代码等,同时要为裁剪后的负载设计输入数据集,并确保运行时长在合理范围内。最后要基于一系列不同的测试环境进行测试验证,考察裁剪后负载的稳定性、兼容性、可重复性、资源利用率、微架构特征等指标。 当前,计算产品基础算力测试基准工具CPUBench已经正式进入市场应用推广阶段。2022年8月,工作组正式面向全行业启动测试报告提交活动,得到积极响应。活动中共计收到30余家单位报名,参测机型达40余款,基本覆盖业界主力销售产品;生成有效测试报告200余份。首批测试数据在计算产品性能基准工作组网站已完成发布,相关单位包含众多国内优秀服务器整机厂商,如新华三、超聚变、宝德、同方、百信、长江计算、广电五舟、华鲲振宇等单位,中国移动研究院作为客户单位也提交了部分测试结果,上述结果可为行业和用户提供高价值选型参考和前瞻性指引。 后续,工作组将持续发布经各单位提交的不同产品有效测试报告,并在官网汇聚成性能数据库,帮助客户选型、牵引产品性能提升。工作组也将积极推动测试报告进入运营商集采、金融、电力、信息创新等重要市场项目,打通研究-标准-工具-认证-商业项目路径,形成产业链条闭环。 在工作组的长期推动下,性能基准作为牵引计算产业高质量发展的抓手已凝聚为各方共识。未来,工作组将持续支撑计算产品性能迭代优化,构建芯片、单机、集群、数据中心全栈式计算产品性能基准标准体系,推动工具在重点行业领域深度应用,吸引产学研用单位广泛参与,完善性能评价及基准生态,为促进计算产业全链条健康有序发展提供抓手。 计算产品性能基准工作组(Computing Product Performance Benchmark Workgroup,简称“CPPB WG”)主要针对计算产品性能基准需求,开展计算产品性能基准顶层设计,建设和维护计算产品性能基准标准、测评工具和运营体系,积极开展应用推广。
信创全景图 一、信创简介 2016年3月4日,24家专业从事软硬件关键技术研究及应用的国内单位,共同发起成立了一个非营利性社会组织“信息技术应用创新工作委员会”,简称“信创工委会”,这就是“信创”这个词的最早由来。 信创是信息化应用创新的简称,是指硬件(芯片、服务器等)和软件(操作系统、中间件、数据库等)一系列信息化创新技术,也可以理解为数字基建,属于新基建最底层的一环。 2018年开始美国就对中国科技企业实行高科技出口管制,实现技术“卡脖子”政策,受国际环境影响,在国家政策的大力支持下,信创就开始在全国范围内加速落地。各地方政府为跟紧政策要求,促进当地高新技术发展,相继出台了信创相关政策。 2020年被称之为“信创产业元年”,因为是信创产业开始全面爆发和整体布局关键年; 2021年,信创产业逐步走向应用落地阶段,政策扶持力度持续加强;2022年是信创三年全面推广阶段的收官之年,也是明晰下一阶段发展方向的重要时刻。 2022年10月7日,BIS(美国商务部工业安全局)宣布了对美国《出口管理条例(CCL)》的一系列修订,严格限制了中国企业获取高性能计算芯片、先进计算机、特定半导体制造设施与设备以及相关技术的能力,31家中国企业被列入未经核实清单,限制其使用美国设备、技术,以及雇佣美籍员工。对国内相关产业链造成打压,也显示出我国对关键基础技术自主可控的意义。 从长远看,今后5年将是信创的关键时期和高速扩张的时期。预计2023年起金融、电信和电力等8个关键行业国产化步伐将加快。针对信创产业,国家提出了“2+8+N”体系,并按照这个顺序逐步实现国产化替代。“2”是指党、政。“8”是指关于国计民生的八大行业,即金融、电力、电信、石油、交通、教育、医疗、航空航天。“N”则指的是汽车、物流等各行各业。作为信创起步最早的领域,党政部门在 2013 年便从电子公文系统开始信创起步试点,当前党政市级以上公文系统的信创改造已经进入收尾阶段,而后有望进一步纵向下沉至区县乡镇,横向拓展电子政务系统改造。有专业人士预测,2023年央企的办公OA系统国产化率将达到50%;网安和数据中心等基础设施类系统国产化率达到30%;ERP等经营管理类系统国产化率达到20%;核心业务系统将开始试点。到2025年底,央企的办公OA系统将实现100%国产化;网信安全和基础设施、经营管理类系统国产化比例达到50%。 发展至目前,信创主要包含硬件和软件两个大方向,总市场规模超万亿: 【硬件】芯片、存储器、服务器、整机等; 【软件】系统软件(操作系统、数据库)、中间件、应用软件、安全软件等。 二、信创理事会单位 信创理事会主要由四类单位:集成厂商、互利网厂商、第三方机构、高等院校,他们主要负责审核后续加入的信创成员单位资质,制定信创标准规范。 【集成厂商】10家:中国软件、太极股份、航天信息、浪潮软件、东华软件、神舟航天软件、东软集团、神州信息、同方股份、华宇软件; 【第三方机构】4家:国家工业信息安全发展研究中心、中国电子技术标准化研究院、工业和信息化部电子第五研究所、中国电子信息产业发展研究院; 【互联网厂商】3家:阿里云、金山软件、华为技术; 【高等院校】2家:北京航空航天大学、北京理工大学。 三、信创会员单位 会员单位共有14大类,共计主要180家成员单位,近年来也有不少的新的企业加入。 【芯片厂商】12家:天津飞腾、龙芯中科、国科微、盛科网络、上海兆芯、东土科技、海光信息等; 【系统集成厂商】17家:长城软件、太极信息、万达信息、南威软件、华胜天成、榕基软件、中电兴发等; 【整机厂商】24家:中国长城、浪潮信息、中科曙光、长城超云、联想长风等; 【操作系统厂商】15家:中标软件、深之度、天津麒麟、中科方德、普华基础软件、一铭软件等; 【数据库厂商】12家:瑞中数据、武汉达梦(中国软件)、神州通用(航天科技)、人大金仓(太极股份)等; 【中间件厂商】5家:东方通、金蝶天燕、中创软件、宝兰德、普元信息 【流版签厂商】11家:无锡水中、安证通、福昕软件、数科网维、书生电子、方正国际软件、金格软件等; 【外设固件厂商】7家:奋图电子、中嘉集团、世纪影源、百数软件、立思辰、中电科技、光电通信; 【安全厂商】25家:卫士通、中孚信息、深信服、启明星辰、龙脉科技等; 【网络厂商】4家:紫光集团、星网锐捷、迈普通信、仰联网络; 【互联网厂商】6家:三六零、腾讯云计算、华云数据、优刻得、拓尔思、恒生电子; 【存储厂商】15家:鸿泰科技、紫晶信息、网有科技等; 【应用软件厂商】21家:科技(太极股份)、超图软件、北塔软件等; 【第三方机构】6家:中国信通院、中国国信信息总公司等
包云岗:RISC-V开始进入高性能领域 4月27日,在“第六届数字中国建设峰会 云生态大会”期间举办的“技术论坛”上,北京开源芯片研究院首席科学家包云岗表示,以RISC-V为代表的开源技术,逐渐带给整个芯片领域新活力。 麻省理工学院将RISC-V评为《MIT科技评论》2023年十大突破性技术,指出“芯片设计正走向开放,灵活、开源的RISC-V有望成为改变一切的芯片设计。” 包云岗介绍,几十年来,处理器指令集均属于公司私有,或无法获取,或需授权费。2010年,UC Berkeley开始开发一套开放免费的指令集RISC-V,得到了全球响应。 在包云岗看来,RISC-V这种开源、开放、共建、共享的处理器芯片生态,核心理念与通信技术的发展模式相同,标准规范和产品实现分离。“全世界共同制定标准,各国企业根据标准自主实现产品。可以在标准层面上进行博弈和竞争,也可以在产品层面进行市场竞争。这也意味着,谁投入多,贡献大,其主导权大。” 与此同时,还要进一步推动开源芯片的生态,包括了开源指令集、开源设计实现、开源工具和开放流程等方面。目前,RISC-V国际基金会得到快速发展,已有全球70多个国家,3000多个会员参与其中。 包云岗,在生态的推动之下,RISC-V应用正在全球快速增长。相关数据显示,RISC-V出货量已超过100亿颗,预计2020年-2025年增长率达115%,RISC-V应用数量将增至850亿颗。 与此同时,RISC-V开始进入高性能领域,软件生态正加速发展。中美企业正在研发高性能RISC-V处理器,总体处于第一梯队。国内初创企业数量远大于美国,产品主要集中在MCU级。 “开源芯片,赋能新产业;开源芯片,普惠世界。”包云岗表示,开源芯片是构建全球芯片共同体,解决全球科技供应链安全和实现科技普惠世界的有效途径。
信通院李文宇:指令集是芯片生态基础,本身受版权保护 2022/6/22 16:19 C114讯 6月22日消息(林想)在今天召开的2022年科技周暨移动信息产业创新大会上的拥抱RISC-V分论坛上,中国信息通信研究院知识产权与创新发展中心主任李文宇表示,指令集是芯片生态的基础,本身受版权保护。指令集是计算机抽象模型的一部分,它是用一些代码表达读、写等操作,命令计算机做各种运算的一套标准。指令集则是一系列命令语言,是一种机器语言的具体表达形式,但没有体现具体的实现方法、步骤。李文宇指出,ISA本身受版权保护,但不受专利保护,例如龙芯公司获得MIPS指令集的永久性授权,并在此基础上扩展,开发出了Loogisa。 李文宇指出,指令集是连接软件和硬件的纽带。“无论是应用程序还是操作系统中,代码最终被编译成可以在CPU芯片内部执行的符合指令集规范的机器代码程序。” 此外,指令集是芯片生态的划分依据。指令集是系统软件和硬件工程师共同遵从的特定发条,只有遵守了这个发条,软件工程师编写的软件才能在不同型号的整机系统上运行,硬件工程师开发的整机系统才能运行现有的应用软件。 在谈到指令集、微结构、IP核时,李文宇指出,微结构将一种给定的指令集架构在处理器中执行的方法或物理实现。微结构是决定CPU的性能、成本和功耗最主要的因索,是CPU最核心的技术。 “微结构设计得越好,单位时间内调用的指令数量(IPC)越多,CPU的性能就越好;微结构好坏则取决于前端设计水平,前端设计主要指芯片的执行结构、数字逻辑层设计、执行状态仿真等方面,后端设计主要指物理层电路的具体优化,包括单元布局、时序优化等方面。” IP核也叫做知识产权核。IP和是指已验证、可重复利用、具有某种确定功能的设计芯片模块,或者说是一部分固定的微架构模块,CPU设计中可以引入多种IP核。 李文宇指出,微结构和其上层的实现受多种方式的知识产权保护: IP核基础上新成特定产品的具体实现,共同构成了整个芯片体系,从而使芯片具备一系列特定功能和算法。 微结构和上层实现对应计算机指令系统的执行过程,一般包括以下内容:提取指令、编译指令、计算机操作数存放的地址、提取操作数、执行命令、返回结构。 这两类IP中,包含了方法/步骤,符合专利法保护客体要求,如果同时满足新创性(新颖性+创造性+实用性)要求,可以申请专利,通过专利法主张权利。 微结构的表达方式是各类机器语言的代码,同时满足“具体表达方式”的要求,也符合版权法保护要求,在表达具有“独特性”的条件下通过版权/集成电路布图进行保护,可以通过版权法主张权利。 如果企业将微架构进行保密,通过对人/载体/空间的保密管理进行保护,在满足“非公知”的情况下也满足“商业秘密”保护条件,可以通过不正当竞争发进行权利主张。
晋华集成电路低调恢复生产 被美制裁停产四年后,华为的订单让福建晋华集成电路低调恢复生产 1月30日,日媒日经亚洲英文版报道了,在中国东南部的港口城市泉州,一家四年前因美国制裁而几近废弃的半导体企业的厂区悄悄地恢复了生机。 存储芯片制造商福建晋华集成电路有限公司 (JHICC) 在 2018 年底被美国制裁不得不停止运营。但在神秘的新客户出现后,该公司已逐步恢复生产。 与此同时,在福建晋华集成电路有限公司 (JHICC) 工厂的街对面,鲜为人知的芯片封装服务提供商渠梁电子正在 20 个足球场大小的场地上建造第二个生产设施。知情人士透露,该设施旨在满足同一顶级客户不断增长的需求。 “我们的大部分产品都是为华为生产的,”一名渠梁电子员工向日媒证实。“我们的员工队伍已经有大约 2,700 人,我们现在正在建设工厂的二期工程。” 10月7日晚间,美国商务部产业与安全局 (BIS) 发布了对华高端芯片以及遏制中国先进半导体制造能力等新一轮出口管制措施。 “这就像一场真正的战争,但没有子弹和导弹在天空中飞行而已。”由于美国的制裁,情况发生了变化,中国相关公司需要一个非美国控制的备用计划。 星源观察根据网络多个公开信源确认福建晋华集成电路有限公司 (JHICC) 已经低调的重新启动生产。 根据6月2日,福建省电子信息集团官网一则新闻可知,福建省晋华集成电路有限公司已经恢复运行。
倪光南聚焦开源RISC-V架构以全球视野谋划我国芯片产业发展 近日,中国工程院院士倪光南在数字世界专刊撰文指出,一直以来,我国芯片产业在“主流 CPU”架构上受制于人,在数字经济时代,建议我国积极抓住时代机遇,聚焦开源 RISC-V 架构,以全球视野积极谋划我国芯片产业发展。 倪光南表示,RISC-V精简指令集采用开源模式、其架构先进、易于定制、生态也尚处于发展初期,这为我国万物智联时代掌握芯片产业发展主动权提供了发展机会。建议我国积极抓住时代机遇,以全球视野谋划我国芯片产业发展,聚焦开源RISC-V架构,统筹规划、集中力量面向我国“主流CPU”领域,筑牢基础软件根基,加速推进其生态建设,推动全世界芯片产业新格局的到来。 这几年国产CPU发展很快,现在国内市场上已经有六七种CPU架构并存,倪光南认为,这并非长久之计。因为CPU架构具有很强的垄断性,长期以来,占据世界芯片主要市场份额的CPU(或称为“主流CPU”)只有x86和ARM两种架构,这种情况大概率还会持续下去。由此可见,目前多种国产CPU架构并存,未来可能会造成资源分散,低水平重复。如果不能及时改变这种状况,若干年后,中国将缺乏能在全球市场上与x86和ARM两家竞争的CPU架构,从而在“主流CPU”方面仍将受制于人。 倪光南强调,我国发展芯片产业时,要从全球视野谋划和思考国产CPU架构发展的技术路线。目前国内CPU技术路线大致有两种思路,值得商榷: 一种思路是“单打独斗”。“单打独斗”即主要依托本国架构进行发展。其好处是较易实现自主可控,并能满足国内若干应用领域的需求。但要在世界市场上与上述“主流CPU”相抗衡,我国CPU在技术方面,特别是在生态方面还存在着很大的差距,而这种状况不是凭主观愿望在短时期里所能改变的。作为对比,即使是新兴的、挟有众多后发优势的RISC-V架构也历经十多年“折腾”,才取得今天全球范围的繁荣发展。很难设想,一些有历史包袱的、较老的CPU,还能有足够时间和空间,从“主流CPU”激烈竞争的夹缝中脱颖而出。 另一种思路是“从众跟随”。即跟着外国的架构走。国内也有企业在基于x86、ARM、Power等外国掌控的架构进行发展,其好处是可以利用已经成熟的生态,但坏处是很难实现自主可控。当前国际环境错综复杂,归根到底随时可能面临ISA(指令集架构)知识产权的制约,难以规避各种制裁和限制。 倪光南在文中指出,开源RISV-V的出现顺应未来新一代信息技术的需求。RISC-V精简指令集采用开源模式、其架构先进、易于定制、人才培养便捷,研发周期短,大大降低芯片产业门槛,这些都使其后续发展具备强大生命力。鉴于上述情况,建议中国抓住新一代信息技术发展机遇,面向智能时代“主流CPU”市场,聚焦开源RISC-V架构发展中国芯片产业。用好开源模式,发挥中国举国体制、超大规模市场优势和人才优势,集中力量、协同攻关,大力发展壮大RISC-V产业生态,加大对RISC-V开源社区的贡献以增大社区话语权。最终,使世界“主流CPU”市场形成x86、ARM和RISC-V三分天下的格局。 关于聚焦开源RISC-V架构发展我国主流CPU的优势,倪光南认为主要包括四个方面:一是此举既符合国家科技自立自强发展战略又能推动全球科技创新;二是RISC-V已得到中国各界的支持;三是中国超大规模市场是培育未来新一代信息技术的沃土;最后,中国是世界最大工程师培育摇篮,采用开源模式的RISC-V十分有利于知识产权的传播和人才的培养,使中国人才优势能得到充分的发挥。 最后,倪光南强调,要从战略上用好开源模式,聚焦开源RISC-V架构,充分发挥我国超大规模市场优势和人才优势,统筹推进RISC-V生态建设,与世界开源同行协同努力,最终使RISC-V架构能在世界CPU市场与x86和ARM三足鼎立,通过增加对开源社区贡献的方式逐步将“主流CPU”发展自主权牢牢掌握在自己手中,同时为世界科技创新贡献中国智慧和中国方案。
第一台基于RISC-V芯片的超算亮相,表现惊人 来源:内容由半导体行业观察(ID:icbank)编译自nextplatform,谢谢。 一个欧洲大学生团队拼凑出第一台能够显示平衡功耗和性能的 RISC-V 超级计算机。 更重要的是,它展示了 RISC-V 在高性能计算和代理方面的潜在前进道路,为欧洲摆脱对美国芯片技术的完全依赖提供了机会。 “Monte Cimone”集群不会很快处理大规模的天气模拟等,因为它只是一台实验机器。也就是说,它确实表明,低功率包络的性能牺牲并不一定像许多人认为的那样戏剧化。 由博洛尼亚大学和意大利最大的超级计算中心 CINECA 的人员构建的六节点集群是更广泛的学生集群竞赛的一部分,旨在展示除浮点能力之外的各种 HPC 性能元素。名为 NotOnlyFLOPs 的集群构建团队希望在使用 SiFive 的 Freedom U740 片上系统时建立 RISC-V 的电源性能配置文件。 这个2020 年推出的 SoC 有五个 64 位 RISC-V CPU 内核——四个 U7 应用程序内核和一个 S7 系统管理内核——2MB 二级缓存、千兆以太网以及各种外围设备和硬件控制器。它可以运行到大约 1.4GHz。 以下是 Monte Cimone 的组件以及进给和速度: 六台双板服务器,外形尺寸为 4.44 厘米 (1U) 高、42.5 厘米宽、40 厘米深。每块板都遵循行业标准 Mini-ITX 外形尺寸(每 170 毫米 170 毫米); 每块主板配备一个 SiFive Freedom U740 SoC 和 16GB 的 64 位 DDR 内存,运行速度为 1866s MT/s,以及一个运行速度为 7.8 GB/s 的 PCIe Gen 3 x8 总线、一个千兆以太网端口和 USB 3.2 Gen 1 接口; 每个节点都有一个 M.2 M-key 扩展槽,由操作系统使用的 1TB NVME 2280 SSD 占用。每块板上都插有一张 microSD 卡,用于 UEFI 启动; 每个节点内部集成了两个 250 W 电源,以支持硬件和未来的 PCIe 加速器和扩展板。每个节点的俯视图,显示了两个 SiFive Freedom SoC 板 Freedom SoC 主板本质上是 SiFive 的 HiFive Unmatched 主板。正如大多数超级计算机使用的那样,六个计算节点中的两个配备了 Infiniband 主机通道适配器 (HCA)。目标是部署 56GB/s Infiniband 以允许 RDMA 勉强实现 I/O 性能。 这对于一个年轻的架构来说是雄心勃勃的,而且并非没有一些小问题。“供应商目前仅支持 PCIe Gen 3 通道,”集群团队写道。 “第一个实验结果表明,内核能够识别设备驱动程序并挂载内核模块来管理 Mellanox OFED 堆栈。由于尚未确定软件堆栈和内核驱动程序的不兼容性,我们无法使用 HCA 的所有 RDMA 功能。尽管如此,我们还是成功地在两个板之间以及一个板和一个 HPC 服务器之间运行了 IB ping 测试,表明完全支持 Infiniband 是可行的。这是目前正在开发的功能。” 事实证明,HPC 软件堆栈比人们想象的要容易。“我们在 Monte Cimone 上移植了在生产环境中运行 HPC 工作负载所需的所有基本服务,即 NFS、LDAP 和 SLURM 作业调度程序。将所有必要的软件包移植到 RISC-V 相对简单,因此我们可以声称将 Monte Cimone 暴露为 HPC 设施中的计算资源没有任何障碍,”该团队指出。 虽然它是对超级计算行列的一个值得注意的架构补充,但像这样的 RISC-V 集群不太可能进入世界上最快系统的 500 强名单。它的设计规范是低功耗的主力,而不是浮点怪物。 正如开发团队在对系统的详细描述中指出的那样,“Monte Cimone 的目标不是实现强大的浮点性能,而是为了“启动管道”并探索集成多节点的挑战而构建的。RISC-V 集群能够提供 HPC 生产堆栈,包括 RISC-V 硬件上的互连、存储和电源监控基础设施。” E4 Computer Engineering 担任“Monte Cimone”集群的集成商和合作伙伴,该集群最终将成为这将为进一步测试 RISC-V 平台本身及其与其他架构良好配合的能力铺平道路,这是一个重要元素因为至少在未来几年内我们不太可能看到百亿亿级的 RISC-V 系统。 根据 E4 的说法,“Cimone 使开发人员能够在丰富的软件堆栈中测试和验证科学和工程工作负载,包括开发工具、消息传递编程库、BLAS、FFT、HS 网络驱动程序和 I/O 设备。目标是实现一个面向未来的位置,能够解决和利用 RISC-V ISA 的功能,用于科学和工程应用以及操作环境中的工作负载。” CINECA 的 HPC 专家 Daniele Cesarini 博士:“作为一个超级计算中心,我们对支持科学界的 RISC-V 技术非常感兴趣。我们很高兴能为支持安装和调整广泛使用的科学代码和数学库的 RISC-V 生态系统做出贡献,以推动高性能 RISC-V CPU 的开发。我们相信 Monte CIMONE 将成为下一代基于 RISC-V 技术的超级计算机的先驱,我们将继续与 E4 计算机工程和博洛尼亚大学协同工作,以证明 RISC-V 已准备好继续留在高性能计算巨头的肩膀。” 欧洲有大量的 RISC-V 资金和项目,尽管这些努力的成果可能需要数年才能看到。现在,就连英特尔也在关注超级计算的未来。这完全是一个 RISC-Y(你看到了即将到来的)赌注,但在欧洲很少有本土建筑选择,至少挑选一个早期的赢家很容易。
我国首个极大规模全异步众核芯片流片试生产成功 近日,由兰州大学信息科学与工程学院团队自主研发设计的我国首个极大规模全异步电路芯片流片试生产成功。 这张圆片上的每一个小方块芯片就是一个独立芯片。它是兰州大学异步电路与系统团队设计的全异步众核芯片,采用40纳米制程,在96平方毫米的面积里集成了1512颗计算单元3.5亿个晶体管。 兰州大学这支研发团队成立于2013年,当时国内异步芯片研发还处于起步阶段,针对异步电路的系统性研发不足。多年来,团队持续从方法学、异步芯片设计、辅助软硬件工具等三大研究领域的 90 个研究环节开始了系统性研发,目前初步形成了完整的异步电路芯片设计知识链。 今年三月,中国半导体行业协会发布统计数据,2021年我国集成电路产业销售额达到了10458.3亿元。其中设计业占比达到了43.21%,高于制造业和封装测试业。目前我省集成电路产业链中,制造和封装测试都有一定的产业规模,芯片设计能力很弱。此次兰州大学研究团队的研发成功将有望补齐我省产业链的短板。 甘肃台报道。 甘肃广电总台全媒体记者:李嘉昕,侯树环,岳辉,罗旭 视频地址:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.ixigua.com%2F7098663900136571399%3FlogTag%3D93a5d808769430689421&urlrefer=890655dafbc650b4666441e5f3c47b30
RISC-V面临的挑战 RISC-V International首席执行官Calista Redmond与eeNews Europe的Nick Flaherty谈论了RISC-V面临的挑战。RISC-V基金会成立于2015年,有29个成员,而RISC-V国际总部设在瑞士,现在有超过2000个成员... 对于所有这些成员,其中一个挑战是碎片化的风险,RISC-V是微控制器和微处理器的开放指令集,很容易添加扩展,但这可能导致许多不同的版本不兼容。RISC-V国际有超过60个任务组,今年增加到75个,工作在不同的领域,包括扩展定义、应用程序参考设计和工具生态系统。 她说:“对我们来说,重要的一件事是尽早找到有共同点的领域,并经常将这些领域纳入任务小组。”“如果四家不同的公司发现了(市场上)相同的差距,我们如何让它们坐到同一条船上,以汇集资源?”让我们不要从基础构建模块中盈利,他们还有足够的空间去添加自己的秘密来源。” 她表示:“我们在创建这些扩展时使组织和纪律越强大,分裂的风险就越低。” 她说:“我们需要在每一个途径、堆栈和底层硬件方面持续吸引有兴趣的利益相关者,为特定行业提供参考的实现想法。”“然后你就可以按照标准、安全等其他可参考的方面进行建造。” 雷德蒙德表示,目前吸引人们兴趣的领域之一是人工智能和数据中心加速器。他于2019年3月加入盖茨基金会,此前他在IBM工作了12年,最近担任IBM Z数据中心和人工智能生态系统副总裁。 “增长有很多不同的方面——我们正试图从高性能计算(HPC)、企业和云处理中借鉴能力。他们在寻找竞争优势。”“如果你开始通过非关键应用(如人工智能增强)的侧门引入RISC-V,那将是一个令人兴奋的前沿。 这可能已经盖过了嵌入式微控制器核心的开发。 “我们在实时操作系统(RTOS)方面投入了大量精力,并与包括Zephyr在内的主要RTOS供应商密切合作,”她说,“在物联网(IoT)领域,一些更大的处理技术正在引起人们的关注。” 她表示,美国、欧洲和亚洲对这项技术的接受程度相当。 “我不能说欧洲在采用RISC-V方面处于最前沿,但汽车公司和研究机构在巨大的公共和私人支持下取得了令人难以置信的成就。(瑞士的)ETH和(西班牙的)巴塞罗那超级计算中心是基础基金会组织,”她表示。 “随着时间的推移,我们继续看到约三分之一的美国、欧洲和亚太地区。我们正开始在印度和日本等更多地区稳步增长,但这比中国的快速增长要慢。” 贸易制裁 她不认为美中之间的贸易限制有什么问题,尽管美国公司向中国出口设计工具受到限制。该技术的开源特性是一个关键优势。 “地缘政治风险为零,”她说。“开源技术的伟大之处在于它不受任何一家公司的控制,所以你不受任何一家公司的约束,也不受许可或设计限制。所以当你使用RISC-V时,有自由和灵活性,不存在你在其他情况下看到的供应链问题。这些制裁只对专利产品有影响,对公开产品没有影响。我们严格遵守所有这些法律,不允许任何保密的专有技术信息,即使是公共领域的开发。” 她表示:“拥有如此多的既得利益者意味着,每个人都需要做出符合组织最佳利益的决定,而不仅仅是一个商业团体的决定。”“我们有一些最强大的开源贡献 主权 她表示,欧洲对微处理器主权能力的追求也是一个关键推动因素。“看看欧盟委员会(EuropeanCommission)的开放硬件拨款吧。欧洲作为全球开源公民参与进来,帮助欧洲企业获得供应链和合作伙伴的选择,这很好。”Imagination Technologies、Codasip和Imperas等欧洲公司也一直在支持这项技术。欧洲项目也看到RISC-V被用于空间应用的主权供应链。 与此同时,英特尔(Intel)的代工业务也加入了该组织,为企业提供使用这项技术的渠道。但挑战依然存在。 “现在还不完美,”她说。“还有工作要做,还有障碍可以消除。考虑应用程序的工作负载是很重要的,我们正在加快架构和生态系统开发的步伐。这是一个挑战。我们有60个工作小组,今年可能会超过75个。有很多事情要做,我们需要保持跨生态系统合作的机会,这很重要。 她指出,支持RISC-V的开源工具和软件的开发是主要的挑战,然后说明并支持在高端和中间阶段的采用。然后是要有可靠的例子,参考跨行业特定的实现,如汽车。“这非常重要”。 来源:内容由半导体行业观察(ID:icbank)编译自eenewseurope,谢谢。
转发,龙芯有龙芯的角色,但它的生态链始终是问题 【本文由“吃嘛嘛香”推荐,来自《科工力量:龙芯二十年磨一剑,冲击科创板》评论区,标题为吃嘛嘛香添加】 龙芯的生态链始终是个问题,2021年的现在靠龙芯甚至中国自身是很难发展的。所以龙芯才会去兼容其他指令集。但是兼容其他指令集的本意是要靠兼容来扩展自己的市场,而不是为了兼容而兼容;就像鸿蒙兼容安卓,但是目的是让APP开发企业开发原生鸿蒙APP,早晚抛弃兼容安卓,至少兼容安卓绝对不是主体;而龙芯的原生指令集谁来支持?看看RISCV,谁听过RISCV去兼容X86 ARM了?龙芯可以保守的在军公教发展,可以作为中国芯片的最后一道防线。但是长期的在“全球生态链市场”的角度看,龙芯是不合格的。甚至从市场前景的角度看龙芯不如兆芯的X86;目前看如果不想依靠X86或者ARM,那么唯一能摆脱美国芯片霸权制约的只有RISCV,这个美国禁不了,全世界想要半导体自主的其他国家都只有靠RISCV,不仅仅是中国才想摆脱美国芯片霸权。。。所以鸿蒙的成败很重要。只有鸿蒙成功了,站稳了市场,才能想办法将鸿蒙由支持ARM转向支持RISCV。就像苹果这个巨无霸,芯片指令集转了很多次了,现在由X86转向ARM。RISCV现在刚刚起步,很多方面还处于空白,先入场就能取得先发优势,国内很多企业包括华为都在搞RISCV是必然的。 很多人太情绪化了。半导体产业之所以困难就在于是一个软件硬件相互结合才能发挥作用的产业。各种子系统密密麻麻相互纠缠,形成了半导体行业特有的生态链属性;这是其他工业产品无法见到的。而龙芯作为中国自己搞的指令集,不讨论性能特色等问题,本身最大的问题是“如何让其他国家的用户接受你这个指令集”?如果龙芯只是用在普通的相对简单的工业产品上,比如汽车路由器卫星机床甚至服务器什么的军公教产品上,那没问题,毕竟这些系统都可以定制。但是民用市场,或者更准确的说的是通用处理器市场,谁来迁就?一个芯片指令集首先需要操作系统支持,其次需要其他的硬件企业愿意给该芯片发驱动,然后软件开发者愿意给该指令集开发原生程序,否则看看现在的鸿蒙,以鸿蒙的热度,正在开发的原生鸿蒙APP有多少?有多少APP开发公司在观望鸿蒙的市场前景,准备等鸿蒙站稳脚跟后才去开发原生APP,为什么?因为企业也要考虑成本和风险。。。 再以鸿蒙打比方,如上所述,理论上如果鸿蒙站稳了脚跟,做到了市占率20%以上,甚至更多,比如40%50%,那么华为就可以让鸿蒙由ARM转向RISCV,从而摆脱ARM的制约,避免ARM无法授权的事情再次发生。那么鸿蒙到时候可以转向龙芯么?理论上可以,但问题在于,RISCV的开发者包括全世界,无数的硬件软件工程师在基于RISCV开发相关的硬件和软件,原生的!这其中甚至有INTEL!而到那个时候,给龙芯开发原生程序的工程师有多少?如果鸿蒙要推广到其他国家,如何说服其他国家接受一个基于龙芯的鸿蒙?因为龙芯能兼容X86 ARM和RISCV? 芯片、操作系统、软件,这三者相互依赖,其中涉及到多方的利益,并不是想当然的一腔热血就可以搞定; 如果RISCV没有被发明出来,或许鸿蒙如果成功了会考虑转向龙芯,甚至华为会主动和龙芯合作。但是RISCV的出现变相促成了全地球的国家都有了一个开源的不受限制的指令集,那么龙芯。。。开源的指令集很多,Power,MIPS R6,SPARC,为什么RISCV成功了?一个芯片指令集的成功绝对不仅仅是性能的成功,而是市场的成功,而市场的成功是多方面的。。。如果华为在今年才被制裁,并且宣布有鸿蒙系统,2023年才开始鸿蒙测试上手机,那鸿蒙的成功率绝对会比现在低,为什么??因为谷歌的fuchsia已经开始测试,甚至已经上了手机。到时候华为要推广鸿蒙的难度比现在高N倍;像国内友商就能直接拿着fuchsia来对抗鸿蒙了。所以19年华为被制裁简直就是“时代”选中了鸿蒙,这几年恰巧就是一个空窗期,而华为的早期的准备让华为把握到这个机会,从而推出鸿蒙进入市场,从而让用户接受。这就是时代的选择,是机遇,就像ARM当时开发的初衷就是为了避开其他堆性能的指令集的各种指令集大战,独一份的选择了低功耗,谁能想到低功能,“性能懦弱”的ARM可以靠手机市场崛起?甚至如今开始反攻桌面端!龙芯可能遇到这种基于么?很难,龙芯如何让鸿蒙这种商业化的操作系统去支持龙芯原生指令集?又如何吸引软件开发者去学习龙芯指令集才好开发原生的基于龙芯指令集的APP软件?不会时至今日还要靠“命令”吧? 免责声明 文章来源:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fuser.guancha.cn%2Fmain%2Fcontent%3Fid%3D547871%26s%3Dfwzxhfbt&urlrefer=6ceaf4836c2be2d51fe928c48a54880f
优麒麟 20.04 LTS Pro(0620更新版本)正式发布 IT之家 6 月 20 日消息 今日,优麒麟 20.04 LTS Pro(0620 更新版本)正式发布,带来了大量桌面新特性。同时,麒麟移动应用环境全新登陆优麒麟开源操作系统。▲图源:优麒麟 在本次更新版本中,UKUI 桌面环境迎来 UI 细节优化、核心组件完善和多个新特性。UI 细节优化主要包括交互逻辑简化、显示效果优化以及部分图标重绘。核心组件完善包括性能优化与已知问题修复,降低了桌面环境运行时的资源占用比例,强化了优麒麟操作系统在新老设备上的表现。 IT之家了解到,麒麟移动应用环境首次在优麒麟操作系统中发布,通过在通用平台的麒麟移动应用环境兼容,用户可以在桌面终端中使用移动软件。优麒麟还提供了移动软件快捷安装与管理服务。 麒麟移动应用环境注意事项: 1.CPU 型号支持:目前只支持 Intel、AMD、海光、兆芯四款型号的 CPU。 2.GPU 型号支持:目前在大部分 Intel 集成显卡,AMD,NVIDIA 显卡上支持运行,部分老旧显卡可能不支持默认的渲染模式,用户可以自己根据显卡型号配置对应的渲染模式。 3. 内核:目前在 5.4、5.8、5.10 内核上支持较好,切换内核后,需安装相应的头文件包。 安装方式: 1. 通过官网下载全新安装: http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.ubuntukylin.com%2Fdownloads%2F&urlrefer=2e1e1e11c8af6e1956ea87c93b04fd6e 2. 已安装 20.04 和 20.04 Pro 正式版的用户通过以下方式升级: $ sudo apt update$ sudo apt full-upgrade 此外,优麒麟 20.04 和 20.04 Pro 正式版的用户可通过以下方式安装麒麟移动应用环境: (1)下载 deb 包并安装,从而添加 software 软件源(已经添加过的忽略此步骤): $ wget http://tieba.baidu.com/mo/q/checkurl?url=http%3A%2F%2Farchive.ubuntukylin.com%2Fubuntukylin%2Fpool%2Fmain%2Fk%2Fkylin-software-keyring%2Fkylin-software-keyring_2021.04.21_all.deb&urlrefer=b12fc14f570f14d936516e30f2f61cb9$ sudo dpkg -i kylin-software-keyring_2021.04.21_all.deb (2) 安装内核头文件包、麒麟移动应用环境、新版麒麟软件商店并重启: $ sudo apt install linux-headers-`uname -r`$ sudo apt install kmre kylin-kmre-modules-dkms kylin-software-center$ reboot
国资委发布《中央企业科技创新成果推荐目录(2020年版)》 近年来,中央企业坚决贯彻落实党中央、国务院决策部署,不断增强创新创造意识,努力实现科技自立自强,取得一系列突破性标志性科技创新成果。5月30日,在第5个“全国科技工作者日”到来之际,国务院国资委向全社会发布《中央企业科技创新成果推荐目录(2020年版)》,包括核心电子元器件,关键零部件、分析测试仪器基础软件、关键材料、先进工艺、高端装备和其他8个领域,共178项技术产品。小新为您分享如下—— 《中央企业科技创新成果推荐目录(2020年版)》(以下简称《目录》),是国资央企践行创新驱动发展战略,努力实现科技自立自强的重要举措,是中央企业坚持在“用”上下功夫的标志性成果,是加快构建新发展格局、维护产业链供应链安全稳定的具体实践。 去年以来,为促进中央企业科技成果向现实生产力转化,加快成果应用推广,国资委组织开展中央企业科技创新成果征集工作,通过征集遴选、专家评估、专利审核等环节形成《目录》,包括核心电子元器件、关键零部件、分析测试仪器、基础软件、关键材料、先进工艺、高端装备以及其他等8个领域共178项技术产品。其中,在核心电子元器件领域有魂芯系列DSP、高速安全芯片、高速高精度ADC、高压IGBT等,在基础软件领域有“九天”人工智能平台、麒麟操作系统、BIMBase建模软件等,在关键零部件领域有特高压直流换流变压器、核级温度传感器、重载车轮、轨道交通驱动齿轮装置等,在关键材料领域有纳米气凝胶复合材料、对位芳纶、超细高纯锗粉、钽靶材、T800级高性能碳纤维等,在先进工艺领域有芳烃成套技术、集成电路制造BCD工艺、飞机内饰件3D打印技术、电子束处理工业废水技术等,在高端装备领域有高动态宽频带五轴飞行仿真转台、重型H型钢精轧机组、氢燃料电池发动机、特种型钢万能轧机等。下一步,国资委将建立促进科技创新成果应用推广相关工作机制,组织开展各类成果推介活动,促进供需深度对接,推动科技创新成果在中央企业及产业链上下游广泛应用,加快迭代更新,不断提升技术产品可靠性和市场竞争力,努力在我国科技自立自强中更好发挥国资央企的战略支撑作用。178项技术产品 是不是很感兴趣! 小新先给大家剧透几个创新成果 更多内容详情 或点击“阅读原文”查看 ↓↓↓ 特高压直流换流变压器中国兵器装备集团有限公司本技术产品主要依托国家重大特高压直流输电工程,是国家“制造2025”和“一带一路”的重点产品之一。该系列产品容量大,电压等级高,调压级数多,结构复杂。公司通过大量新技术探索和研究,采用了多项新结构、新工艺,实现了从无到有的技术突破,以优质性能打破了行业壁垒。该技术产品自2010年应用以来,经过不断技术革新,目前处于国际领先水平。 重大能源工程关键核心铸锻件中国机械工业集团有限公司重大能源工程关键核心铸锻件是保证国家能源安全的基础,其制造能力和水平是国家综合国力的体现。100万千瓦水电、600℃以上超超临界火电、30万千瓦重型燃机以及三代核电关键铸锻件主要用于发电装备中承受腐蚀、高速旋转、高压、辐照以及交变载荷,是大型发电装备中受制于人的关键部件,其自主化制造为我国80%以上的能源装备提供支撑。 高速铁路车轮中国宝武钢铁集团有限公司高速列车是我国战略性高端装备之一,高速车轮承受巨大动载荷和热负荷,易发生各类疲劳损伤,也是世界上公认的技术要求最高、生产难度最大的尖端车轮产品,我国长期以来依赖进口。国外将高速车轮技术列为战略性核心技术高度保密,以高于普通车轮十倍以上的价格向我国出口产品,这严重制约中国高铁的发展。实现高速车轮技术自主化、产品国产化,对支撑我国战略性产业安全具有重要意义。 T800级高性能碳纤维中国建材集团有限公司T800级高性能碳纤维,产品牌号为SYT55,是高性能纤维材料的重大创新突破。SYT55高性能碳纤维以其高强度、高断裂伸长率等优势已经成为航空航天、压力容器、高端体育等领域不可或缺的战略性新材料。其在力学性能、工艺性能上均到达了国外同类产品先进水平,已实现了千吨级工程化稳定生产。 芳烃成套技术中国石油化工集团有限公司中国石化通过物理化学、催化材料、智能控制、工艺工程等原理与方法创新,成功开发了总体处于国际领先水平的高效环保芳烃成套技术。首创原料精制绿色新工艺、首创芳烃高效转化与分离新型分子筛材料、首创芳烃联合装置能量深度集成新工艺、创新设计方法与制造工艺实现了关键装备“中国创造”。 特种**等离子体气化熔融处理技术中国广核集团有限公司等离子体技术处理**是国际公认的最先进固废处理技术,被冠以“固废终结者”的美誉,真正实现固体废弃物的无害化处理和资源化应用,为工业危废和放射性**的安全处理与处置提供了革命性的解决方案。 超大直径泥水平衡盾构机中国中铁股份有限公司超大直径泥水平衡盾构机是特大断面隧道穿江越海高水压项目施工的专用设备,“总体技术达到国际先进水平,其中高承压常压换刀技术和大粒径渣石分级处理技术达到国际领先水平”,打破了国外垄断,实现了我国超大直径泥水平衡盾构机从“跟随”到“引领”的跃变。 320立方米超大型高效浮选机矿冶科技集团有限公司320立方米超大型高效浮选机是大型有色金属矿山选矿厂核心装备之一。该产品在关键性能参数实现对进口设备的超越,对难处理矿石的选矿回收率远高于进口设备,目前已实现进口完全替代,国内市场占有率85%,出口到秘鲁、南非和厄瓜多尔三个国家,全球装机200多台套。 进入专题创新是引领发展的第一动力 科技是战胜困难的有力武器 中央企业的广大科技工作者 将以创新为剑,以初心为盾 在科研的道路上 着力攻克关键核心技术 促进产学研深度融合 勇攀科技高峰 披荆斩棘,一路前行 为把我国建设成为世界科技强国 作出新的更大的贡献 向全国科技工作者致敬! 发布时间: 05-3016:15国务院国资委新闻中心
飞腾申威上了实体清单也不用绝望。 “实体清单”,英文单词是EntityList,是美国商务部产业与安全局(BIS)用于对特定对象的出口限制,凡是落入该名单的实体均成为BIS限制出口的对象。是美国为维护其国家安全利益而设立的出口管制条例。在未得到许可证前,美国各出口商不得帮助这些名单上的企业获取受本条例管辖的任何物项。简单地说,“实体清单”就是一份“黑名单”,一旦进入此榜单实际上是剥夺了相关企业在美国的贸易机会。 实体清单管制是依据EAR, EAR下的受控物项并不仅限于位于美国、原产于美国或经由美国运输、转运的物项,根据EAR 734.3节的规定,还包括: 在美国境外制造,但含有超过最低美国成分含量比例的物项; 以及特定在美国境外制造的,但属于美国技术和软件直接产品的物项和特定由位于美国境外的工厂所生产的物项,只要该等工厂或其主要部分属于美国技术和软件直接产品。 这就是在美国出口管制领域中经常提到的最低成分含量规则(de minimis rule)和直接产品规则(direct product rule)。 那个最低技术含量有10%和25%两条线,并且EAR是可以修改的,比如今年4月就修改过。即使对你完全禁运暂时不符合EAR,美国人修改下定义或者条款,就可以对你完全禁止出口而又符合条例,在国家利益面前,这些都是可以很灵活的。 第一档是25%美国技术,第二档是10%美国技术,台积电的7、12、14纳米都没有超过25%美国技术,12、14是超过10%的美国技术,7纳米已经可以做到10%以下了。第一次进实体清单是实行的是25%的,那么7、12、14纳米工艺的芯片没有问题,如果美国进一步制裁到第二档10%就得要到7纳米才行。
国产DSP能给缺芯“止痛”? 2020年,中国进口各类芯片的总额攀升至3800亿美元,连续6年超过石油进口额,成为贸易逆差的最大来源,占全球芯片需求量的45%以上。在这一形势下,以美国为首的欧美国家却不断通过“贸易摩擦”、各种制裁和禁运,对出口到中国的芯片特别是高端芯片“卡脖子”。 2020年8月国务院印发的《新时期促进集成电路产业和软件产业高质量发展的若干政策》提出,中国芯片自给率要在2025年达到70%。因此,加快高端芯片的自主研发与国产替代愈发迫切,重要性与日俱增。 DSP(Digital Signal Processor,数字信号处理器)是一类嵌入式通用可编程微处理器,主要用于实现对信号的采集、识别、变换、增强、控制等算法处理,是各类嵌入式系统的“大脑”,应用十分普遍。DSP与CPU(中央处理器)、GPU(图形处理器)、FPGA(现场可编程门阵列)通常被看成是高端芯片的“四大件”,其国产化替代对于提升芯片自给率具有重要意义。 我国的国产DSP虽然起步较晚,但发展很快,在某些特定领域的国产化率已经较高,2025年非常有可能实现70%的目标。 国产DSP在某些领域国产化率已达80%以上 相比CPU、GPU和FPGA,同属于高端芯片的DSP受关注程度明显低很多。DSP芯片一般采用程序总线和数据总线分开的哈佛架构,常常具有专门的硬件加速模块,能够快速实现各种数字信号算法处理与实时控制。 毂梁微电子副总经理汪东表示:“DSP相比CPU功能更加专一,相比GPU分属不同领域,相比FPGA计算效率更高。它更多时间是在做默默无闻的计算处理工作,所以大家对DSP的关注会相对少一些,但已经广泛应用于手机、家电、汽车、高铁、工业机器人、无人机等诸多领域,市场需求量很大。” 虽然受关注程度不如CPU,起步较晚的国产DSP发展却很快。全球第一块单片DSP在1980年诞生,此后,TI、ADI、摩托罗拉等公司不断推出不同档次的DSP产品并逐步占领全球市场。
国产化自主可控PLC成功试运 中国能源报2020-11-27 11:12:50 由中国华能集团有限公司、中国电子联合研发的国产化PLC工控系统首次在华能汕头电厂供热改造工程配套新建制水系统中顺利试运。该PLC系统开始在华能汕头电厂供热改造工程配套新建制水系统中开展安装调试。PLC工控技术是能源工业领域关键技术之一。 本报讯日前,由中国华能集团有限公司、中国电子联合研发的国产化PLC工控系统首次在华能汕头电厂供热改造工程配套新建制水系统中顺利试运。 PLC工控技术是能源工业领域关键技术之一,尤其是大型PLC系统,通常是实现现场设备自动、高效运转的核心技术。目前国内PLC产品大部分为进口,少量国产品牌PLC的核心芯片和软件仍然使用国外产品。为解决这一“卡脖子”难题,保证我国能源工业的长期安全发展,华能会同相关单位进行联合攻关,实现了从PLC核心芯片到实时操作系统(RTOS),从服务器的核心芯片到服务器操作系统、数据库等关键软、硬件全部国产化。 9月下旬,该PLC系统开始在华能汕头电厂供热改造工程配套新建制水系统中开展安装调试,并于11月13日试运成功。在汕头电厂应用结果表明,其性能指标完全满足工艺要求。 华能自主可控中大型PLC的成功试运,意味着我国发电厂控制系统关键核心装备国产自主可控替代工作取得重要进展,同时这也意味着相关技术成果将转入大规模推广应用阶段。 (李昕葳 褚孝国) *凡本网注明来源为“中国能源报/中国能源网"”的所有文字、图片和音视频资料,版权属于中国能源报社所有,未经授权,不得转载;凡本网注明来源非“中国能源报/中国能源网”的作品,版权归原创者所有,并不代表本网立场和观点,如有侵权,请联系删除。
1 下一页