哈基咪装机 林北是王德发
有装机配置上面的问题跟需求可私
关注数: 67 粉丝数: 133 发帖数: 1,057 关注贴吧数: 21
国产x86 CPU飙升96核心、384MB三级缓存 来源——硬件世界 在近日举办的WAIC 2025大会上,兆芯首次展示了基于新一代处理器开胜KH-5000的服务器方案,其提升幅度之大令人振奋,不少指标几乎甚至已经追上AMD。 兆芯现有的开胜KH-40000系列是2022年底发布的,16nm工艺,单路32/16/12核心,基准频率2.0-2.2GHz,最高加速2.7GHz,三级缓存64MB。 内存支持8通道DDR4-3200,单路最大容量2TB,并支持128条PCIe 3.0通道、16个SATA 3.2接口、8个USB 3.0 5Gbps。开胜KH-5000系列依然采用chiplet芯粒架构,但制造工艺暂未公开,猜测会升级到12nm甚至更先进。 继续兼容x86指令集,单路最多核心数一举增至96个,三级缓存也顺应来到最多384MB,都是现在的足足3倍。 支持双路、四路扩展,意味着一台服务器最多可以拥有384个核心、1.5GB缓存! 主频标注2.2-3.0GHz,但未区分基准、加速频率,猜测后者是加速频率,那也相当不容易了,也再次说明必然使用了更先进的工艺。 I/O也全面升级,其中内存支持12通道DDR5,扩展通道支持128条PCIe 5.0(支持ZPI/CXL),SATA、USB接口则分配了16条PCIe 4.0通道。 开胜KH-5000系列还支持全新的ZPI 5.0互连技术,从而拥有更大的数据带宽、更低的延迟和功耗。 作为对比,AMD目前最先进的Zen 5架构大核处理器EPYC 9755,采用台积电4nm工艺,拥有128核心256线程、2.7-4.1GHz频率、512MB缓存、12通道DDR5、128条PCIe 5.0。 可以看出,兆芯在核心数量、频率、缓存上只是稍落后于AMD,内存、PCIe等扩展已经追平。 兆芯强调,面对增长的AI训练、推理等应用需求,开胜KH-50000处理器带来了更高的计算密度、全面升级的高速I/O、全新的自主互连、更强的多路扩展能力等特点,可为AI工作站、通用AI服务器、高密度AI服务器等提供强力支持。 期待早日发布,带来更多细节!同时,兆芯还带来了面向消费级平台的开先KX-7000N。 它显然是现有开先KX-7000的升级版,重点集成了高性能NPU,形成异构加速计算。 开先KX-7000N是兆芯处理器首次集成独立NPU,基于高性能架构,具备强大算力,可显著提升端侧AI处理性能和使用体验,打造高性能AI PC。 在现场,基于开先KX-7000N处理器的AI PC产品也同步亮相,可提供高效的端侧大模型推理能力,满足AI助手、政企智慧办公、智慧教育、内容创作等需求。 它还支持主流AI框架与模型部署,可以本地离线运行语音识别、图像生成、大语言模型等AI应用,同时显著降低系统延迟与功耗,具有自主安全、高性能、低成本、灵活开发等优势。同时,兆芯还在开发下一代开先系列AI PC处理器产品,应该会命名为KX-8000系列。 新品将具备更多的CPU核心、更强的计算性能,升级支持PCIe 5.0,继续异构集成高性能NPU。 大会现场,兆芯联合伙伴共同展示了AI公文辅助写作产品、联想开天教育智能体方案、AI计算与决策解决方案、小库写易一体机解决方案、联和东海AI系列产品、超高清AI智能体“东东”、拥抱AI芯动力-多场景人工智能应用集、华清同创AI无界共筑新生态。为什么我们要大力搞自己的芯片呢?看看美国是怎么对待我们的! 据外媒报道称,美国已经正式允许NVIDIA向中国出货H20 AI芯片。 白宫国家经济顾问Kevin Hassett表示,美国总统川普及其团队已决定允许NVIDIA对中国出货芯片,显然指的是NVIDIA专为中国市场设计的H20。 他指出,这项决定是为了防止中国在先进芯片的竞赛中超前。 “有一项风险我们必须严肃看待,那就是如果中国无法从我们这里购买芯片,他们就会自己研发,制造他们自己的芯片。而我们最不希望看到的,就是他们在这场芯片竞赛中领先。”Kevin Hassett说道。 NVIDIA在两周前表示,已向美国政府提出申请,要求恢复向中国销售H20 GPU,并已获美方保证将很快取得出口许可。 有国内专家直言,中国企业不要因为可以买到NVIDIA的芯片,从而停止了自研芯片的研发,这样就正好落入了美国的圈套。
新封装技术,英伟达Rubin架构GR150将采用CoWoP尖端封装方案 来源——AMP实验室 看不懂啦 在如今半导体制程发展到极限的当下,从其他方面寻求性能突破也是各家前沿厂商一直在攻克的难关,例如台积电、三星在研究的先进封装,另辟蹊径寻求单位面积内的更高性能。 台积电的CoWoS是现代HPC和AI芯片上的首选先进封装方案,然而这项技术已经在大约 14 年前首次亮相,目前被英伟达和 AMD 的人工智能巨头广泛使用。CoWoS 是一种成熟的封装技术,拥有由各种合作伙伴组成的强大供应链。不过,再好的技术也将迎来迭代或者继任者, 英伟达等人工智能巨头现在正计划改变方向。根据DIGITIMES的新报道,英伟达已经开始研究其下一代 GPU 的 CoWoP封装技术。CoWoP (Chip-on-Wafer-on-Platform) 移除了PCB封装基板并将内插层直接连接到主板。 CoWoP的信号和电源完整性更好,减少了基板损耗,并使电压调节更接近主 GPU 芯片。这些接口还增加了NVLINK IC的功能。另一个好处是 CoWoP 封装不需要封装盖,这意味着热解决方案可以与硅直接接触,这也降低了成本。 泄露的路线图表明,英伟达似乎在本月开始了 CoWoP 的早期测试。早期测试单元基于GB100 GPU,并采用虚拟GPU/HBM解决方案。它的外形尺寸为 110*110mm,目标是评估工艺流程选择。下个月(2025 年 8 月),据称英伟达将开始测试功能齐全的 GB100 CoWoP,该 CoWoP 具有功能性 GPU/HBM。该方案将保持相同的外形尺寸,旨在评估可制造性、结构和电气功能、热设计和 NVLINK 接口吞吐量。将使用带有两个 GB102 GPU 的 e6540 PCB板,但目前没有任何外部客户对此进行评估。而到了明年,英伟达将使用相同的CoWoP封装开始对Rubin芯片进行测试工作,GR100 CoWoP将采用SXM8规格外形,而这款芯片也将成为后续完全投入生产的GR150 Rubin解决方案的实验平台。 GR150 CoWoP解决方案将于2026年底左右投入生产,2027年某个时间点上市,不过即使有了CoWoP,英伟达也不会停止CoWoS的生产,他们将会继续利用该技术。摩根士丹利报道称,英伟达表示在下一代GPU中采用该CoWoP封装的可能性很小,并且多家投资公司也支持确认这一点。尽管技术的应用完全取决于市场趋势和供需关系,但Rubin架构上市还有至少两年时间,到时候才能看到英伟达是否采用这种更先进的封装技术。
Windows on ARM生态追加:Adobe官宣PR、AE原生适配骁龙笔记本 来源——AMP实验室 能做到M系的性能吗? Adobe 宣布,其多款主力创意应用现已推出适配 ARM 架构 Windows 设备的原生版本,包括 Premiere Pro、After Effects、Audition 和 Media Encoder。 早在 2024 年 8 月,Windows on ARM 用户就可以通过“模拟模式”运行 Premiere Pro。但原生应用在性能和能效方面都优于“模拟”版本,尤其是在搭载骁龙 X 系列处理器的设备上优势更加明显。媒体Neowin报道,这些应用目前处于测试阶段,并且存在一些限制,其中一些限制即使在应用退出测试阶段后仍然存在。 Premiere Pro 与 Media Encoder 未来将支持的功能: ▲第三方扩展(包含插件与音频插件) ▲ProRes 格式的导入与导出 ▲以 ProRes 作为代理文件、替换渲染格式,或设定为序列预览格式 ▲JPEG2000(MXF 封装格式)的导入导出 ▲MotionJPEG 与 MKV 文件的导入 ▲H.264 与 HEVC(MP4 格式)的硬件加速播放与导出 ▲多种 RAW 视频格式支持,包括: Apple ProRes RAW ARRI ARRIRAW Canon Cinema RAW Light Sony X-OCN 与 Sony RAW 不会支持的功能: Wraptor DCP 格式导出 GoPro CineForm 编解码器的导入导出 P2 Movie 格式的导出 Audition 未来将支持的功能: ▲第三方扩展(包括音频插件) ▲MotionJPEG 与 MKV 文件的导入 ▲JPEG2000(MXF 封装格式)的导入导出 ▲各类 RAW 视频格式的导入,包括: Sony RAW(含 X-OCN) Canon RAW ARRIRAW ProRes RAW ▲控制界面:支持 AVID EUCON 不会支持的功能: ▲Loudness Radar(建议改用 Loudness Meter) ▲GoPro CineForm 编解码器的导入导出 After Effects 的已知问题包括: ▲不支持多个格式的导入导出,包括 ProRes、ARRIRAW、SWF、GoPro CineForm、JPEG2000(MXF 封装格式)及 WMV。因此,在选择“高质量”或“高质量(含 Alpha)”输出选项时,将默认使用无压缩 QuickTime 编解码器(附有提示警告)。 ▲不支持 MotionJPEG 与 MKV 文件导入 ▲不支持 H.264 和 HEVC(MP4 格式)的硬件加速播放与导出 ▲Keylight 抠像和 Mocha 尚未集成,启动时会提示缺失 ▲Cinema 4D 渲染器及其相关功能(如 Cineware)暂未提供 ▲所有第三方插件需升级为 Windows on ARM 版本,旧版插件在原生环境中将无法使用。Adobe 已与多家插件开发者沟通,并将发布新版 SDK 以支持 WinARM Adobe 还建议用户更新至最新版本的 Adreno GPU 驱动,以避免出现关于“当前驱动不支持高级 3D”的错误提示。 目前,这些应用仍处于测试阶段,部分功能尚未完善,而且即使正式发布,也仍会存在一些功能缺失。 此外,Adobe 还建议用户更新至最新版本的 Adreno GPU 驱动,以避免出现关于“当前驱动不支持高级 3D”的错误提示
英伟达追加台积电H20 GPU订单,据称热烈需求来自中国 来源——AMP实验室 是吗? 此前黄仁勋来访国内,带来了H20 GPU解禁的消息,更重要的是,英伟达重新获得了重要的收入来源。 该公司最近宣布,特朗普政府已取消对中国的芯片出口管制,这将开放向中国发货的 H20。然而,市场对此持怀疑态度,考虑到供应链的复杂性,英伟达是否会重新生产新的H20芯片。但据路透社报道,英伟达正在寻求为中国人工智能客户下达新订单。据称,英伟达已经在台积电订购了约30万颗 H20 AI 芯片,该订单将填补英伟达目前在中国看到的大量需求。据估计,有了这些订单,该公司的 H20 总库存将达到 600,000 至 700,000 颗,这足以满足英伟达在该地区至少50~75%的业务。 有传闻称,英伟达正在进行一项新的市场调查,以制定H20 AI GPU的订单预测,因为这一产品方案此前已经在国内市场售卖了几个季度。而由于算力需求正在持续大幅增长,国内客户需要更强大的解决方案,这就是英伟达所瞄准的目标。此前的消息透露,英伟达同时也在开发基于Blackwell 架构的B20 AI GPU,而RTX 6000D GPU可能会在年底或者明年Q1季度在国内发布,具体取决于白宫方面的管制情况。 一系列动作已经让特朗普明白,英伟达是人工智能“军阀”,与其制止他们在其他市场的销售,不如让他们在这些市场建立生态,并且他们知道可能还要10年,对手才能追赶上来。
GTX 1080Ti水冷超频难敌RTX 5050,5050改装超频提升超20% 来源——AMP实验室 不如说怎么才退场 GTX 10系是GeForce GTX品牌最后一代,在20系则迈向了RTX 光线追踪时代。GTX 10代除了传奇性价比GTX 1060,其实当年的GTX 1080Ti也是一款非常惊艳的产品。而今年,英伟达难得又推出了xx50级的“入门”级显卡,RTX 5050是目前50系列中最低性能的成员,较低的性能以及不匹配的售价,对于大部分玩家来说都没有什么吸引力,甚至可能对于不少玩家来说,这款RTX 5050的性能是不是打不过上面我提到的老旗舰GTX 1080Ti,但事实已经证明,Pascal架构旗舰的时代已经远去。 时隔八年,英伟达的入门级显卡终于能够堂堂正正的击败GTX 1080Ti,油管博主yt@trashbench 在最新视频中对两者展开了测试。GTX 1080Ti曾经是地球上的最强游戏显卡,但现在在例如《荒野大镖客2》《赛博朋克2077》这些现代游戏中,已经无法打败RTX 5050。在默认频率下, RTX 5050在多数游戏中已经领先, 并且拉开了较大的性能差距,因此博主尝试,是否在自定义的水冷散热条件下, GTX 1080Ti超频能否再次挽回对RTX 5050的优势。然而,即便是改装了水冷散热,GTX 1080Ti也没有实现超过3%性能提升,根据博主的说法,他测试了三个非公版本的GTX 1080Ti与RTX 5050进行比较,但没有一个能打败新显卡。虽然旧日旗舰败于最新的入门显卡多少让人有些唏嘘,但也是时候让它安息了。 有意思的是,博主还进一步操练了手头的RTX 5050。TrashBench 表明 RTX 5050 在超频方面拥有可观的潜力。他使用改造的风冷将RTX 5050 超频至惊人的 3.3 GHz 以上,从而获得了 11377 分,这是 RTX 5050 迄今为止在 3DMark Time Spy图形分项目中取得的最高分。综合而言,RTX 5050 的平均性能提升为 17.55%,考虑到他还没有上水冷解决方案,这相当令人印象深刻。 GTX 1080Ti终有一天会被一款入门级显卡打败,但是这一天似乎来的有点太晚了。它是光追时代前英伟达最强大的显卡之一,并且在当下依然能算作中端性能,特别是在一些第三方店铺几百就能入手,驾驭网游和前些年的3A不算苛求。虽然RTX 5050展现了取代者的性能,但是其8GB显存还是显得搞笑了。
RTX 50 SUPER着急了!要提前发布 来源——硬件世界 RTX 50系列已经布局完毕(除了中国特工新版RTX 5090D v2下月推出),接下来就要看RTX 50 SUPER系列的了,相关传闻也已经不少,现在看起来发布时间也会提前。 按照以往节奏,RTX 50 SUPER系列最有可能的发布时间是明年初的CES 2026,不过根据可靠消息,NVIDIA极有可能会提前到今年第四季度,大概率就是西方传统的年底购物旺季期间。 这也是第一次出现RTX 50 SUPER确切发布时间的说法。 坦白说,RTX 50系列虽然进步很大,尤其是DLSS 4多帧生成和高能效,但也有玩家刚拿到些许失望,尤其是驱动黑屏、崩溃等不稳定问题表现反常。RTX 50 SUPER系列已知有至少三款型号: RTX 5080 SUPER: 芯片编号从GB203-400升级为GB203-450。 CUDA核心数量保持10752个,显存从16GB增加到24GB,使用单颗3GB,而功耗从360W增至415W(+15.3%)。 RTX 5070 Ti SUPER: 芯片编号从GB203-200升级为GB203-GB350。 CUDA核心数还是8960个,显存同样升级单颗3GB,总容量从16GB来到24GB,而功耗从300W增至350W(+20%)。 RTX 5070 SUPER: 核心编号从GB205-300升级为GB205-400。 唯一一个增加核心数量的,从6144个增至6400个(+4.2%),显存也从12GB来到18GB(六颗3GB),而且功耗增加反而是最少的,只是从250W小幅增至275W(+10%)。另外,中的国二手NVIDIA高端GPU维修店生意相当火爆。 据深圳两家此类公司称,现在大约有十几家精品公司提供维修服务,他们主要维修NVIDIA的H100、A100 GPU,这些芯片以某种方式进入了中国。 H100已于2022年9月被禁止在中国销售,它的前身A100在上市两年多后也同时被禁售。 “维修需求确实很大,”一家公司的合伙人表示,该公司做NVIDIA游戏GPU维修业务已经15年,并于2024年底开始研究人工智能芯片。 报道称,美国对NVIDIA GPU的制裁迫使中国公司从现有库存中榨取每一分的性能。因此,这些芯片的故障率很高,导致维修店如雨后春笋般涌现,主要满足旧款H100和A100 GPU的维修需求。 每个GPU的维修费用高达2400美元(约合1.7万元人民币),有些店每月能处理500个芯片。 据了解,NVIDIA无法合法地为中国的受限产品提供维修或更换服务。NVIDIA发言人表示,只有该公司和授权合作伙伴“能够提供客户所需的服务和支持。在没有经过批准的硬件、软件和技术支持的情况下使用受限产品,是不可能的。”在显卡发展史上,NVIDIA GTX 1080 Ti曾是无数玩家心中的“显卡之王”,然而随着技术的不断进步,这款传奇显卡也迎来了它的“黄昏时刻”。 近日,硬件测试者TrashBench进行了一场显卡对比测试,他将GTX 1080 Ti与目前NVIDIA入门级的RTX 5050显卡进行了性能对比。 结果显示,即便GTX 1080 Ti采用了定制水冷散热方案并进行了超频,也难以战胜RTX 5050。在默认频率下,RTX 5050就已经在多数游戏如《荒野大镖客2》《赛博朋克2077》等中领先GTX 1080 Ti。因此TrashBench使用定制的水冷方案对GTX 1080 Ti进行了超频,看看是否能让1080 Ti超越RTX 5050,不过超频后,其性能提升仅为3%。 根据TrashBench的说法,他尝试将三款不同版本的GTX 1080 Ti与RTX 5050进行对比,但结果都无法战胜后者。相比之下,RTX 5050的超频表现则更加优秀,为了给RTX 5050一个公平的测试环境,TrashBench为其配备了远超默认水平的散热系统。最终,RTX 5050的频率被成功提升到了3.3GHz,比默认频率高出28%,这一频率提升使得RTX 5050在游戏性能上平均提升了17.55%,远高于1080 Ti的3%提升。最终RTX 5050不仅在性能上超越了1080 Ti,还在3DMark Time Spy的基准测试中取得了11377,这也是该型号显卡的前六名成绩。 TrashBench总结道:“原本以为1080 Ti才是主角,但5050却抢了整个风头。”他还补充说:“我没有预料到这一点。所以,我想说,晚安,老前辈。”
根本不够卖啊!NVIDIA H20库存芯片仅90万颗 但中国需求180万颗 来源——硬件世界 据最新报道,由于中国市场对NVIDIA H20芯片的强劲需求,NVIDIA已改变了主意,上周向台积电下单采购了30万片H20芯片。 此前今年4月美国收紧了对AI芯片出口中国的限制,将NVIDIA降规版H20纳入出口限制范围,不过本月早些时候再次恢复向中国客户供应H20芯片。 虽然H20的运算能力不及被禁止销往中国的H100和Blackwell系列芯片,但它是目前中国企业能够合法获取的最顶级AI芯片,因此需求一直很强劲。 杰富瑞(Jefferies)估计,NVIDIA目前拥有60万至90万颗H20 GPU库存,而中国对这些关键芯片的需求持续保持在180万颗左右, 此前有消息称NVIDIA不会再重启H20的生产,不过面对旺盛的需求,NVIDIA还是向台积电下单额外采购。 杰富瑞还认为,NVIDIA在2025年第一季度向中国出货了约30万颗H20,这一出货量与禁令前的交付节奏基本一致。 还有消息人士透露,NVIDIA已经要求有意采购H20芯片的中国公司提交新文件,包括订单量预测等。另有消息显示,因中国市场的强劲需求,NVIDIA已向台积电下订了30万颗H20芯片。 报道指出,此次30万颗H20芯片的订单,是对NVIDIA现有约60万至70万颗H20芯片库存的补充。 值得注意的是,研究公司SemiAnalysis的报告指出,NVIDIA在2024年已售出约100万颗H20芯片。 而一位市场人士表示,需求激增促使NVIDIA重新考虑不只销售现有库存,而是进一步重启生产进行销售。 相较于NVIDIA在其他地区销售的H100或Blackwell系列,H20的运算能力较低。 尽管其性能受限,H20仍成为美中贸易紧张关系的焦点。 事实上,在4月份禁令实施之前,中国科技大厂如腾讯、字节跳动和阿里巴巴曾大幅增加H20芯片的订单,用于其AI模型部署。 尽管华为有提供替代产品,但是NVIDIA在中国的受欢迎程度依然很高。 NVIDIA认为,保持中国市场的参与度将有助于防止市场转向华为等竞争对手。 对于有兴趣采购H20芯片的中国企业,NVIDIA也已经要求他们提交更新文件,包括客户订单预测。 至于为何这些企业不优先采用华为,可能跟CUDA生态有关。NVIDIA难以取代的不是硬件,而是CUDA生态。 据报道,尽管美国对中国实施半导体出口制裁,阻止NVIDIA在中国大陆销售其先进的AI芯片,但它的产品仍然是中国大陆需求最广泛的AI芯片,而这主要是得益于NVIDIA GPGPU架构及强大的CUDA生态。说起来,在过去的50年里,人类在计算技术领域取得了令人惊叹的进步。 从最初的Intel 4004芯片到如今的NVIDIA Blackwell B200芯片,计算能力实现了惊人的2.17亿倍增长。早在20世纪70年代,Intel的首款微处理器4004进入市场,这款芯片最初并非为大众市场设计,而是为日本公司Busicom开发的打印机计算器芯片。 不过Intel看到了其中的潜力,于1974年将其推向市场。4004芯片拥有4位CPU、740kHz的时钟速度和约92600次每秒的指令处理能力(IPS),配备4KB ROM和640字节RAM,放到如今来看确实有些微不足道。 不过从4004芯片开始,计算技术经历了翻天覆地的变化,并行计算、多线程以及摩尔定律的推动,使得计算能力在短短几十年内实现了巨大的飞跃。如今,NVIDIA的Blackwell AI芯片虽然并不能完全代表芯片计算性能巅峰,不过其拥有更大的知名度。 当然不能否认的是,与50年前相比,现代芯片的功耗大幅增加,但性能的提升更是令人惊叹,正如NVIDIA创始人黄仁勋曾说过,Blackwell将推动计算能力的显著提升,为未来的发展奠定基础。
现在买显卡你会选什么:万人投票超半数选择RX 9060 XT 16GB! 来源——硬件世界 随着AMD RX 9060 XT以及NVIDIA RTX 5060 Ti、RTX 5060和RTX 5050等主流显卡陆续登场,整个显卡市场竞争愈发激烈。 TechPowerUp在其网站上发起了一项关于显卡购买意愿的读者调查,累计收到16333份有效问卷,结果显示AMD RX 9060 XT 16GB以绝对优势成为最受欢迎的选择。调查结果显示,AMD RX 9060 XT 16GB以52.4%的支持率(8552票)成为绝对赢家,其370美元的价格在性能与价格之间取得了极佳的平衡。 NVIDIA RTX 5060 Ti 16GB以21.6%的支持率(3520票)位居第二,440美元的价格使其成为更进阶玩家的理想选择。 而Intel锐炫B580 12GB以10.1%的支持率(1648票)位列第三,250美元的亲民价格使其成为入门级玩家的性价比之选。 调查结果还显示,玩家对8GB显存的显卡兴趣极低,尤其是在300-400美元价格段的产品,在前5名除了锐炫B580为12GB外,其余4款皆为16GB配置。在闪存方面,铠侠(原东芝闪存业务)、闪迪(原西数闪存业务)联合宣布,第九代BiCS 9闪存已经开始出样给客户。 BiCS 9的定位介于现有的第八代BiCS 8、未来的第十代BiCS 10之间,不像后者追求尖端技术与性能,堆叠到332层,而是更注重性价比,平衡性能与能效,充分利用成熟工艺和技术,主要面向企业级、AI应用。 未来,BiCS 9/10将会持续并行发展,不存在彼此取代关系。BiCS 9还采用了混合架构,首先单独制造CMOS控制电路晶圆、NAND闪存阵列晶圆,然后键合在一起,形成单一高性能封装——长江存储就是这么干的。 BiCS 9在第五代BiCS 5(112层)和第八代BiCS 8(218层)的基础上,升级更先进的I/O接口, 尤其是支持Toggle DDR 6.0,因此最高传输速度达到3600MT/s,特殊测试环境下的峰值甚至高达4800MT/s。 对比此前的512GB TLC闪存,BiCS 9仍然有着全面的提升: 写入性能提升最多61%、能效提升最多36%,读取性能提升最多12%、能效提升最多27%,另外存储密度也增加了8%。
64核只要4万元太良心!AMD Zen5线程撕裂者9000X国行价格公布 来源——硬件世界 日前,AMD公布了Zen5架构锐龙线程撕裂者PRO 9000WX系列处理器的价格,面向工作站,其中顶级的96核心撕裂者PRO 9995WX要价达99995元,而16核心撕裂者PRO 9955WX也要13955元。 现在,面向发烧级桌面的撕裂者9000X系列的国行价格也公布了! 64核心撕裂者9980X:40980元 32核心撕裂者9970X:20970元 24核心撕裂者9960X:12960元 一如PRO 9000WX系列,它们的定价也是挺有意思,价格和编号的后三位数字完全一样。对比上代对应型号,分别便宜了5019元、5029元、3039元,换算成比例就是大约11%、19%、19%。 完全没对手的情况下,不但不涨价,反而还大幅降价,不得不说很良心啊! 同时,比同等核心数的PRO系列也便宜不少,比如64核心的低了足足2.6万元,也就是接近39%。 撕裂者PRO 9000WX系列现已上市,撕裂者9000X系列将于7月30日晚上市,快科技的首发评测也将同步奉上!另外,昔日的英特尔中国区总裁退休后转投AMD,引来了网友的围观。 根据Linked in上的消息显示,2021年从英特尔退休的前中国区总裁杨旭(Ian Yang)在2024年底已经加入了AMD,担任AMD副总裁兼联想全球客户经理。 这位曾被冠以“AMD杀手”之名的英特尔悍将,在为英特尔效力30多年后转身投入“宿敌”阵营,引发了业内的关注。 知情人士透露,杨旭最初直接向AMD CEO苏姿丰(Lisa Su)汇报,但目前其汇报线可能已发生调整。 在英特尔任职期间,杨旭最著名的战绩是在2004-2007年间英特尔与AMD的“神州争霸战”中,当时AMD凭借与多家中国品牌厂商合作,在2005年底拿到了中国市场19.1%的份额。 随后,杨旭以“胡萝卜加大棒”策略压制AMD扩张:通过广告返款绑定PC品牌厂商,对采用AMD芯片的PC品牌商进行打压,甚至亲自指挥“电脑价格战”,逆转了当时AMD在中国市场的增长态势。那么AMD和Intel这两家的入门级笔记本CPU该如何选择呢?近日笔吧评测室对搭载Intel酷睿Ultra 5 225H与AMD锐龙AI 7 350的同款笔记本进行了对比测试,结果显示二者性能旗鼓相当,但在散热方面酷睿Ultra 5 225H更具优势。 笔吧此次选择的是联想小新Pro 14 GT,在相同模具里分别搭载了Intel 酷睿Ultra 5 225H,以及AMD锐龙AI 7 H350,这也是各家在售处理器产品中最入门的型号。 测试中,两款处理器在各类基准测试里几乎难分伯仲,其中一些测试Intel略快,但在其他测试中AMD表现略优。在Cinebench R23测试中,酷睿Ultra 5 225H在高功耗(60 - 80W)时略占上风,而在低功耗(10 - 25W)时,锐龙AI 7 350表现更佳。在游戏性能方面二者相当,处理器配套的显卡,基于Xe2架构的Arc 130T与基于RDNA 3.5架构的Radeon 860M也是各有千秋,平均游戏性能难分胜负。不过在散热方面,酷睿Ultra 5 225H表现更为出色,在Cinebench R23高负载测试中,其温度几乎始终低于90摄氏度,而锐龙AI 7 350则接近100摄氏度,机身热量堆积更为明显。酷睿Ultra 5 225H凭借其14核心14线程的混合架构,在核心数量上占优,尽管其中多数为能效核心,但依然展现出不错的性能潜力。 相比之下,锐龙AI 7 350是8核心16线程的APU,采用了4个Zen 5和4个Zen 5c核心组合,并支持超线程技术。
国产GPU进化!打造先进好用的“AI训练工厂” 来源——硬件世界 我们正站在AI狂飙的黄金时代——短短半年,全球顶尖模型“智力”飙升50%;2025年几乎每周都有重磅模型登场;从大语言模型到多模态架构,七类模型架构全速迭代。 当传统“暴力堆卡”的训练模式,越来越难以满足指数级增长的智能生产需求。AI产业亟需要一场“效率革命”,即构建新一代大型人工智能计算基础设施,以应对生成式AI进化。 国内GPU厂商摩尔线程在WAIC 2025前夕出招了,要用国产全功能GPU打造一个AI“超级工厂”,直击大模型训练效率的瓶颈。这座AI工厂的“产能”,有一道硬核公式来衡量: AI工厂生产效率 = 加速计算通用性 × 单芯片有效算力 × 单节点效率 × 集群效率 × 集群稳定性 摩尔线程的杀手锏“全功能GPU”,就是这座“AI工厂”的心脏。 根据功能结构划分,GPU可分为图形GPU、GPGPU(通用计算GPU)与全功能GPU。既然是全功能GPU,你可以理解为,既能做图形,也能做AI,还可以做通用计算、科学计算等。全球范围内,也仅有NVIDIA掌握的尖端技术。而摩尔线程是国内唯一从功能上可以对标英伟达的国产全功能GPU企业。 自2020年成立以来,摩尔线程一直致力于全功能GPU的研发与创新。全功能GPU具备更强的通用性,不仅可以服务数据中心,也具备下沉至消费端的潜力,是真正的全能型选手。 截至目前,摩尔线程已完成了四代全功能GPU的迭代,其中包括支持FP8精度的最新智算卡MTT S5000、训推一体全功能智算卡MTT S4000、支持千卡互联的第一代超大规模智算融合中心产品KUAE1,以及第二代万卡集群KUAE2,这些产品已实际交付多个智算中心。那么,摩尔线程如何打造世界先进的AI工厂? 这是一项系统级创新工程,主要体现在五个关键方面:加速计算通用性、单芯片有效算力、单节点效率、集群效率和集群稳定性,这些因素环环相扣缺一不可。在加速计算通用性方面,摩尔线程自主研发的多引擎全功能GPU,率先实现在单芯片架构,同时支持AI计算加速、图形渲染、物理仿真和科学计算、超高清视频编解码,并覆盖从FP8到FP64的全计算精度。不同精度的计算适用于不同的应用场景,例如FP8用于混合精度训练和大语言模型推理,INT8用于量化推理和CV推理,BF16/FP16用于机器学习和大语言模型训练,FP32/TF32用于3D渲染、游戏和高精度推理训练等,而FP64则主要用于科学计算,如天气预报和气候仿真等。摩尔线程的全功能GPU能够支持以上全部精度的训练推理,从而实现AI训练推理、科学计算、工业智能、自动驾驶、具身智能、生物制药、AIGC、AI智能体、游戏等全场景AI加速。 有了应用场景,性能跟不上那也是白搭,摩尔线程自研的MUSA架构从底层基础设施到中间层管理平台,再到上层应用,实现了全面覆盖,通过计算、通信、存储技术创新,有效提升了单芯片有效算力。MUSA架构,是创新的多引擎、可伸缩GPU架构,通过硬件资源池化及动态资源调度技术,构建了全局共享的计算、内存与通讯资源池。这一设计不仅突破了传统GPU功能单一的限制,还在保障通用性的同时显著提升了资源利用率。 在计算层面,摩尔线程的AI加速系统(TCE/TME)全面支持INT8/FP8/FP16/BF16/TF32等多种混合精度计算。作为国内首批实现FP8算力量产的GPU厂商,其FP8技术通过快速格式转换、动态范围智能适配和高精度累加器等创新设计,在保证计算精度的同时,将Transformer计算性能提升约30%。此外,DeepSeek曾在技术报告中提到,在通信过程中约15%的流式多处理器被占用,也就是差不多15%的算力没有用到训练中,而是被用于通信。摩尔线程是如何解决这个问题的呢,基于自研的MTLINK 2.0实现的集合通信库,实现卡间高速互联,高出国内行业平均水平60%的带宽;同时基于MTT S5000的异步通信引擎,从而实现高效计算与通信并行,减少了15%的计算资源损耗,为大规模集群部署奠定了坚实基础。内存系统方面,通过多精度近存规约引擎、低延迟Scale-Up、通算并行资源隔离等技术,实现了50%的带宽节省和60%的延迟降低。 有了单芯片的算力,还需要实现单节点的高效率,摩尔线程的MUSA全栈系统软件,通过高效的基础软件库,框架算法创新和完备的开发工具链提升了单节点计算效率。在GPU驱动任务调度优化方面,摩尔线程的核函数启动时间仅为业界平均耗时的1/2,核函数启动是指计算任务从CPU主机传输到GPU设备并执行的过程,传统方法中,较高的启动延迟会导致算力资源浪费。而摩尔线程则支持千次计算指令并行下发,从而大幅减少GPU等待时间。摩尔线程还对核心算子库进行了极致优化,比如GEMM算子算力利用率达98%,Flash Attention 算子算力利用率突破95%。 在通信效率上,MCCL通信库实现RDMA网络97%带宽利用率;基于异步通信引擎优化计算通信并行,集群性能提升10%。 在开发生态兼容上,基于Triton-MUSA编译器 + MUSA Graph 实现DeepSeek R1推理加速1.5倍,全面兼容Triton等主流框架。 此外,摩尔线程还提供了完整的开发者工具套件,如深度监控GPU并收集硬件性能数据的Torch Profiler,以及可以一键部署MUSA软件栈和AI服务程序的MUSA Deploy等。正是这种软硬协同与系统优化,实现了极致性能和效率,从平湖和国际主流GPU产品的实测对比数据中,我们可以直观地看到摩尔线程产品的优势。在集群方面,如前文所述,摩尔线程拥有支持千卡互联的KUAE1和支持万卡互联的第二代方案KUAE2,并实现了模型种类全支持,无论何种类型的模型都能适用,这也是真正满足AI工厂使用和实现的地方。根据官方分享的数据,KUAE2在不同架构模型的实测MFU数据对比中,性能和效率均处于行业领先水平。最后也是最重要的一点,那就是稳定性,集群不稳定的话,再高的性能再快的效率也没有任何意义,为此摩尔线程推出了零中断容错技术,故障发生时仅隔离受影响节点组,其余节点继续训练,备机无缝接入,全程无中断,这也使得KUAE集群有效训练时间占比超99%。针对集群中的慢节点,摩尔线程开发了一套多维度Training Insight,将异常处理效率提升了50%,结合集群巡检与起飞检查,训练成功率及速度提高了10%。综合来看,摩尔线程的高效AI工厂结合了全功能GPU、MUSA架构、MUSA软件栈、KUAE集群和零中断技术,为AI大模型训练提供了强大可靠的基础设施支持,而且只有这样的组合,才能确保每一个环节都达到最佳状态。大模型训练完成后,还需要进行推理验证,摩尔线程的推理解决方案基于MT Transformer自研推理引擎、TensorX自研推理引擎和vLLM-MUSA推理框架,为模型验证和部署提供极致性能支持。通过实测,MTT S5000树立了DeepSeek全量模型推理速度的新标杆:跑满血DeepSeek R1推理模型,速度达到100 tokens/s。GPU可以说是AI时代最稀缺的资源之一,也是大国科技竞争的焦点,其重要性不言而喻。我们深知硬科技研发的艰难,但摩尔线程还是选择了通用性最强、难度最高的全功能GPU路线。 从全功能GPU的研发,到“AI工厂”概念的提出与实践,摩尔线程这条道路虽然充满挑战,但它无疑是能够走得最长远的路径。未来,我们期待摩尔线程能够持续突破技术瓶颈,以更强大的算力、更高效的架构、更稳定的性能,为国产AI的发展注入强劲动力。
什么?XBOX官宣将在科隆游戏展开放《空洞骑士:丝之歌》试玩 来源——AMP实验室 什么不存在的东西? 微软宣布将重返今年的科隆游戏展,并为与会者提供试玩《空洞骑士:丝之歌》Demo,试玩设备为全新的 ROG Xbox Ally 掌机。微软将带来超过 20 款游戏的免费试玩,还有一场展示《天外世界 2》的内容全新的影院体验。《丝之歌》将在科隆游戏展上通过新的 Xbox Ally 掌机提供试玩。参展的玩家还将有机会体验微软全新的 Xbox 和 Windows 界面,并且能在 Xbox Ally 掌机上畅玩《Roblox》《盗贼之海》和《托尼・霍克职业滑板 3+4》。此外,《禁闭求生 2》也将亮相科隆游戏展,玩家们还将首次在公众场合体验到《忍者龙剑传 4》。 此次将开放试玩 Demo 的游戏如下: 《空洞骑士:丝之歌》 《无主之地 4》 《鬼武者:剑之道》 《合金装备 3:重制版》 《EA Sports FC 26》 《There Are No Ghosts at the Grand》 《PowerWash Simulator 2》 《最终幻想 7:重制版 Intergrade》 《最终幻想 16》 《Invincible VS》 《超级食肉男孩 3D》 《时间旅者:重生曙光》 《雾影猎人》科隆游戏展(Gamescom)是全球规模最大的互动式娱乐游戏展之一,2009 年起在德国科隆举办,由德国科隆展览公司与德国游戏产业协会联合主办。它集中了游戏硬件、软件、信息软件和设备等,是欧洲电脑和电子产业顶级商务平台,也是游戏厂商与玩家交流的重要盛会。今年的科隆游戏展将于 8 月 20 日至 24 日在德国科隆国际会展中心举行。
真的假的?网传RTX 5090D v2定价大幅降低,5090D已剩最后库存 来源——AMP实验室 有点可笑 谁能想到,原本就是特供于中国市场的RTX 5090D居然还会因为一些莫名其妙的原因又停产。时至今日,这款特供显卡还有少量库存可供销售。而目前英伟达的合作伙伴厂商正在加快清理这部分库存,甚至在海外市场据说也有流出。RTX 5090D在上市后不久,玩家们测试得出这款显卡虽然带了个D后缀,但是面对绝大多数用户而言,这个D并没有体感区别,明面规格包括CUDA内核、显存和显存带宽都保留了下来,只有AI算力压在了禁止线上。 但由于白宫方面的新出口政策,英伟达不得不再次限制这款已经削弱的GPU,而变成了RTX 5090D v2。即便后来英伟达创始人兼CEO黄仁勋到访国内,并且告知已解禁了H20 AI GPU的销售,RTX 5090D依然被纳入封锁产品。 关于RTX 5090D v2的规格我已经谈到过多次,这款显卡在CUDA规格上并无区别, 其GPU代号变更为GB202-240,显存位宽减少到了384Bit,而显存则也跟随减少到了24GB GDDR7。就这款新卡的定价而言,国内论坛Chiphell有了一个说法,chh@sthuasheng 发帖透露,RTX 5090D v2的售价预计在14000元左右,相比于RTX 5090D当前的售价下降了多达30%。 当前RTX 5090D的普遍售价都在19999元,但实际上RTX 5090D的官方建议售价最早披露为16499元,至于有没有人以这个价格买到过,我的倾向是没有。 而现今由于RTX 5090D v2在显存规格上的大型削弱,英伟达将对RTX 5090D v2进行价格下调,这理所应当。 对于游戏而言,24GB显存实际上也已经绰绰有余,但是相比于32GB 的RT 5090/D,在AI性能方面将是一个很大的降级,这也是为什么有些实力足够的用户还是更愿意选择RTX 5090,而不是D版本。 RTX 5090D v2预计将于下个月第一周发布,然后在一周之后上市开售。而在此之前,各家厂商将继续销售RTX 5090D的库存,大部分厂商库存已经见底,RTX 5090D将很快售罄。
微星十年前散热器以38000元高价出售!比原价高10000% 来源——硬件世界 微星在2016年的时候推出了Core Frozr L CPU散热风扇,如今这款产品却在亚马逊上标价5340.25美元(约合人民币38278元)。 而这款风扇在刚发布时的官方售价仅为49.99美元,也就是亚马逊的这一标价相比原价上涨了超过10000%。从产品本身来看,这么高的售价确实令人费解,Core Frozr L虽然是一款经典产品,但它的性能已经无法与现代高端散热器相提并论。 它支持的最新芯片是英特尔第6代至第9代酷睿处理器,以及AMD锐龙5000系列CPU,这无法与最新的英特尔处理器兼容,不过仍然可以用于部分AMD处理器,比如上个月刚刚发布的锐龙5 5500X3D。 就算它能够处理高达200W的CPU热量,但超过5000美元的价格已经让它比一台能够畅玩4K游戏的主机还要贵。目前尚不清楚为何这款散热器的售价如此之高,而且这应该不是第三方故意标高价,因为它是由亚马逊官方直接销售和发货的。 或许亚马逊在更新产品价格时出现了失误,又或许是因为这款散热器被认为具有收藏价值,不过Core Frozr L还远未成为计算机历史上的古董。此外,YouTuber JayzTwoCents展示了将华硕ROG Astral的XOC BIOS刷入技嘉RTX 5090 AORUS Master显卡的过程,并测试了其性能表现。 据JayzTwoCents介绍,刷入的华硕ROG Astral XOC BIOS专为RTX 5090设计,能够将显卡的功率限制提升至1600W,这比普通版本的RTX 5090显卡的功率限制高出不少。不过在刷入BIOS后,技嘉RTX 5090显卡的一个风扇停止了转动,这是因为华硕的这个BIOS仅支持两个风扇控制器,而技嘉的显卡使用了三个控制器,导致第三个控制器无法接收到BIOS数据,从而使一个风扇失效。 在性能测试方面,当将功率限制设置为900W时,与默认设置(未超频)相比,显卡实现了10.3%的性能提升,在超频情况下,优势为的4%。也就是说仅提高功率并不能带来明显的性能提升,进一步调整GPU和显存频率才能实现更高的性能增长,虽然BIOS可能解锁更高的功率限制,但一定要切记,16Pin连接器官方额定功率只有600W。华硕还将于8月19日在科隆游戏展上,推出一款纪念版显卡,以此来纪念其显卡业务三十周年。 这款纪念版显卡可能会基于RTX 5080 GPU打造,而非此前猜测的RTX 5090。VideoCardz通过查看相关页面的源代码,发现了一些已注释掉的占位符数据,这些数据提到了RTX 5080 ROG夜神初音未来版本,不过这款显卡已经在一周前发布了。 从页面规格信息来看,其AI TOPS数值与RTX 5080相符,因此初音未来版本很可能只是一个临时的占位符。 此外,在描述中还提及到了四风扇设计,但外形略有不同,因此这可能是夜神系列的又一新版本。
Intel新一代高端处理器Nova Lake-AX曝光:重新定义高性能笔电 来源——硬件世界 据报道,Intel将在2027年发布的Nova Lake的系列中,推出一款高端移动处理器,内部代号为Nova Lake-AX,以重新定义高性能笔电。 据悉,这款新移动处理器目的是在将强大的CPU和GPU核心集成到单一平台上。 其中,AX的命名是特别强调了其先进的集成式显卡性能,同时也具备强大的计算能力。 这将是Intel首款真正的Halo级解决方案,其将适用于笔记本电脑和移动设备。 根据Intel的计划,Nova Lake将在移动端接替Arrow Lake系列。 届时,Nova Lake-AX将直接和采AMD Zen 6架构Medusa Halo竞争。 据此前报道,AMD的Zen 6将包括四大系列: Medusa Ridge:面向桌面,对应现在的Granite Ridge(锐龙9000系列)。 Medusa Point:面向主流笔记本,对应现在的Strix Point(锐龙AI 300系列)。 Medusa Halo:面向高端笔记本,对应现在的Strix Halo(锐龙AI MAX 300系列)。 Medusa Range:面向顶级游戏本,对应现在的Fire Range(锐龙9000HX系列)。 市场预计,主要OEM厂商如联想、戴尔和惠普很可能会在高端机型上采 Nova Lake-AX,产品定位为超便携工作站或具强大游戏功能的笔电。在桌面端,最近的财报电话会议上Intel CEO陈立武对即将推出的Nova Lake CPU、Coral Rapids服务器CPU以及公司的GPU战略发表了一些评论。 陈立武表示,Intel的新Nova Lake CPU将缩小在高端桌面市场与AMD之间的差距。 这些CPU将在桌面和移动平台上推出,但显然更侧重于桌面市场,AMD目前在性能、游戏、效率和多线程方面都显示出了激烈的竞争和领导地位。 陈立武还提到,18A架构将继续作为至少三代Intel客户端和服务器产品的基石,因此,Nova Lake将使用优化版本的18A架构。 Nova Lake将配备最多52个核心和最新的Xe图形架构,因此在Arrow Lake桌面版发布之后,这确实是值得期待的事情。 “我们仍然需要在高端桌面市场缩小差距,但我对我们无与伦比的市场覆盖能力、我们的x86生态系统以及我们在Nova Lake上取得的进展感到鼓舞,预计将在2026年底推出。”陈立武说。 根据此前消息,Intel计划在下一代Nova Lake中推出配备大容量缓存(BLLC)的版本,以此与AMD的X3D产品线相抗衡。此外,Intel的14A工艺似乎迎来了新曙光,据报道,苹果可能对采用Intel的14A工艺生产未来的M系列芯片感兴趣,而NVIDIA也对这一工艺表现出兴趣。 Intel目前在晶圆代工领域面临诸多不确定性,尤其是其18A和14A等先进工艺的未来发展。 不过,据GF证券分析师Jeff Pu透露,Intel已向包括苹果在内的关键客户提供了14A工艺的早期版本PDK(工艺设计套件),预计NVIDIA的游戏GPU(低端版本)和苹果的M系列将成为14A的采用者。 苹果作为全球科技巨头,一直是台积电的大客户,但若Intel的14A工艺能够满足其需求,苹果可能会考虑将其纳入供应链,以实现芯片供应的多元化。 如果苹果和NVIDIA等大公司真的采用Intel的14A工艺,这将为Intel的晶圆代工业务带来重大突破。 不过,这一消息仍存在变数,Intel需要在技术实力和供应链稳定性上做到足够出色,才能真正赢得苹果和NVIDIA等客户的青睐。 此外,台积电预计将在2028年推出类似技术的A14工艺,苹果是否会选择Intel的14A工艺,还需看Intel能否在技术和产能上给出有力回应。
AMD线程撕裂者9000系列发烧级桌面CPU售价公布!1499美元起 来源——硬件世界 上个月中旬,AMD正式发布了Zen5架构的线程撕裂者PRO 9000WX系列以及线程撕裂者9000X系列,前者面向专业工作站,后者则主打桌面发烧友。即PRO 9000WX系列售价公布之后,9000X系列的价格如今也来了。 AMD已经正式确认,线程撕裂者9000X系列将于7月31日起正式上市,共计三款型号,售价分别为: 9980X,64核、128线程,定价4999美元(约合35834元) 9970X,32核、64线程,定价2499美元(约合17914元) 9960X,24核、48线程,定价1499美元(约合10745元)从AMD官方公布的测试成绩来看,64核的9980X在生产力上完爆60核至强W9-3595X,在内容生成、3D CAD虚拟建模、软件开发等多个项目上具有碾压级优势,领先幅度23%-108%不等。 而32核的9970X比44核至强W9-3575X性能最高快137%。值得一提的是,线程撕裂者9000X系列仅与AMD TRX50主板兼容,提供最高1TB的 DDR5-6400 RDIMM内存支持,并支持超频。以下为AMD线程撕裂者PRO 9000WX系列以及9000X系列规格:另一方面,NVIDIA N1X处理器的GPU规格和性能跑分浮出水面。 据Geekbench的OpenCL测试曝光的信息显示,N1X将搭载与RTX 5070相同核心数的GPU,即6144个核心,48个SM单元,目前尚不清楚N1X是否采用了与RTX 5070相同的GPU芯片。 RTX 5070采用的是GB205 GPU,拥有192 TMUs、80 ROPs、48 RT Cores和192 Tensor Cores,并配备了12 GB GDDR7显存,带宽672 GB/s,其频率可提升至2512 MHz,TDP为250W。 相比之下,Geekbench上列出的N1X GPU频率仅略超过1.05 GHz,远低于RTX 5070,且该芯片没有专用显存,而是与SoC其他部分共享内存。性能方面,N1X在Geekbench OpenCL上得分为46361分,这一成绩远不及RTX 5070,相当于RTX 2050 移动版。 这应该主要是因为该芯片在功耗上受到限制,且目前仍是早期工程样品,预计在正式发布前,NVIDIA肯定还会对其进行调整。 目前有传言称N1X SoC将在2026年的某个时候推出,有的说是上半年,有的说是下半年,不过无论何时,这都将是NVIDIA与x86和Arm领域的巨头如Intel、AMD、高通和苹果的正面竞争。
华为首次线下展出昇腾384超节点:任正非的话应验 来源——硬件世界 今年6月,华为CEO任正非接受人民日报采访时曾表示,芯片问题其实没必要担心,用叠加和集群等方法,计算结果上与最先进水平是相当的。 “我们单芯片还是落后美国一代,我们用数学补物理、非摩尔补摩尔,用群计算补单芯片,在结果上也能达到实用状况。”他说。 如今,这句话已经应验。7月26日,2025世界人工智能大会(WAIC)在上海世博中心启幕,华为首次线下展出昇腾384超节点,即Atlas 900 A3 SuperPoD,该产品基于超节点架构,通过总线技术实现384个NPU之间的大带宽低时延互联,解决集群内计算、存储等各资源之间的通信瓶颈。 通过系统工程的优化,实现资源的高效调度,让超节点像一台计算机一样工作。在今年5月的鲲鹏昇腾开发者大会上,华为推出了昇腾超节点(CloudMatrix 384),成功实现业界最大规模的384卡高速总线互联。昇腾超节点具备超大带宽、超低时延、超强性能的三大优势,包括多款训练和推理产品,基于超节点创新架构,更好的满足模型训练和推理对低时延,大带宽,长稳可靠的要求。本月初,华为云官微通过一段视频展示了CloudMatrix 384超节点算力集群的威力—— 384颗昇腾NPU(昇腾910C)+192颗鲲鹏CPU全对等互联,形成一台“超级AI服务器”; 业界最大单卡推理吞吐量——2300Tokens/s; 业界最大集群算力——16万卡,万卡线性度高达95%; 云上确定性运维-40天长稳训练、10分钟快速恢复。 华为云表示,新一代昇腾AI云服务,是最适合大模型应用的算力服务。 简单来说,华为CloudMatrix并非简单的“堆卡”,而是通过高带宽全对等互联(Peer-to-Peer)来设计,这也是CloudMatrix 384硬件架构的一大创新。 传统的AI集群中,CPU相当于公司领导的角色,NPU等其它硬件更像是下属,数据传输的过程中就需要CPU审批和签字,效率就会大打折扣。 但在CloudMatrix384中,CPU和NPU等硬件更像是一个扁平化管理的团队,它们之间的地位比较平等,直接通过UB网络通信直接对话,效率自然就上来了。 今年4月份,国际知名半导体研究和咨询机构SemiAnalysis发布专题报道称,华为云最新推出的AI算力集群解决方案CloudMatrix 384(简称CM384)凭借其颠覆性的系统架构设计与全栈技术创新,在多项关键指标上实现对英伟达旗舰产品GB200 NVL72的超越,标志着中国在人工智能基础设施领域实现里程碑式突破。 据SemiAnalysis披露,华为云CM384基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。此外,CM384在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍,为大规模AI训练和推理提供了更高效的硬件支持。 (图片引自SemiAnalysis报道)报道分析称,尽管单颗昇腾芯片性能约为英伟达Blackwell架构GPU的三分之一,但华为通过规模化系统设计,成功实现整体算力跃升,并在超大规模模型训练、实时推理等场景中展现更强竞争力。 SemiAnalysis也指出,华为的工程优势不仅体现在芯片层面,更在于系统级的创新,包括网络架构、光学互联和软件优化,使得CM384能够充分发挥集群算力,满足超大规模AI计算需求。 此次华为云CloudMatrix 384的发布,标志着中国在AI计算系统领域已具备与国际巨头正面竞争的实力。 SemiAnalysis在报道中特别指出,华为的规模化解决方案“领先于英伟达和AMD目前市场上的产品一代”,并认为中国在AI基础设施上的突破将对全球AI产业格局产生深远影响。
国产半导体技术新突破:开发出理想的极紫外(EUV)光刻胶材料 来源——AMP实验室 理想级指标 随着集成电路工艺向 7nm 及以下节点不断推进,13.5 nm 波长的 EUV 光刻成为实现先进芯片制造的核心技术。但 EUV 光源反射损耗大、亮度低等特点,对光刻胶在吸收效率、反应机制和缺陷控制等方面提出了更高挑战。 清华大学宣布,该校化学系许华平教授团队在极紫外(EUV)光刻材料上取得重要进展 —— 开发出一种基于聚碲氧烷(Polytelluoxane, PTeO)的新型光刻胶,为先进半导体制造中的关键材料提供了新的设计策略。相关成果已于 7 月 16 日发表在《科学进展》上(DOI: 10.1126/sciadv.adx1918)。 该研究提供了一种融合高吸收元素 Te、主链断裂机制与材料均一性的光刻胶设计路径,有望推动下一代 EUV 光刻材料的发展,助力先进半导体工艺技术革新。清华表示,当前主流 EUV 光刻胶多依赖化学放大机制或金属敏化团簇来提升灵敏度,但常面临结构复杂、组分分布不均、反应容易扩散,容易引入随机缺陷等问题。 如何突破这些瓶颈,构建理想光刻胶体系,成为当前 EUV 光刻材料领域的核心挑战。学界普遍认为,理想的 EUV 光刻胶应同时具备以下四项关键要素: 1)高 EUV 吸收能力,以减少曝光剂量,提升灵敏度; 2)高能量利用效率,确保光能在小体积内高效转化为光刻胶材料溶解度的变化; 3)分子尺度的均一性,避免组分随机分布与扩散带来的缺陷噪声; 4)尽可能小的构筑单元,以消除基元特征尺寸对分辨率的影响,减小线边缘粗糙度(LER)。 长期以来,鲜有材料体系能够同时满足这四个标准。现在,许华平教授课题组基于团队早期发明的聚碲氧烷开发出一种全新的 EUV 光刻胶,满足了上述理想光刻胶的条件。在该项研究中,团队将高 EUV 吸收元素碲(Te)通过 Te─O 键直接引入高分子骨架中。碲具有除惰性气体元素氙(Xe)、氡(Rn)和放射性元素砹(At)之外最高的 EUV 吸收截面,EUV 吸收能力远高于传统光刻胶中的短周期元素和 Zn、Zr、Hf 和 Sn 等金属元素,显著提升了光刻胶的 EUV 吸收效率。 同时,Te─O 键较低的解离能使其在吸收 EUV 后可直接发生主链断裂,诱导溶解度变化,从而实现高灵敏度的正性显影。这一光刻胶仅由单组份小分子聚合而成,在极简的设计下实现了理想光刻胶特性的整合,为构建下一代 EUV 光刻胶提供了清晰而可行的路径。
英特尔将以14A从头打造代工业务苹果M和英伟达游戏显卡或成为客户 来源——AMP实验室 你最好能活下去 26 日消息,英特尔发力芯片代工,在昨日的财报电话会议表示,正与大型外部客户紧密合作,从头开始将 14A 打造为代工节点。 分析师 Jeff Pu 今日爆料称,英特尔正在向其客户测试 14A PDK 的早期版本,而目前看来,英伟达和苹果似乎都对此感兴趣。 英特尔 14A 工艺的下一个重点将包含第二代 RibbonFET 和 PowerDirect,标志着在英特尔 18A 中引入的 PowerVia 基础上构建的技术演进。针对 AI 和边缘应用,英特尔已经向关键客户提供了 14A PDK 的早期版本,其中几家表达了生产测试芯片的兴趣。我们预计英伟达的游戏 GPU(低端版本)和苹果的 M 系列将成为 Intel14A 的采用者。 ——英特尔25Q2电话财报会议 鉴于英特尔目前的状况,需要对此传言持保留态度。外媒 wccftech 表示,预计台积电将在 2028 年推出自己的 A14 工艺,与英特尔采用解决方案的时间类似。因此,作为台积电关键客户的苹果,可能会多元化其供应链组合,采用英特尔和台积电双代工方案,但只有在英特尔提出一个功能强大的解决方案和稳固的供应链时才会发生。对于英伟达来说,该公司数月来一直有传言称在与英特尔晶圆厂合作,主要是因为人工智能热潮太过迅猛,无法依赖单一芯片代工厂。然而,目前双方还没有突破性合作进展公布。实际上英特尔还曾表示,若 Intel 14A 无法获得重要的外部客户,也未能达到重要里程碑,公司可能放缓甚至取消 14A 及后续领先制程节点的开发。因此,如果能拿下苹果或英伟达,将是至关重要的一步。
华硕新收割行动?ROG将推出30周年纪念版特殊夜神显卡 来源——AMP实验室 又是一个赚米小技巧 昨日,华硕开展了一场名为“Unlock the ROG Lab”的新闻发布会。这个活动可能对一些粉丝比较熟悉,因为华硕在1月份的CES 2025上举办了类似的活动,会议上展示了多款产品,包括RTX 50 ROG Astral GPU、ROG笔记本电脑和ROG显示器。 在即将到来的科隆游戏展上,华硕将展示一款目前称为"30周年纪念版"的新显卡。华硕为该活动准备了一个专门页面,页面上列出的规格强烈表明该卡将基于RTX 5080 GPU,而不是5090,并且AITOPS算力指标数字与5080相匹配。 因此预期中的产品应该不是ROG Matrix骇客或者是Poseidon海神,所以这大概率又是一款夜神新换皮,特别是在描述中提到了四风扇设计。ROG很明确自己的服务对象,那就是不差钱的富哥,像本代新推出的Astral 夜神(虽然我不知道为什么直译星空被翻译成夜神,但是ROG似乎一直都是这样前言不搭后语的翻译),属于纯血ROG IP的产品而不是以前持续了几代的ROG Strix ,更是要多多推出变体、定制版,展示高端发烧玩家的独特性,你获得了这些特殊版本的ROG IP产品,那么就证明你与众不同。 目前Astral夜神已经推出了基础版、Dhahab中东黄金版、初音未来联名版以及不会上市的真黄金版,很显然ROG不会止步,在这个世代中肯定还会推出更多的Astral,现在曝出的30周年纪念版将是他们的下一步。
砺算科技7G106游戏显卡现场演示,黑神话悟空4K高画质已驾驭 来源——AMP实验室 横空出世? 最近几年关于国产GPU的消息不能算少,并且也算是取得了一定成绩,让玩家们对于国产GPU的未来还是有所期待。特别是摩尔线程家的MTT显卡,理论性能已经达到主流市场需求,软件生态方面也一直有在持续进步中。 而在昨天,砺算科技推出了其自主研发的首款国产 6nm 游戏 GPU——7G106。 砺算科技成立于 2021 年 8 月,由三位业内资深专家联合创立,其核心团队来自 GPU 行业知名公司,具有丰富的研发经验。公司聚焦自研 GPU 架构,致力于研发多层次图形渲染 GPU,打造了自研盘古架构™、天图 TrueGPU™等产品,旨在满足不同领域的芯片和算力需求。 这款 GPU 基于台积电 N6 工艺,采用了该公司自主研发的 TrueGPU 图形架构,支持 DirectX 12、Vulkan 1.3、OpenGL 4.6 和 OpenCL 3.0 等主流 API,但不支持光线追踪。 砺算科技表示:“这款凝聚了砺算三年多心血的 GPU,能为游戏玩家,带来强劲,畅爽的娱乐体验;会为内容创作者与专业工作站用户,打造流畅,愉快的工作体验;也将为元宇宙和数字孪生,带来沉浸真实的未来体验。” 根据目前公开的信息,7G106拥有192 个纹理映射单元(TMU)和 96 个光栅操作单元(ROP),这个规格在显卡里算挺高的了,虽然不知道它的ROP每个对应多少流处理器,但192个TMU在N卡上,已经是RTX 5070这个级别。此外,砺算7G106搭配了12GB GDDR6显存,192Bit显存位宽,采用 SIMD 引擎,支持 FP32 和 INT8 计算,FP32 最大吞吐量达 24 TFLOP/s,支持 OpenCL 3.0。其渲染图显示采用单8PIN供电,结合PCIe ×16,其TDP低于225W。而关于媒体引擎方面,7G106支持硬件加速 AV1、HEVC 解码(最高 8K 60FPS),编码方面支持 AV1 4K 30FPS、HEVC 8K 30FPS 硬件加速。 公司还宣布了一款配置为24GB显存的专业版本7G105,规格相似,但是有些许区别,例如拥有额外的安全防护。在发布会上,砺算科技演示了7G106运行《黑神话:悟空》4K分辨率高设置,帧速率虽然没有确切给到,但是算是流畅。基准测试结果显示,7G106在3DMark Fire Strike得分为26800分,在Geekbench OpenCL 6.4.0 中得分为111,290分,在后者中比RTX4060领先约10%。然而,其Fire Strike得分明显低于NVIDIA的RTX 5060、RTX 5050和AMD的 RX 9060 XT,后者均高于29,000分。公司表示其A0步进芯片在5月下旬最终确定,因此发布日期、定价和最终核心速度等细节仍有待确认。 尽管如此,该7G106 GPU已经大致确认出了其产品定位,显然这样的性能能够在2000以内的主流市场上有一定竞争力,不过具体能不能站稳,还要看后续的优化和软件支持,据称其将于9月开始量产。 目前A/N两家已经将市场主力产品更新到了台积电N5/N4工艺,7G106采用N6工艺显然拥有一定的成本优势。不过还要看这颗芯片的面积,希望这款能够平衡好成本和售价以及性能,不要像MTT那样初期定个高价,后面腰斩卖
华为昇腾384超节点首次线下亮相!强势碾压英伟达、AMD 来源——硬件世界 今日,2025世界人工智能大会(WAIC)在上海世博中心盛大举行。在此次大会上,华为首次线下展出了昇腾384超节点,其正式名称为Atlas 900 A3 SuperPoD。这款产品基于超节点架构打造,通过总线技术达成了384个NPU之间的大带宽低时延互联,有效解决了集群内计算、存储等各资源之间的通信瓶颈问题。 同时,借助系统工程的优化,实现了资源的高效调度,让超节点能够像一台计算机一样稳定工作。其实,在今年5月的鲲鹏昇腾开发者大会上,华为就已推出了昇腾超节点,成功实现了业界最大规模的384卡高速总线互联。 昇腾超节点具备超大带宽、超低时延、超强性能三大显著优势,涵盖多款训练和推理产品。 据官方公告,华为的AI算力集群解决方案CloudMatrix 384,以384颗昇腾芯片为基础构建,通过全互连拓扑架构实现芯片间的高效协同。 该方案可提供高达300 PFLOPs的密集BF16算力,性能接近英伟达GB200 NVL72系统的两倍。此外,CM384在内存容量和带宽方面同样优势明显,其总内存容量超出英伟达方案3.6倍,内存带宽达到英伟达方案的2.1倍,为大规模AI训练和推理提供了更为高效的硬件支持。尽管单颗昇腾芯片的性能约为英伟达Blackwell架构GPU的三分之一,但华为通过规模化系统设计,成功实现了整体算力的显著跃升,并在超大规模模型训练、实时推理等场景中展现出更强的竞争力。 按照国外投行的观点,华为的规模化解决方案“领先于英伟达和AMD目前市场上的产品一代”,并且认为中国在AI基础设施上取得的突破,将对全球AI产业格局产生深远影响。
真的来了!砺算科技发布国产真自研高性能GPU:对标英伟达/AMD 来源——硬件世界 今天,砺算科技发布了第一代TrueGPU系列图形卡,官方表示这是国产真自研高性能图形GPU。 这次发布会砺算科技带来了两款产品,分别是首款GPU芯片“7G100”系列和首款显卡产品Lisuan eXtreme系列。 作为一款全自研高性能图形GPU,砺算7G100系列从指令集到计算核心完全由自主设计,基于自研TrueGPU天图架构,并自研指令集、自研软件栈。 在效率表现上,砺算7G100系列最多可同时运行48个没有依赖的任务,能够最大化GPU使用效率,实现“智能多任务处理”。 官方表示,这是通过打破三角形渲染的顺序限制,在不依赖顺序的场景下提升50%渲染效率,实现“智能乱序渲染”。 7G100系列GPU支持FP32或INT32的指令双发射,实现“硬件级智能分配”。 砺算7G100系列GPU能通过硬件自动检测与任务智能分配系统,将巨量的3D渲染和通用计算任务划分为更小的子任务,依据当前硬件负载情况动态分配给计算单元,实时平衡负载。 此外,官方还指出,他们聚焦GPU处理器资源平衡,砺算GPU能够通过TEX/UAV指令任务动态均衡系统,自动监控并调整任务分配,智能优化数据流,消除因应用程序偏好而导致的资源不均衡。 砺算GPU支持NRSS动态优化渲染画质,实现对英伟达DLSS技术和AMD FSR技术的对标。 7G100还支持SRIOV技术,最多支持16路虚拟GPU,能够为云端应用部署提供更多可能性。 按照之前的说法,这款国产自研GPU基于6nm工艺。对于7G100,砺算科技表示:“这款凝聚了砺算三年多心血的 GPU,能为游戏玩家,带来强劲,畅爽的娱乐体验;会为内容创作者与专业工作站用户,打造流畅,愉快的工作体验;也将为元宇宙和数字孪生,带来沉浸真实的未来体验。”“7G100系列GPU是砺算交出的答卷,更是献给每一位关注者的承诺。我们希望它不仅符合你的预期,更超越你的想象。”砺算科技说道。 该GPU在Geekbench中的成绩显示,OpenCL得分111290分,约比RTX 4060强了10.16%,比RTX 5060弱了7.96%,这么来看的话还是很强的。
英特尔已计划裁撤达30%员工,后续至强Coral Rapids将回归超线程 你这日子…… 美国媒体CRN报导,英特尔在这个月早些时间已经开始通知俄勒冈州、加利福尼亚州、亚利桑那州和新墨西哥州计划裁撤数千名员工,而这是公司年底压缩到75000名员工计划的一部分。今年上任的新CEO陈立武在四月透露,公司将开始执行提高执行力和运营效率的计划,而裁员则是行动方案之一。英特尔拒绝透露到目前为止有多少员工受到影响。 “我们需要调整公司规模并缩减规模,同时确保我们留住最优秀的内部人才,并从工业界和大学聘请最优秀的外部人才。这些都是艰难但必要的决定,我们在此过程中减少了大约 50% 的管理层。” “我们专注于加强我们的核心产品组合和人工智能路线图,以更好地服务客户。我们还在采取必要的行动来建立一个财务纪律更强的代工厂。这需要时间,但我们看到了增强竞争地位、提高盈利能力和创造长期股东价值的明显机会。” ——英特尔CEO陈立武,25Q2财季电话会议 英特尔目前的情况算得上是这家公司成立以来最糟糕的状态,而公司正在寻求财务重振,从目前的状况来看,这需要几个月甚至几年的时间。而目前就接下来的产品来看,在2028年之前都很难让市场对英特尔重振信心。 而说到2028年,陈立武在财报会议后发表了关于后续战略产品的言论,提到了即将推出的Nova Lake CPU、回归支持SMT超线程技术的全P核Coral Rapids服务器CPU,以及后续的GPU战略。 WCCFTech的报道,媒体精简了相关内容,将其直接罗列: ▲首款 Panther Lake Mobile SKU 将于 2025 年底推出; ▲Panther Lake Ramp 和更多 SKU 计划于 2026 年初推出; ▲Nova Lake 旨在与 AMD 缩短高端台式机 CPU 差距; ▲Nova Lake 将于 2026 年底推出,适用于移动和桌面平台; ▲英特尔 18A 将成为至少三代客户端/企业产品的主要驱动力; ▲Diamond Rapids P核CPU将多达256核,于2026年下半年推出; ▲Clearwater Forest E核CPU将多达288核,于 2026 年年中推出; ▲Coral Rapids 将于 2028-2029 年取代 Diamond Rapids; ▲SMT 回归,在P核至强Coral Rapids重新引入; ▲基于 x86 CPU 和 Xe GPU 进行整合和构建; ▲英特尔 14A 瞄准 2028-2029 年时间框架,应对台积电 A14工艺 看上去英特尔准备好了长达数年的多个项目,这似乎能提振市场对公司的信心。今年推出的Panther Lake是当下英特尔专注的产品,首个SKU将在年底开始交付,并在明年上半年推出更多细分型号。Panther Lake上有不少优势点,而它的成功与否将决定英特尔的下一步行动。 然而,陈立武还提到,晶圆成本上升,Panther Lake的利润将很紧张,而在后续产品成熟产量提高后,它们将回归到正确的成本结构。而谈到标题,英特尔还是决定将超线程技术带回到P核心架构,至少要在服务器端产品做到这样。从Diamond Rapids的继任者Coral Rapids开始,英特尔将融合SMT超线程技术,但是消费级的Panther Cove、Cougar Cove则放弃了SMT。 英特尔当下背负重担,新CEO陈立武目前看起来对部分产品乐观,但对于关键的代工部门进展保持谨慎。有限的努力依然在进行中,只有时间才能证明英特尔的这些行动,是否有效。
中国AI芯片维修需求暴增 有商家月修500块英伟达高端GPU 来源——硬件世界 据媒体报道,目前中国市场上已有十余家小型专业公司专门从事英伟达H100、A100等高端芯片的维修业务,这些被美国禁售的芯片主要通过特殊渠道流入国内。2022年9月H100发布前夕,美国政府将其与已上市两年的A100同时列入对华禁售清单。 深圳一位拥有15年英伟达游戏GPU维修经验的商家在2024年底转型AI芯片维修,其合伙人坦言:"维修需求远超预期。"由于订单激增,他们专门成立了新公司,目前月均维修量达500块英伟达AI芯片。为保障维修质量,该企业甚至配备了可模拟数据中心环境的256台服务器测试机房。 受禁令限制,英伟达无法为这些受限产品提供官方维修服务。消息人士透露,在其他国家,保修期内故障的GPU通常直接更换。英伟达发言人强调,只有官方授权渠道才能提供可靠服务,未经授权的维修"在技术和经济层面都不可行"。 尽管英伟达近期获准销售中国特供版H20芯片,但市场接受度有限。一方面,8块H20 GPU的服务器售价超百万元;另一方面,其AI推理性能虽优,却难以满足大语言模型训练的需求。 业内人士指出,国内在用的H100/A100因长期高负荷运转,故障率持续攀升,这类GPU的正常寿命通常仅2-5年。 维修报价方面,深圳两家服务商分别透露:基础维修费1-2万元/块,或按原价10%收费。服务涵盖软件调试、硬件维修(风扇/电路板/显存)及部件更换。值得注意的是,市场对最新B200芯片的需求已然显现——搭载8块B200的服务器在国内叫价已突破300万元。
RTX 5090接口又烧毁!完整过程被记录 来源——硬件世界 NVIDIA RTX 5090显卡的16-Pin电源接口再次出现了烧熔问题,尽管事先已确认连接正确,并使用了原装的12V-2×6电源线,但仍然无法避免过热风险。 随着《明末:渊虚之羽》发售,DSO Gaming的主编John Papadopoulos也对该游戏进行了测试,就在测试时发现其显卡电源接口出现烧熔。事件发生时,显卡并未宕机或出现错误,直到冒烟,他才发现接口底部的接点已经熔化变形,这也是少数有完整记录的案例之一。 起初GPU负载20分钟并未显示异常,温度维持在78°C以下;直到稍后观察到接口底部冒烟与焦味,才惊觉灾情发生。 John表示,他已严格按照建议安装方式操作,插口也已“完全插入”显卡接口,一些读者看到图片后认为接口和连接器之间存在“间隙”,但这已经是连接器能到达的最深处。John认为这正是问题所在:当插口未完全吻合所有接点时,电流会集中流经少数完全接触的pin上,导致局部过热,即使表面来看没问题,内部接触仍有可能不完全,造成灾难性后果。 而且John非常熟悉各种设备的运作方式,并且从一开始就记录了所有细节,即使连接器未能完全接触,这也是由于连接器设计缺陷所致,毕竟这种情况已经发生了很多次。在烧熔发生后,John将GPU拔除重插后(未更换电源线),系统竟可正常启动运作,这进一步凸显12V-2×6接头设计缺乏“正确插入”检测机制,用户无法判断是否安全接触所有导电点。 这种情况在媒体测试人员身上都会发生,对一般消费者风险可能就更高,从RTX 4090开始,NVIDIA所采用的12VHPWR与12V-2×6规格就备受争议。 虽然新版接头已改善某些问题,但此次事件显示,接头与显卡之间仍存在“电流分配不均、缺乏插入检测”的缺陷。 另外,AMD线程撕裂者PRO 9000WX系列工作站CPU已正式上市,极客湾在这颗CPU的测试中,进行了一项很有意思的测试。 其将宝马M4的汽车散热器应用到了AMD线程撕裂者PRO 9995WX上,最终实现了全核超频至4.9GHz。极客湾所使用的宝马M4的散热器拥有600x350mm的超大面积,表面积大约是360mm散热器的五倍,水泵同样是来自M4,流量可以达到每小时约1200升,是高端360mm AIO散热器流量的近10倍。为了给这个巨大的散热器降温,极客湾还使用了丰田汉兰达的300mm大风扇,功率高达100W,提供了巨大的风量。 最终成功将线程撕裂者PRO 9995WX的96个核心全部超频至4.9GHz,Cinebench R23得分达到了187153分。不过这一成绩仍然远低于使用液氮冷却的世界纪录,后者达到了全核5.8GHz,比使用M4散热器高出了900MHz。 其实并不是这个水冷不够强,而是这颗CPU的瞬时功耗实在是太高了,在4.9GHz下瞬时功耗就已经超过了2000W,直接拉爆了1600W的电源。就算是供电足够,车规级散热也无法应对这个瞬时发热,这时冷头已经成了最大瓶颈,也就是想要挑战这颗CPU的极限,还是需要液氮。
疑摩尔线程S90首曝!2年前的国产显卡 玩游戏竟然比RTX4060还厉害 来源——硬件世界 摩尔线程这是憋了个大招!近日,摩尔线程新一代图形显卡MTT S90疑似首度曝光,实测性能媲美NVIDIA RTX 4060! MTT S90是摩尔线程在两年前就计划推出的产品,与其AI智算卡MTT S4000采用同一芯片架构。 那S90的游戏性能到底怎么样呢?知名博主“差评”对摩尔线程S4000的图形性能进行了跑分,考虑它与S90同宗同源,基本可以拿来参照。实测结果显示,摩尔线程S4000的鲁大师、3DMark Steel Nomad和Unigine Valley得分均超过RTX4060,只在Fire Strike Ultra中稍逊一筹。不仅是Benchmark,该卡在实际游戏测试中也尤为亮眼,4K极高画质设定下的《永劫无间》平均帧率达到了43fps,同样略高于RTX 4060(42fps)。这还是在测试版驱动未针对S4000进行过专门优化下进行的测试,如果能像S80一样持续深度优化,S4000很可能在图形性能上实现对RTX 4060大幅超越。摩尔线程S4000于2023年9月正式发布,与RTX 4060基本属于同时期发布,可以说已经追上了同时期NVIDIA主流型号的性能水平。 依照“差评”的数据,对比S80在最新驱动下的性能,其跨代性能提升达到了80%以上。考虑到S4000只比S80晚不到一年,这个提升幅度可谓惊人。 如此来看,S90如果是基于S4000的同代架构推出的面向游戏市场的显卡,那性能显然更值得中国玩家期待,也必将进一步巩固摩尔线程国产图形性能第一的宝座。 摩尔线程MTT S80
最新统计,英特尔在企业级市场份额腰斩 来源——AMP实验室 求你别死 要说AMD在处理器方面哪个产品最强,实际上还得是霄龙,ZEN架构横空出世,让AMD能够肆无忌惮地展开核战争,巴掌大的霄龙处理器上,先一步至强达到了64核心,而到现在,采用高密度ZEN5C核心的霄龙已经达到了128核心,ZEN架构的强势让英特尔至强节节败退。但企业端客户并不会因为短时间的某款产品大幅进步而逐步转向,这些客户遵循自己的设备更迭周期,因此在相当长的一段时间内,AMD的霄龙处理器并没有在企业市场上显著夺取份额,但是那一天总会到来。PassMark在其网站上公布了最新的市场份额调查,在企业端市场这一折线统计图上,AMD的企业客户市场份额从今年Q1季度开始飙升,从最初的12.5%现在直接来到了36.5%,而由于这条赛道只有英特尔和AMD,因此反过来说,英特尔失去了多达24%的巨额市场。在2017年,AMD在服务器CPU市场份额仅有2%,而当现任CEO苏姿丰博士接手公司后,AMD优先进攻工作站领域,推出了第一代EPYC霄龙“Naples”,将传奇ZEN架构引入了该平台。 而英特尔的业务在过去几个季度一直处于低迷状态,主要由于领导层变动以及公司未能达到先前的规划预期。英特尔的至强平台一直在架构方面取得进步,但由于制造节点的落后,客户更愿意选用AMD的服务器处理器,因为AMD和台积电的深度稳步合作,在市场上推出了更好的产品。 而在消费级端,真正的下一代Nova Lake消息在进一步炒作中,由于现在的Raptor Lake暴雷和Arrow Lake的平淡无奇,导致最近酷睿处理器在玩家中留下了深刻的负面印象,并且频繁的更换主板插槽也为玩家诟病,尽管如此,英特尔仍将在后续CPU架构Nova Lake选择新的平台。不过新消息显示,Nova Lake将带来一项重大变化,可能使得英特尔酷睿能重夺游戏CPU口碑。传言称,英特尔正在考虑推出具有大缓存的CPU变体,类似AMD的3D V-Cache产品线。 该变体重点被称为bLLC“大型末级缓存”,有可能会作为一个单独的Tile进行封装,或者像AMD那样被封装到计算核心上。但可以确定的是,这些处理器变体会明确增加缓存大小。媒体推测,部分变体可达到最高144MB的L3缓存,这个数字比现在的9950X3D的128MB 组合L3缓存还要更多。 然而英特尔依然还将采取大小核策略,Nova Lake将采用包括16P+32E、8P+16E和8P+12E等核心配置,不过bLLC变体据说只有后两者才有实现。知名爆料者twi@oneraichu 透露,8P+16E将率先上市,随后推出16P+32E型号。另一名数据挖掘者twi@haze2k1 则确认了8P+16E和8P+12E的两个变体,这些都拥有4个LP内核以及125W的TDP。不过处理器讨论最终还要回归到性能,但是之前流传的消息并不算有利,有消息表示Nova Lake相对于Arrow Lake,单核提升只有10%左右。现在无论是企业端还是消费级,关于英特尔的消息没有一点好的,这样下去AMD的屁股都要飞到天上去,后续的ZEN6要卖多少我都不敢想了。
最新统计,英特尔在企业级市场份额腰斩 来源——AMP实验室 求你别死 要说AMD在处理器方面哪个产品最强,实际上还得是霄龙,ZEN架构横空出世,让AMD能够肆无忌惮地展开核战争,巴掌大的霄龙处理器上,先一步至强达到了64核心,而到现在,采用高密度ZEN5C核心的霄龙已经达到了128核心,ZEN架构的强势让英特尔至强节节败退。但企业端客户并不会因为短时间的某款产品大幅进步而逐步转向,这些客户遵循自己的设备更迭周期,因此在相当长的一段时间内,AMD的霄龙处理器并没有在企业市场上显著夺取份额,但是那一天总会到来。PassMark在其网站上公布了最新的市场份额调查,在企业端市场这一折线统计图上,AMD的企业客户市场份额从今年Q1季度开始飙升,从最初的12.5%现在直接来到了36.5%,而由于这条赛道只有英特尔和AMD,因此反过来说,英特尔失去了多达24%的巨额市场。在2017年,AMD在服务器CPU市场份额仅有2%,而当现任CEO苏姿丰博士接手公司后,AMD优先进攻工作站领域,推出了第一代EPYC霄龙“Naples”,将传奇ZEN架构引入了该平台。 而英特尔的业务在过去几个季度一直处于低迷状态,主要由于领导层变动以及公司未能达到先前的规划预期。英特尔的至强平台一直在架构方面取得进步,但由于制造节点的落后,客户更愿意选用AMD的服务器处理器,因为AMD和台积电的深度稳步合作,在市场上推出了更好的产品。 而在消费级端,真正的下一代Nova Lake消息在进一步炒作中,由于现在的Raptor Lake暴雷和Arrow Lake的平淡无奇,导致最近酷睿处理器在玩家中留下了深刻的负面印象,并且频繁的更换主板插槽也为玩家诟病,尽管如此,英特尔仍将在后续CPU架构Nova Lake选择新的平台。不过新消息显示,Nova Lake将带来一项重大变化,可能使得英特尔酷睿能重夺游戏CPU口碑。传言称,英特尔正在考虑推出具有大缓存的CPU变体,类似AMD的3D V-Cache产品线。 该变体重点被称为bLLC“大型末级缓存”,有可能会作为一个单独的Tile进行封装,或者像AMD那样被封装到计算核心上。但可以确定的是,这些处理器变体会明确增加缓存大小。媒体推测,部分变体可达到最高144MB的L3缓存,这个数字比现在的9950X3D的128MB 组合L3缓存还要更多。 然而英特尔依然还将采取大小核策略,Nova Lake将采用包括16P+32E、8P+16E和8P+12E等核心配置,不过bLLC变体据说只有后两者才有实现。知名爆料者twi@oneraichu 透露,8P+16E将率先上市,随后推出16P+32E型号。另一名数据挖掘者twi@haze2k1 则确认了8P+16E和8P+12E的两个变体,这些都拥有4个LP内核以及125W的TDP。不过处理器讨论最终还要回归到性能,但是之前流传的消息并不算有利,有消息表示Nova Lake相对于Arrow Lake,单核提升只有10%左右。现在无论是企业端还是消费级,关于英特尔的消息没有一点好的,这样下去AMD的屁股都要飞到天上去,后续的ZEN6要卖多少我都不敢想了。
蒸蒸日上,海力士告知24Gb G7显存已就绪,并将保证HBM4内存供应 来源——AMP实验室 幕后赢家之一 在最近的25Q2财报电话会议上,SK海力士透露了其在DRAM领域目前的进展和即将推出的解决方案。该公司强调其 12-Hi HBM3e DRAM 的销售额扩大,而 DRAM 和 NAND 闪存的出货量均高于预期,达成近段时间以来最好的季度业绩。主要公告提及SK海力士目前正在开发其 24 Gb GDDR7 内存模块,该模块将用于为下一代显卡提供动力,并为 AI 客户提供更多空间来扩展其产品的 VRAM 容量。24Gb (3 GB) VRAM 将提供比现有 16Gb (2GB) 芯片多 50% 的容量。 而随着时间推进,GDDR7 也有望在速度方面得到提升,30Gbps+将变得更加主流。40Gbps+ 解决方案进入市场还需要一段时间,但更高的 VRAM 容量肯定会很棒。英伟达等 GPU 制造商可以灵活地使用来自各种合作伙伴的 GDDR7 内存,包括 SK海力士、三星和美光。 目前市场上的24Gb G7显存颗粒由三星提供,并且在其官网也可以看到相关销售。英伟达即将带来的RTX 50系中期SUPER升级将利用这些增加容量的显存模块,不过这个时间点预计在今年底明年初。 公司预计,产品的稳健表现和量产能力将有助于 HBM 与去年同期相比翻一番,从而产生稳定的收益。此外,公司还将确保根据客户的要求及时提供HBM4,以保持竞争力。 SK海力士将于今年内开始为服务器提供基于LPDDR的模块,并准备推出容量从16Gb扩展到24Gb的AI GPU用GDDR7产品,以期通过产品多样化增强其在AI内存市场的领导地位。 ——SK海力士公司的重点还在于HBM内存业务,下一代HBM4标准将影响HPC/AI领域。英伟达和AMD预计在其Rubin和MI400上用到新的内存解决方案。据报道,相关用于评估的初步供应已在上个月开始,而最近的HBM产品路线图也展示了下一代标准将如何与现有方案叠加,以及采用什么样的架构。
十年河东十年河西!AMD终结Intel CPU独大地位:2%到50%只用了8年 来源——硬件世界 十年河东十年河西,在服务器CPU市场上,AMD一举终结了Intel多年以来的独大地位。 根据PassMark服务器CPU市场占有率调查数据,AMD在服务器CPU市场的份额已与竞争对手Intel持平,达到50%。 这代表着AMD在数据中心CPU领域拿下了一定的市场需求,并终结了Intel数十年来在该市场的主导地位。2017年AMD在服务器CPU市场的占比仅为约2%,主要原因是产品竞争力不足。当时Intel份额几乎达到了98%,一家独大。 在短短几年内,AMD的市场占比就跃升到目前的50%,这一进步主要归功于其EPYC服务器CPU产品线的竞争力明显提升,特别是导入Zen架构的EPYC Naples系列,成功吸引了客户的青睐。 与AMD的上升趋势形成鲜明对比的是,Intel在过去几个季度一直表现低迷。 主要是由于其领导层变动,以及未能产品发展达到市场预期。 尽管Intel Xeon平台在架构上有所进步,但客户越来越倾向于在他们的数据中心部署AMD的处理器。面对AMD的顺风顺水,Intel自然会有所动作,Intel正计划在下一代Nova Lake架构中引入大变革,以期重新夺回游戏CPU市场。 据传,Intel正考虑推出配备大容量缓存((bLLC))的CPU版本,与AMD的3D V-Cache产品线相抗衡。 据最新爆料,8P/16E型号会首先推出,16P/32E预计将随后推出,其中8P/16E版本将采用大容量缓存设计。与AMD不同的是,Intel并不打算在这一细分市场中推出仅包含性能核心(P-cores)的CPU。 预计Nova Lake将包括16P/32E、8P/16E和8P/12E等版本,据说只有最后两种将使用大容量缓存配置。 目前尚不清楚Intel的大容量L3缓存是否会作为单独的模块放置,或者如一些传言所说的那样集成到基础模块中,但可以确定的是缓存大小预计将大幅增加。 而且也还没有标准Nova Lake SKU缓存大小的信息,因此不清楚BLLC是如何定义的,因此虽然预计缓存大小将全面增加,但具体细节仍然未知。此外,AMD首席执行官苏姿丰近日表示,与台积电位于中国台湾的工厂相比,其公司在台积电亚利桑那州工厂生产的芯片成本将会更高。 苏姿丰指出,美国工厂生产的芯片成本将比中国台湾工厂制造的同类芯片“高出5%以上,但不会超过20%”。她强调,尽管成本增加,这笔额外支出是值得的,因为这有助于AMD实现关键芯片供应的多元化。AMD预计将于今年年底在台积电亚利桑那工厂启动首批芯片生产。 在评估制造效率的重要指标——良率方面,苏姿丰表示,台积电亚利桑那新工厂的表现已能与台湾工厂相媲美。 近期,AMD及其主要竞争对手英伟达(NVDA.US)获得了部分类型人工智能加速器对华出口的豁免许可。目前尚不清楚具体发放的许可证数量以及允许向中国出口这些芯片的期限。 苏姿丰在演讲中还提到,她观察到市场对人工智能芯片的需求持续强劲,作为英伟达在人工智能加速器市场的主要竞争对手,AMD正专注于提供用于开发和运行人工智能模型的芯片。
到底谁在挤牙膏!AMD、NVIDIA显卡代际提升对比:平均差了12% 来源——硬件世界 最新的测试显示,AMD在每一代显卡性能提升上,比NVIDIA显卡提升更多。 TechSpot对两家公司过去几年的显卡发布进行了测试,结果显示,AMD的平均代际性能提升比NVIDIA高出12%。 测试中,TechSpot对NVIDIA的RTX 5060、3060和2060与AMD的RX 9060 XT 8GB、7600、6600和5600 XT进行了对比。 NVIDIA的xx60系列显卡一直是大多数玩家所使用的显卡,AMD的情况也类似,因此测试针对的是大多数PC玩家能够负担得起的显卡。结果显示,从RDNA 1到RDNA 2性能提升了15%,从Turing到Ampere提升了18%;从RDNA 2到RDNA 3,AMD的性能提升了30%,而从Ampere到Ada Lovelace的提升为11%。 从RDNA 3到最新的RDNA 4,AMD显卡性能更是提升了46%;而Ada Lovelace与Blackwell之间的差距只有24%。 总体来看,AMD从RDNA 1到RDNA 4共提升了119%,平均代际提升为30%;而从Turing到Blackwell,NVIDIA显卡性能提升为64%,平均代际提升为18%。 测试包括《彩虹六号:围攻X》、《王国降临:解放2》、《赛博朋克2077》等游戏,在1080p和1440p分辨率下,使用不同的图形预设进行。说到NVIDIA显卡,近日华硕ROG夜神RTX 5090D的一款非官方的BIOS文件出现在网络上,这款BIOS将显卡的功耗限制提升到了惊人的2001W,几乎是标准575W功耗限制的三倍半。 当然,由于功耗提升了这么多,很可能会使其原装散热解决方案不堪重负,因此用户可能需要定制的水冷(或液氮)来确保显卡不会过热损坏。而且用户还需要一个能够提供如此大功耗的电源,此外由于这是未验证的BIOS,安装后显卡的保修将自动失效。 这并非我们首次看到功耗达到千瓦级别的显卡BIOS,前几天,影驰拥有双16Pin的RTX 5090D名人堂的一款BIOS也在网上出现,同样拥有高达2001W的功耗。 不过影驰的这款显卡仅在国内销售,而ROG 5090夜神则在全球都有销售,虽然泄露的BIOS是针对于RTX 5090D,但 VideoCardz指出它可能与所有ROG夜神RTX 5090兼容。RTX 5090D已经停产,但对于拥有这张卡的用户来说,可以通过这个BIOS将功耗限制从接近600W提升2001W瓦特。 但请记住,除非你是专业的超频玩家,否则不要轻易尝试。说到显卡,最新消息显示,RTX 3050入门显卡即将迎来第五款产品——GeForce RTX 3050 A。 根据最新的GPU-Z更新,其已经支持了这款未发布的GeForce RTX 3050 A显卡,但不确定是移动版还是桌面版。这款显卡最早被发现是在去年的PCI ID数据库中,当时被称为GeForce RTX 3050 A Laptop GPU,NVIDIA后来确认了其存在,并透露这款显卡采用了更新的AD106(Ada Lovelace)芯片,而不是原版的GA107(Ampere)芯片。 目前,GeForce RTX 3050系列已经有四个版本,包括2022年推出的4GB(GA107)和8GB(GA106)版本,同年稍晚又推出了8GB(GA107),随后在2024年又推出了6GB版本。 如果RTX 3050 A最终发布,它将成为该系列的第五款产品。 AD106芯片是NVIDIA在RTX 4060 Ti、RTX 4070 移动版和RTX 4070 Max-Q等显卡中使用的同款芯片。 与之前使用的GA107和GA106芯片相比,AD106芯片明显更小,但得益于台积电的4N FinFET工艺,其晶体管密度更高。 目前的RTX 3050 8GB和4GB版本分别拥有2048和2560个CUDA核心,6GB版本居中,拥有2304个CUDA核心。 NVIDIA之所以在RTX 3050 A中使用AD106芯片,可能是因为其GA106或GA107芯片已消耗完毕,或者NVIDIA只是在处理剩余或有缺陷的AD106芯片,这也是常见的做法,完整的AD106芯片拥有4608个CUDA核心,即使是三分之二也足以驱动RTX 3050。 目前新版本显卡的发布日期仍然未知,也不清楚这款显卡是否会以零售形式上市。既然NVIDIA对显卡“怀旧”,美国PC厂商Maingear也推出了一款复古风格的桌面电脑Retro95,该主机限量发售,起售价为1599美元(约11449元人民币)。 这款电脑不仅外观上复刻了90年代的水平式机箱设计,还配备了现代高性能硬件,堪称最强的“伪装者”。 Maingear将Retro95描述为“带回了90年代水平式桌面电脑的标志性风格,现在配备了尖端硬件”。最高配置可选AMD锐龙7 9800X3D处理器、NVIDIA RTX 5080显卡、96GB DDR5内存和8TB的PCIe Gen4 NVMe SSD存储。 除了这些核心配置外,Maingear还表示,Retro95“配备了现代散热系统和静音风冷,以实现高性能和低噪音”。 这也意味着没有水冷选项,但顶级配置将配猫头鹰风扇和850W电源,这些机箱还支持可选的光驱。Retro95的机箱采用的是银昕FLP01,Maingear的一位发言人证实,这是“SilverStone FLP01的定制版本”。 Maingear CEO表示:“这款产品是为那些曾经带着CRT显示器参加LAN派对、在游戏关卡间更换光盘、从杂志上获取游戏新闻的玩家准备的。Retro95的推出是我们向经典游戏时代致敬的方式,它看起来像你小时候的电脑,但运行起来却像你今天从Maingear定制的怪物。”1599美元的入门版本将配备RTX 5050显卡、锐龙5 9600X处理器、ID-Cooling IS-67-XT散热器、原装风扇、MSI B650 VC-WIFI II主板、16GB DDR5 6400MT/s(2×8GB)、1TB SSD和650W MSI MAG A650GL电源。
容量最高360TB、永久保存!我国“玻璃硬盘”年底量产 来源——硬件世界 据中国光谷官方公众号报道,华中科技大学武汉光电国家研究中心张静宇和团队打造的“玻璃硬盘”将在今年底落地产业化,正与全国范围的数据中心展开应用接洽。 未来,将率先服务互联网数据中心、AI大模型训练数据存储及历史档案长期保存等关键领域。该项技术荣获2024年全国颠覆性技术创新大赛卓越奖,依托纳米光栅结构并以玻璃作为存储介质,利用飞秒激光在玻璃内部写入和读取数据,堪称目前寿命最长且超高密度的数据存储方案。 该团队攻克了玻璃多维存储技术中写入速度慢的核心问题,开发转动伺服光驱系统,读写速度快、体积小、成本低。目前,设备已实现全国产化,具备自主知识产权,未来可广泛用于档案存储、数据中心及云存储市场,推动数据存储技术的革命性进步,颠覆现有温冷数据存储技术。 张静宇表示表示:“我们不能再依赖国外传统存储介质路径,必须有安全自主的智能存储设备。” 一块巴掌大的玻璃硬盘,容量最高达360TB,可存储2.5万部高清电影,并且可永久保留,一次写入海量数据,将“永如石刻”。这种存储方式不受电磁干扰、温度变化、湿度波动等环境因素影响,对于需要长期保存的珍贵历史资料、重要科研成果等数据而言,具有极高的价值。 比如档案管理领域,可永久保存各类历史档案、珍贵文献;在医疗领域,能长期存储患者的病历数据、医学影像资料等;在金融领域,对于交易记录、客户资料等重要数据的长期安全存储提供保障。 内存方面,随着AMD新一代线程撕裂者PRO工作站CPU发售,芝奇正式推出了专为该处理器打造的T5 Neo DDR5-6400 CL38 512GB (64GBx8) RDIMM超频内存。 据介绍,本次推出的T5 Neo DDR5-6400 512GB (64GBx8) 超高规格套装,结合了512GB大容量及CL38低延迟的梦幻组合。该内存采用芝奇最新16层DDR5 R-DIMM PCB,相较于传统的8层或10层板设计,可有效提升内存速度、强化信号完整性、并降低信号干扰,即使在高负载下也能确保稳定高效数据传输。 该内存还引入了AMD EXPO超频技术,适用于企业级或个人使用的数据运算中心、人工智能、与机器学习平台,或各类高效能科学运算环境。由于模组需直接从主板获取12V电压输入,因此在设计上引入了先进的保护机制,为防止瞬态电压突波与静电放电 (ESD),每个模组均配备高质量瞬态电压抑制 (TVS) 二极管与表面黏着技术 (SMT) 保险丝,形成稳固的双重防护设计。目前该内存搭配最新AMD线程撕裂者PRO 9945WX处理器及ASUS Pro WS WRX90E-SAGE SE主板通过烧机测试,以下为测试截图:芝奇全新T5 Neo DDR5-6400 CL38 512GB (64GBx8) R-DIMM超频内存套装将于今年8月于全球各地陆续开售,具体价格暂未公布。 此外随着生成式AI、高效能运算(HPC)和数据中心对内存频率与效率需求的快速提升,新一代内存标准DDR6正朝着量产普及迈进。 据报道,业界预估DDR6将于2027年进入大规模普及期。 目前三星、美光与SK海力士等全球三大DRAM原厂,已率先启动开发计划,聚焦于DDR6芯片、控制器与封装模组的技术突破与产品布局。 根据JEDEC的推进时间表,DDR6主规范已于2024年底完成草案,LPDDR6草案也于2025年第二季对外发布,预计2026年将进入平台测试与验证阶段。 业者分析,DDR6在效能与架构方面皆实现重大突破,起始速率达8800MT/s,产品生命周期内最高可达17600 MT/s,超频模块最终可能达到 21000MT/s的速度,整体效能较DDR5提升约2至3倍。 在架构方面,DDR6采用4×24-bit通道设计,相较DDR5的2×32-bit,在平行处理效率、数据流通与频率使用上更具优势,但同时也对模组I/O设计提出更高要求。 与此同时,由JEDEC标准化的CAMM2,正成为DDR6时代的主流解决方案,CAMM2结合高频宽、高密度、低阻抗与薄型化设计,成功解决DDR5中288引脚DIMM插槽限制。
8GB与16G显存销量断档:RX 9060 XT 16GB销量是8GB的68倍! 来源——硬件世界 根据德国零售商Mindfactory最新显卡销售数据,AMD在2025年第29周(7月14日至20日)的显卡销售中击败了NVIDIA,虽然在收入上略逊一筹,但在销售数量上领先。 不过报告中最令人意外的细节,是AMD Radeon RX 9060 XT的8GB版本的销量惨淡。 报告显示,AMD的RX 9070 XT是当周销量最高的GPU,共售出580块,紧随其后的是RX 9060 XT,共售出345块,而NVIDIA的RTX 5070 Ti则售出175块。不过在这345块RX 9060 XT中,只有5块是8GB版本,相比之下,Intel锐炫B580售出了15块,而同样拥有8GB显存的RTX 5060则售出了45块。 这意味着几乎所有人都选择了RX 9060 XT 16GB版本,其销量是8GB版本的68倍。这一现象并不令人意外,因为随着游戏对显存需求的增加,尤其是在高分辨率和高画质设置下,8GB显存的显卡在一些新游戏中表现不佳。 而16GB版本的RX 9060 XT不仅性能更好,还更具未来性,因此消费者更倾向于选择16GB版本。从整体销售情况来看,AMD共售出1250块显卡,占当周市场份额的58.14%,而NVIDIA售出885块,占41.16%,Intel仅售出15块,占比仅为0.7%。 虽然AMD在销售数量上领先,但NVIDIA凭借更高的平均售价,在收入上以791274美元(占比52.92%)领先于AMD的699640美元(占比46.79%),Intel的收入仅为4330美元。 另外今天还有一款神秘的AMD Radeon GPU散热器原型在网上曝光,尺寸比RX 7900 XTX还要大,配备了巨大的散热鳍片和三个8针连接器,引发了人们对AMD可能曾计划推出一款类似RTX 4090级别的高端GPU的猜测。 这款散热器原型最初在韩国Quasarzone上被曝光,用户FP32分享了从闲鱼上购买的这款神秘散热器的照片。从外观上看,它与标准的RX 7900 XTX参考散热器相似,但仔细观察会发现许多不同之处,散热器本身有三个涂成红色的鳍片,表明是"RDNA 3"。原型散热器的长度接近34厘米,比RX 7900 XTX的29厘米长出不少,厚度接近5.5厘米,采用了三风扇配置,占据了三个插槽。供电设计上它为三个8针连接器预留了空间,而不是7900 XTX上的两个,这表明其总板功率可能远超450W,与NVIDIA的RTX 4090相当。打开散热器后,可以看到铜制底板和密集的热管阵列,内部布局与7900 XTX明显不同,进一步表明它原本是为更强大的配置设计的。需要注意的是,这款散热器内部没有PCB,因此无法连接到电脑进行进一步测试,散热器背面也没有任何接口,因此无法准确推测它原本将搭载的型号。 散热器上有许多序列号标签,但并未搜索到任何信息,不过考虑到RX 7900 XTX已经搭载了完整的Navi 31芯片,拥有96个计算单元,这款散热器可能被设计为支持更高的速度或更快的显存。当然也有可能AMD曾尝试开发一款更大的GPU芯片,但最终未能通过内部测试。 自2022年以来,关于RX 7950 XTX或RX 7990 XTX等型号的传闻一直存在,这也是首次出现指向AMD探索更激进的“顶级”设计的实物证据。 在GPU性能的比拼中,硬件规格固然重要,但驱动和软件优化同样起着关键作用。 根据我们前两天进行的新驱动测试,在新驱动下AMD RX 9070 XT已经不弱于RTX 5070 Ti,低分辨率下甚至还更强一些。 而据用户@opinali的测试数据,RX 9070 XT在基于协同矢量(Cooperative Vectors)技术的Vulkan和DX12渲染测试中,展现出超越NVIDIA RTX 5080的性能。由于AMD尚未发布支持微软DXR 1.2版本的驱动程序,测试者通过集成Vulkan的“VK_KHR_cooperative_matrix”来实现类似的协同矢量功能。 由于没有DXR 1.2,RX 9070 XT只能在DP4A模式下运行,但在Vulkan和DX12测试中,RX 9070 XT实际上超越了RTX 5080。其中Vulkan测试中性能领先约10%,而在DX12测试中,领先幅度更是高达110%。 不过需要注意的是,NVIDIA支持协同矢量技术的驱动程序仍处于预览阶段,性能尚未完全优化,相比之下,AMD的优化工作已经取得了显著成效。
显示器线上销量前五出炉!999元内价格成主流 来源——硬件世界 根据洛图科技(RUNTO)最新发布的报告,2025年上半年,中国大陆显示器整体线上全渠道零售市场的总销量为642万台,同比增长29.7%。 其中,传统主流电商约占92%,销量达593万台,同比增长30.4%;销额为60亿元,同比增长24.2%。市场的品牌竞争格局正加速向头部集中,2025年上半年,线上销量前三品牌的合计市场份额达38.5%,较去年同期提升了7.5个百分点。 AOC、HKC与小米稳居销量及销额榜的前三甲。 AOC凭借全面的产品矩阵与强大的品牌号召力,主导着主流市场,在销量与销额上均位列第一。HKC增长势头迅猛,销量排名线上监测市场的第二,同比2024年激增了近90%。这主要得益于其在电竞市场的投入,以高刷新率、高分辨率产品成功吸引了用户。 小米聚焦办公市场,凭借高性价比策略赢得年轻消费者,排名线上监测市场的销量第三;尤其在100Hz细分市场占据高达31%的销量份额,优势明显。 新兴品牌方面,SANC与KTC已跻身线上监测销量榜的第四、五位。价格方面,2025年上半年中国大陆显示器线上市场均价为1012元,较去年同期下降约5%。 分价格段来看,500-999元区间的产品正在主导市场,占据了高达47%的销量份额。 0-499元和1000-1499元区间的产品市场跟随其后,成为第二和第三销量仓。
三星错失AI良机 18年黄仁勋主动合作遭拒:HBM CUDA 晶圆代工全拒 来源——硬件世界 据最新报道,黄仁勋在2018年访问了三星,提议在三个关键领域进行合作。 这三个领域包括HBM生产、与三星晶圆厂合作开发新制程节点,以及共同推动CUDA软件发展,合作提议如果达成,本可能会使三星成为英伟达的关键合作伙伴。 然而,三星拒绝了英伟达的合作伙伴提议,黄仁勋似乎对三星的答复表示失望,称“三星没有人可以和我讨论长期战略”。 至于原因,可能与当时三星电子董事长李在镕面临的多项刑事指控调查有关。 近几年NVIDIA凭借其AI芯片成为了AI热潮中的最大受益者,而HBM正是这些AI芯片中最关键部分之一,像H200这样的加速器需要大量高速内存来进行AI推理。 三星拒绝合作后,英伟达转而与SK海力士合作开发HBM,并最终由SK海力士供应HBM3E内存。 SK海力士也因此获得了巨大的商业成功,其股价在过去五年内上涨超过220%,反观三星,则在HBM生产方面落后于SK海力士。 此外,三星决策也影响了其在AI芯片代工领域的地位,目前台积电垄断了英伟达AI芯片的生产,包括最新的B200。 尽管现在三星试图通过供应HBM4来挽回一些业务,但其在AI芯片制造领域的地位已经远远落后于台积电。其他国家也有了突破,尼康近日宣布推出全球首款专为半导体后道工艺设计的无掩模光刻系统DSP-100,并已启动全球预订,预计2026年3月31日前上市。 该设备以“高精度、大尺寸、高效率”为核心优势,为快速发展的扇出型面板级封装(FOPLP)技术提供关键设备支持。 DSP-100将FPD曝光设备的多镜组技术,与半导体高分辨率工艺相结合,实现了1.0μm(1000nm)的线宽/间距(L/S)分辨率,重合精度≤±0.3μm。 与传统光刻机不同,DSP-100采用无掩膜的SLM(空间光调制器)技术,直接将电路图案投射到基板上,无需使用光掩膜。 这种方式既避免了掩膜尺寸的限制,还能大幅降低开发和生产成本,同时缩短产品设计和制造周期,还可以有效减少光学畸变,提高成像质量。 DSP-100支持最大600mm x 600mm的方形基板,适用于扇出面板级封装(FOPLP)技术,相比传统300mm晶圆,600mm基板能显著提升单位载板产量(例如,封装100mm见方芯片时效率可提升9倍)。 实测数据显示,在510mm×515mm基板上,其每小时处理量可达50片,远超现有晶圆级封装方案。整体生产效率提升约30%。 尼康透露,DSP-100已获得多家头部封测厂的订单意向。公司预计,该设备在2026财年上市后,将迅速抢占FOPLP设备市场20% 的份额,成为推动先进封装技术演进的重要力量。
生产未动,设计先行,DDR6内存起步8800MHz,2027年登场 来源——AMP实验室 DDR4还能打 近些时间不断传出DDR4走向停产,三大供应商三星、海力士和美光都已经将工期排入EOL阶段, 转向DDR5以及更为利润丰厚的HBM内存,确实DDR4已经来到了生产端的生命尽头。而正当DDR5算如日中天时,在2024年JEDEC组织已经敲定了DDR6内存标准,而多家内存制造商已经在开发下一代标准的内存。尽管这些内存在近年不会立刻登陆主流平台,但HPC领域不断增长的需求正在促使DRAM制造商加快了标准的开发进程。 根据工商时报CTEE报告透露,包括三星,美光和SK海力士,三家公司正在加快他们在 DDR6 内存上的工作。按照目前的速度,平台测试和验证过程将在 2026 年完成,而DDR6 的首次应用将于 2027 年下一代服务器上市时开始。据说 AMD、英特尔甚至 NVIDIA 都在与 DRAM 制造商合作,尽早推出 DDR6。 而对于JEDEC制定的标准,新标准的基本传输速率将为 8800 MT/s,比 DDR6 的基本速度4800 MT/s提高 83% 。对于 DDR5 内存来说, 8800 MT/s 已经被认为非常快。 至于最高速度,标准中DDR6 内存将能够达到最高 17600 MT/s 的速度,与当今顶级 DDR5 模块相比,提高了 70~80%。DDR6 一代还将采用新的架构设计,转向 4×24 位通道,而不是 DDR5 的 2×32 位通道。 而对于可用性,HPC和AI将成为DDR6应用的首个市场,这些平台使用的内存大都遵循JEDEC规范,并且用户也需要一段时间才能让DDR6内存充分发挥潜力。DDR5内存从2021年问世,但直到现在我们才开始看到速度的提高超过 8000-9000 MT/s。不过需要注意的是,DDR6 内存将需要新的插槽设计来保持信号质量,并在保证高密度/低阻抗设计同时确保高带宽。新的CAMM2被视为游戏规则的改变者,CAMM2 在服务器和消费领域的采用速度一直很慢,但有了 DDR6,用户可能最终会看到新的CAMM2外形尺寸获得更多关注。分析还指出,某些高端笔记本电脑可能会率先使用DDR6解决方案,不过这个也可能指的是LPDDR6,因为移动端CPU和低功耗内存在笔记本方案商更有意义。 当下的DDR5内存花了数年时间,并且需要一个适当/优化的生态才看到大规模采用(例如AMD AM5平台的更新),因此 DDR6 也会如此,就像 DDR5 一样,DDR6 在最初几年的价格将相当高。
步步错:三星早在7年前已错失与英伟达深度合作良机 来源——AMP实验室 海力士爽了 三星电子的半导体分支目前在先进工艺代工和 HBM 内存供应两大方面都遭遇了未能获得英伟达等大客户的大订单的困局。而根据韩国媒体 MK 的报道,三星电子在 7 年前本有可能通过不同行动避免当下危机。 消息人士向这家媒体透露,英伟达 CEO 黄仁勋曾在 2018 年秘密访问三星电子,希望在先进 HBM 内存开发、后 8nm 先进制程代工、CUDA 软件生态培养三个方面展开综合性的深度合作。不过由于三星集团时任实际领导人李在镕陷入一系列案件调查,黄仁勋未能与李在镕见面。这一司法过程也影响了三星电子当时作出中长期决策的能力,黄仁勋提出的三项合作提议均被拒绝。 在 HBM 内存领域,虽然 SK 海力士凭借与 AMD 的初始合作占据了先发优势,但在 HBM2 时期三星一度掌握主导地位,而从 HBM3 世代开始 SK 海力士凭借与英伟达的密切合作重夺最大市占,这被认为与黄仁勋遭三星拒绝后选择 SK 海力士作为开发伙伴有关。三星如今正积极寻求与英伟达的合作机会,其负责半导体业务的副董事长全永铉已前往美国与英伟达会面,商讨三星第五代HBM3E 12层产品如何为英伟达的Blackwell Ultra GB300供货以及双方的代工合作关系。此外,三星已完成第六代HBM4 12层样品(36GB)的内部评估,计划向英伟达、AMD送样测试。 但是在HBM3E产品上,由于散热和功耗问题未能通过英伟达的测试认证,导致其加入英伟达供应链的计划一再推迟,直到2024年7月英伟达首次批准三星电子的HBM3用于其GPU上,但这些芯片仅用于为中国市场开发的H20
史无前例、全球最大!铠侠发布245TB SSD 来源——硬件世界 铠侠(Kioxia)宣布推出LC9系列固态硬盘,具有史无前例245.76TB存储容量的固态硬盘,成为目前最大容量的存储设备。铠侠通过将8TB的存储容量集成到单个NAND封装中,创造了新的纪录,并利用多个超高容量封装构建了这款超大容量的SSD。 以一部4K电影平均压缩后约20GB的大小计算,这款SSD可以存储多达12500部4K电影。 该系列基于未知的专有NVMe 2.0兼容控制器,配备PCIe 5.0 x4接口(支持双端口),并采用了铠侠的BiCS8 2Tb 3D QLC NAND闪存芯片。为了在E3.L外形尺寸中实现245.76TB的容量,铠侠将32个存储芯片集成到一个芯片中(8TB存储空间),并将其连接到控制器。 铠侠声称,这种封装方式在密度上创下了新纪录,并使用了该公司专有的晶圆处理和组装方法。性能方面,LC9系列SSD的顺序读取速度最高可达12GB/s,写入速度最高可达3GB/s,随机读取IOPS可达130万次,随机写入IOPS为5万次。 虽然这些性能指标在企业级PCIe 5.0 SSD中并不算最高,但考虑到其容量,性能与容量之间的平衡是必然的。 耐用性方面,LC9系列SSD的耐久性为每天0.3次全盘写入(DWPD),同时还具备多种增强可靠性和数据保护的功能,包括芯片级恢复、基于奇偶校验的错误管理以及防止突然断电的安全措施。 铠侠计划提供多种外形尺寸的LC9系列SSD,包括2.5英寸U.2(最高122.88TB)、E3.S(最高122.88TB)和E3.L(最高245.76TB) 还有一款新品,海信正式推出大圣G5 Pro+ 26款电竞显示器。显示器搭载27英寸Fast-IPS面板,由海信与友达联合研发,采用原厂封装模组,支持2K分辨率与200Hz高刷新率,1ms GTG响应时间搭配HDR400技术,可满足电竞玩家对流畅画面的需求。 在显示性能上,其覆盖97% DCI-P3色域,10bit色深带来丰富色彩表现,ΔE<2的色准表现兼顾专业设计场景。 同时配备硬件低蓝光与DC调光,兼顾护眼与画质。功能上,自研图像解析算法提升亮度均匀性,支持Freesync防撕裂技术及游戏模式专属功能。 目前该显示器已在国内平台开售,首发价1099元,享3期免息,并提供3年质保、终身免费上门及6个月坏点包换服。还有一位名为Krish Shah的大神,开源一款名为TrackWeight的macOS应用程序,能够让苹果MacBook的Force Touch触控板摇身一变成为电子秤。 该应用程序的源代码已经发布在GitHub上,并且遵循了非常灵活的开源MIT许可证。 TrackWeight适用于配备Force Touch的苹果笔记本电脑(2015年及以后的MacBook Pro,2016年及以后的MacBook)。Shah在其GitHub页面上指出,他的创意得以实现,离不开许多重要的技术贡献,除了使用SwiftUI构建用户界面和Combine实现响应式数据流之外,他还特别提到了Takuto Nakamura(@Kyome22)的Open Multi-Touch Support库。 这个编程库可以访问macOS触控板上的全局多点触控事件,并提供详细的触摸数据,包括位置、压力、角度和密度等信息。 由于苹果的Force Touch触控板的工作原理,用户在使用TrackWeight时必须保持手指与硬件的接触(电容感应),这可能会对重量测量的准确性产生一定影响。 Shah通过演示证明,该应用“相当准确”,虽然尚不清楚TrackWeight的具体测量范围,但根据Shah的说法,它能够测量重量高达3.5千克的物品。不过,他建议用户不要尝试使用它来称量行李或人体重量,以免损坏笔记本电脑。 值得注意的是,TrackWeight在称量金属物品时可能会出现误读,Shah建议在纸巾上称量金属物品,以避免将其误认为是电容手指触摸。 此外,用户还需要确保待测物品完全位于触控板区域内,以获得准确的读数。
长江存储全国产化产线今年试产!力争2026年全球份额15% 来源——硬件世界 据报道,长江存储在推动“全国产化”制造设备方面取得了重大突破,首条全国产化的产线将于2025年下半年导入试产。 长江存储自2022年底被列入美国商务部的实体清单以来,依然积极推进产能扩张计划,计划在2025年实现每月约15万片晶圆的产能(WSPM),并力争到2026年底占据全球NAND闪存供应量的15%。 目前,长江存储的产能已接近每月13万片晶圆,约占全球产能的8%,公司已经开始出货232层TLC(三层单元)芯片(X4-9070),该芯片通过堆叠两层实现总共294层。 长江存储的产品路线图包括一款1TB的TLC设备、计划于今年晚些时候推出的3D QLC X4-6080,以及一款2TB的TLC X5-9080。 未来几代产品预计将通过堆叠三层实现超过300层的结构,以提高每片晶圆的比特数,不过这可能会牺牲一些吞吐量。 为了减少对外国设备的依赖,长江存储计划在2025年下半年启动一条完全依赖国产工具的试验线。 分析师认为,如果试验成功,最终可能会使比特产量翻倍,并将市场份额推高至超过15%,但他们也提醒说,该设施是实验性的,大规模生产还需要时间。 TechInsights的报告显示,长江存储最新的“Xtacking 4.0”芯片在性能上与市场领导者相当,不过由于在极紫外光刻(EUV)等关键领域中国仍存在差距,这使得持续增长将取决于缩小设备和产量差距的能力。国产GPU方面,中国证监会官网消息显示,近日瀚博半导体(上海)股份有限公司已正式启动上市辅导,辅导机构为中信证券。 作为一家成立仅六年的国产GPU厂商,瀚博半导体已连续三年登上胡润全球独角兽榜单,2024年估值超过100亿元。 在前不久,摩尔线程、沐曦股份等国产GPU厂商已向上交所科创板递交了IPO招股书,拟分别募资80亿元和39.04亿元。瀚博半导体成立于2018年12月,总部位于上海,创始人兼CEO钱军拥有近30年高端芯片设计经验,曾带领AMD团队设计量产了业界第一颗7nm GPU;创始人兼CTO张磊拥有25年以上高端芯片设计经验,曾担任AMD院士,全面负责AMD的AI加速领域和视频领域的芯片设计研发。 产品方面,瀚博半导体于2020年5月流片首颗半定制7nm芯片;2021年7月发布首款服务器级别AI推理芯片SV102及通用加速卡VA1;2022年一季度,SV系列产品量产并交付客户。 2023年2月,瀚博半导体SG100GP芯片回片,并于同年4月完成基于第二代7nm全功能GPU芯片系列产品的量产;2023年7月,瀚博半导体发布第二代全功能GPU SG100,并推出多款新品。 其中瀚博SG100采用7nm制程,兼具低延时高吞吐的AI算力和强大的视频处理能力,支持Windows/Linux下的DirectX 11、OpenGL、Vulkan等API接口,支持H.264、H.265、AV1等多种视频编解码格式。 截至目前,瀚博半导体已获得天狼星资本、耀途资本、快手战投、红点创投、五源资本、赛富投资基金、中网投、经纬创投、阿里巴巴、人保资本、基石资本、招商局资本、海通开元、联发科等知名机构投资。不只是中国,印度也官宣首颗国产芯片将在2025年问世(采用28nm制程工艺)。 印度电子和信息技术部部长阿什维尼瓦什纳公开表示,今年发布首款自主研发的半导体芯片,同时六家半导体工厂已获批准并正在建设中。 “现在,我们正在开始半导体芯片的生产。我们已经批准了六家半导体工厂,目前正在建设中。我们将在2025年推出首款‘印度制造’的芯片。”这位高官说。 上述消息让不少印度人为此欢欣鼓舞、甚至是沸腾,而他们的目标也是希望在芯片这块上追赶甚至超越中国。 阿什维尼瓦什纳直言,为了实现到2047年让印度成为发达国家的目标,政府正在优先考虑基础设施投资、包容性增长、制造业扩张和法律法规简化这四个关键领域。 印度电子和信息技术部表示,在过去十年里,电子制造业经历了前所未有的增长。 印度目前出口的电子产品包括手机、笔记本电脑、服务器、电信、医疗和国防设备等。
NVIDIA重磅官宣!CUDA三大CPU架构通吃:不止x86和Arm 还有RISC-V 来源——硬件世界 近日举办的2025 RISC-V中国峰会上,NVIDIA硬件工程副总裁Frans Sijstermans宣布,CUDA软件平台将支持RISC-V指令集架构处理器,为开源架构RISC-V开启进入数据中心与AI市场的大门。 据了解,过去x86与Arm架构在AI与HPC领域居于主导地位,主要原因就是和CUDA的高度整合。当下,x86架构的Intel与AMD处理器是数据中心的主力,而RISC-V虽然具有开源与可扩展优势,但缺乏CUDA等关键工具,难以进入主流应用。 此次支持,标志着NVIDIA将其生态系拓展至开源领域,有望提升RISC-V在高端计算的应用潜力。 总体来看,x86、Arm、RISC-V三大主流处理器架构各具特色。 x86架构拥有成熟的软件支持与庞大生态系,但成本与授权模式受限。Arm主打低功耗与可扩展性,虽具竞争力,除了授权金高,也潜藏地缘风险。 相较之下,RISC-V为开源架构,企业可自由设计并掌握技术主导权,因此受到多国与新创企业青睐,尤其中国市场更视其为实现芯片自主化的关键路径。 对中国而言,RISC-V搭配CUDA的支持,意味着有望弥补过去AI训练与推论基础设施的关键缺口。NVIDIA近期重启在中国销售的H20芯片预期将与RISC-V处理器搭配使用,通过开源CPU结合中阶GPU,打造具自主性与灵活性的本地AI运算架构。 不过需要注意的是,CUDA虽然支持RISC-V,但其本质还是NVIDIA的独有生态系统,实际整合仍需面对授权、驱动兼容性与地缘政策等变数。 若未来美国政府进一步收紧出口限制,NVIDIA理论上仍可中止对特定市场的支持。另外,NVIDIA与联发科合作开发的基于Arm架构的AI PC处理器原计划于2025年第三季度推出,然而近日供应链透露,该处理器的发布已被推迟至2026年第一季度。 至于推迟原因,据报道此次推迟的原因主要有三点,首先就是NVIDIA持续进行的芯片修订,很可能需要重新设计芯片。 另外,微软的操作系统路线图出现延迟,Windows on Arm的开发进度未能如期推进,导致N1X处理器的适配工作受到影响。 最后,整体笔记本市场需求的减弱也促使两家公司重新评估市场策略。 此前市场曾猜测推迟是由于通货膨胀和关税政策不明朗导致消费者需求不振,但如今看来,技术与市场因素才是主要原因。 NVIDIA的N1X处理器旨在为高端消费和商业市场提供强大的AI计算能力,预计其AI运算能力可达180至200 TOPS,而瞄准消费级需求的变体名为N1C,而不是此前普遍认为的N1。
线程撕裂者Pro 9995WX全96核超频5GHz:功耗950W、接近100℃ 来源——硬件世界 AMD新一代Zen5架构的线程撕裂者Pro 9000WX系列将于处理器将于7月23日开售,其中的旗舰型号Pro 9995WX国行售价为99995元。 超频爱好者SkyWalkerAMD分享了有关这款线程撕裂者Pro 9995WX的超频测试结果,该处理器被超频至4997.63MHz,还使用了华硕PRO WS TRX50-SAGE WIFI主板,配备了144GB的DDR5内存。 在超频过程中,该处理器最高温度达到了98℃,功耗高达947W,Cinebench R23测试得分到了186800分。这一得分比前代产品7995WX的记录低了11%,不过7995WX的记录是在使用液氮冷却、频率达到6.25GHz的情况下实现的,因此在极端超频条件下,9995WX打破现有记录应该还是比较容易。 随后该平台上又出现了一款9995WX的测试成绩,同样来自SkyWalkerAMD,使用同一块主板,这次分数达到了更高的189748,在多核排行榜上位列第五。同样也被超频至接近5GHz,最大温度记录为 93℃,功耗更是达到了958W,这表明即使在没有液氮冷却的条件下,9995WX的性能依然非常出色。 规格方面,9995WX拥有96个核心和192个线程,基础频率为2.5GHz,睿频5.4GHz,它还配备了384MB的L3缓存和96MB的L2缓存,支持8通道DDR5内存,默认TDP为350W。得益于X3D系列,AMD CPU的压倒性优势仍然还在持续,根据TechEpiphany分享的德国零售商Mindfactory第29周(7月14日至20日)CPU销售数据。当周AMD共售出2990颗CPU,而Intel仅售出330颗,这意味着AMD在该零售商的CPU销量中占据了90.06%的份额,而Intel仅占8.72%。 在销售额方面,AMD获得了926950美元,占总销售额的91.28%,而Intel仅获得88525美元。按照接口来看,AMD AM5接口CPU共卖出了2520颗,即便是较老的AM4接口CPU仍然卖得很好,共售出470颗。 相比之下,Intel的1700接口售出240颗,1851接口售出90颗,总计仅330颗,这也意味着仅AM4 CPU的销量,就超过了Intel的总和。 具体来看,AMD的锐龙7 7800X3D依然是销量最高的CPU,售出了超过800颗,尽管这款CPU已经推出超过两年,但其需求依然很高。紧随其后的是锐龙7 9800X3D,这也是7800X3D的继任者,于去年11月发布,这款CPU虽然价格更高,但在在许多方面都优于前代产品。 虽然这些数字仅反映了德国Mindfactory的情况,但却代表了消费者普遍倾向于选择AMD 而非Intel的大趋势。 比如在亚马逊的畅销产品列表中,AMD占据了主导地位,同样是9800X3D和7800X3D占据了前两名的位置,在前10大畅销CPU中,没有一款是Intel的。反观Intel这边,最近Mozilla资深平台工程师Gabriele Svelto发现了一个有趣现象,通过追踪 Firefox宕机报告的地理分布,能够准确识别出当前欧洲、美国的热浪区域。 数据显示,尤其是搭载Intel第13代和第14代酷睿处理器(Raptor Lake)的电脑,在夏季高温环境下特别容易宕机,发生的概率远高于较凉爽地区的同类系统。 Gabriele Svelto发现,北半球(特别是欧洲和美国地区)搭载 Raptor Lake CPU的电脑在高温天气期间故障率显著上升。 问题严重到Firefox团队不得不停用自动宕机报告机器人,因为它几乎只收到来自Raptor Lake系统的死机报告。据了解,上述问题的根源在于Intel去年承认的已知微码错误。2024年7月22日,Intel确认某些第13代和第14代酷睿CPU出厂时带有微码缺陷,在重负载下可能导致电压调节错误。 当CPU承受高负荷任务时,如加载大量浏览器分页、下载串流高清影片,这些微小的电压波动在高环境温度下会变得更加明显。 Svelto指出,这些处理器存在已知的时序/电压问题,且会随温度升高而恶化。 在一个没有空调,35℃的办公室环境中,电脑冷却系统或许能应付一般任务,但当浏览器执行密集作业时,CPU内部温度会再上升10至15度,就会暴露微码时序故障,导致系统突然死机。 Intel Raptor Lake处理器过去一直受到稳定性问题困扰。 该公司去年发布一系列微码更新来解决持续问题,最近几个月的更新也针对连续运行多天的机器的不稳定问题进行修复。 今年夏天,你的电脑死机过吗?
RX 7950XTX原型散热现世!超大号凶悍怪兽外形 来源——AMP实验室 有点帅呢 众所周知,AMD为了给下一代UDNA架构争取开发时间,这一代RDNA4仅做到高端产品,并没有推出顶级旗舰。而上一代顶级旗舰产品则要追溯到RDNA3架构世代,旗舰Navi 31 GPU打造的RX 7900XTX,而这已经是2022年底的事了。 不过再往前看,AMD也干过一些奇怪的事,例如为顶级型号发布特殊变体,例如RX 6900XT LC液冷版,以及RX 6950XT,后者使用的是AMD官方特挑的Navi 21 XTXH核心。 在RDNA3时代,有传言称AMD可能对RX 7000系列做同样的事,遗憾的是,除了这些谣言之外,从来没有任何实际证据表明AMD计划进一步挖掘Navi 31 GPU的潜力。不过现在事情发生了一些改变,在韩国DCinside论坛上,一位用户声称购买了基于RX7000系列的原型,但与以前见过的任何东西都不匹配。这是一张更大、更厚、更重的显卡。这块显卡本身没有PCB板,它只是一个散热模组,它甚至没有IO挡板,因此无法确定这款散热器是针对哪个GPU的。用户提供了几个序列号,但它们不遵循任何已知的方案,也没有提到GPU。不过从暴露的信息来看,这一散热模组设计采用了三风扇、三槽散热器,并且给到了三个8PIN电源连接器。这表示这款显卡的TBP总板功率超过375W,这一外形信息强烈暗示这款散热模组服务于Navi 31 GPU,因为上市的RX 7900XT已经达到了355W。上一代旗舰RX 7900XTX基于Navi 31 XTX GPU,提供6144个SP流处理器,官方公版加速频率为2500MHz。如果AMD打算推出“RX 7950XTX”,那么只可能是在频率上做文章,因为不同于英伟达,AMD的旗舰级显卡已经给到了芯片的全部规格。再追溯更早期的RX 6900XT系列,这款显卡基于Navi 21 XTX,已经提供了5120个SP流处理器,加速频率为2250MHz。AMD之后为这款GPU推出了特调版本,但是同样的增加不了核心规模,只能从核心频率上做文章,因此AMD在特挑核心并将其命名为Navi 21 XTXH后, 推出了RX 6950XT,核心加速频率提升到了2310MHz,此外显存速度也从16Gbps提升到18Gbps。 可能AMD认为这种针对旗舰显卡的花招对于产品力而言并没有太大提升,并且上一代的RX 7900XTX首次在GPU端采用MCM多芯片设计,成本较高,最终AMD还是选择了保守设计,让RX 7900XTX的设计走完了这一世代。
全球最快的游戏CPU!AMD 9800X3D降至历史最低价:现货 来源——硬件世界 “全球最佳游戏CPU”锐龙7 9800X3D自去年11月上市以来,价格一直比较坚挺,前期还经常处于缺货状态。如今大半年过去了,这款神U货源已经比较充足,且国外价格也来到了历史最低价。锐龙7 9800X3D上市首发价499美元,目前在新蛋、亚马逊已经降至451美元(约合人民币3236元)的新低价。Tomshardware去年评测该U时,直接给出了“编辑推荐奖”,且评价极高,还打出了4.5星的高分(满分5分),并称其性能“令人震撼”,获此殊荣实至名归。“毫无疑问,这是目前你能买到的最好的处理器之一,而这次的折扣更是锦上添花。”Tomshardware表示。 国内依然是3699元的首发价没变,不过现货比较充足,京东今天下单明天就能送达。 3锐龙7 9800X3D基于Zen 5架构,并首次采用了第二代AMD 3D V-Cache技术。64MB的高速缓存被迁移到处理器下方,这使得处理器的CCD单元更靠近散热器,可以帮助CPU达成更高的频率。 另外,AMD锐龙7 9800X3D是AMD X3D处理器家族中首款完全不锁频的产品,使发烧友和游戏玩家能够将处理器性能推向新的极限。 核心规格上,AMD锐龙7 9800X3D集成8个高性能Zen5 CPU核心,原生二级缓存8MB、三级缓存32MB,再加上64MB 3D缓存,总量达104MB。 核心基础频率提高至4.7GHz,加速频率为5.2GHz,对比上代锐龙7 7800X3D分别提高500MHz、200MHz,热设计功耗则依然维持在120W。 在A卡方面,得益于第三方工具OptiScaler的支持,AMD的FSR 4技术在兼容性方面有了很大提升。 OptiScaler能够将游戏中的旧版超分技术(如FSR 2或DLSS等),转换为FSR 3.1等较新的技术。 比如游戏支持FSR 2且未更新到更高版本,OptiScaler可以将FSR 2输入转换为DLSS、XeSS,或者将其上采样到更新的FSR版本。此前该软件仅支持到了FSR 3.1,不过最近增加了FSR 4的兼容性,这意味着用户可以用FSR 4替换游戏已支持的超分技术。不过这一过程并不简单,用户需要手动调整每个游戏的文件,并进一步调整设置以获得最佳体验,此外用户还需要在游戏目录中单独安装FSR 4,不过这因游戏而异。 需要注意的是,使用OptiScaler将旧版超分转换为FSR 4时,会有两个限制,首先就是不能是基于Vulkan API的游戏,因为FSR 4目前还不支持Vulkan。 此外,用户需要拥有AMD RX 9000系列显卡,因为只有这些显卡具备运行FSR 4所需的硬件(AI加速器)。
显卡“分流改装”火了!RTX 5090移动版从175W暴增至250W 来源——硬件世界 最近,一种能破解显卡功率限制的“分流改装”玩法,在油管上引发关注。据说,这种方法可以让 RTX 5090笔记本显卡的功耗释放从175W暴增至250W,游戏性能也提升了20%。简单来说,分流改装一种专业玩家用来绕过GPU功率限制,从而榨取额外GPU性能的方法。主要通过添加一个低阻值并联电阻来改变分流电阻来实现。这会让GPU误以为它消耗的功率更低,但实际上,功率水平远高于设定的限值。以RTX 5090笔记本显卡为例,额定功率为175W,经过分流改装后,GPU的实际运行功率可以达到200W-250W之间。 最近,科技博主GizmoSlipTech就成功将RTX 5090 笔记本电脑的功率限制从175W提升到了250W,最终性能表现令人惊叹。 一些基准测试和不同游戏的提升幅度实测显示,平均而言,与 175W的标配版本相比,改装后性能提升了20%。 由于散热限制和设备耐用性,NVIDIA一直不愿提高笔记本显卡(尤其是高端型号)的功率限制。 不过,测试确实表明,这些显卡一直并未得到充分利用,如果NVIDIA能开“绿灯”,OEM应该有兴趣提高功率限制。 最后,这位博主还给出了“为什么NVIDIA应该提高功率限制”的六大理由,你赞同吗?虽然NVIDIA已经取得了很大成功,但黄仁勋这次来中国接受采访时表示,总感觉英伟达快倒闭了,不少网友纷纷吐槽他很凡尔赛(毕竟现在公司市值4万亿美元)。 从一家在游戏玩家中享有盛誉的显卡公司,到如今定义AI时代的算力基础设施引领者,转型路上,英伟达曾经有两次濒临破产。 无论芯片还是AI,技术迭代的速度都极为迅猛,黄仁勋自称无法松懈也不敢松懈。 在英伟达的会议上,黄仁勋常以一句警示作为开场白:“我们公司离破产只有30天。”黄仁勋多次公开表示,他计划持续工作到80岁,甚至更长远。 回顾之前曾经让英伟达两次险些破产瞬间: 1、英伟达与SEGA合作开发Dreamcast游戏主机的显示芯片,但因架构与市场不兼容导致产品报废,资金耗尽。黄仁勋亲自谈判争取到500万美元紧急资金,使公司渡过难关。 2、英伟达显卡因焊点设计缺陷出现大量故障,引发品牌信任危机。黄仁勋公开承认问题,主动召回产品并全额退款,最终重建用户信任。 也难怪黄仁勋流露真情:“33年来每一天、每一分钟我都在压力中度过。整整33年里的每一秒,我都感受着公司、客户和市场的重担,这种压力从未离开过我,哪怕一刻都没有。”不光如此,近日黄仁勋与中国媒体沟通时表示,自己首先是中国人,后来成了美籍华人,并表示中国在AI领域会非常成功。 “首先,我是中国人,然后我成了美籍华人(American Chinese)。而我刚好是做半导体的,研究人工智能,不过如你所知,有很多中国人在人工智能领域很出色”。 黄仁勋坦言,现在中国有非常多的人才,因为有着重视科学和数学的文化,已经具备了发展计算机科学的基础。而计算机科学和软件对人工智能非常重要,所以这是一个非常好的契合点。 而且,科技的发展恰好就处在这个时代,中国确实已经为此做好了充分准备。 “我认为中国将会非常成功”,黄仁勋说。据了解,黄仁勋1963年出生在中国台湾,5岁随家人搬到泰国生活,10岁时离开泰国来到美国,获得斯坦福大学电子工程硕士学位后,于1993年创立英伟达公司。 1999年,NVIDIA发明GPU,让实时可编程着色技术成为可能,这一技术也定义了现代计算机图形及后来革命性的并行计算。 在NVIDIA推动GPU大规模并行计算普及之前,主流计算架构主要依赖以CPU为基础的串行计算模式。 当时也曾有不少企业尝试开发并行计算架构,但都失败了,初创的NVIDIA坚持把重心放在并行计算领域,最终,GPU成了NVIDIA的立业之基。 如今,英伟达成为了这个时代最主流的AI公司之一。7月9日,NVIDIA市值突破4万亿美元大关,成为全球首家市值超过4万亿美元的公司。 NVIDIA产品方面,此前在NVIDIA H20芯片被禁售期间,有消息称NVIDIA将继续推出降规版AI芯片。 如今,供应链消息证实,NVIDIA计划在第四季度出货新一代B30芯片,这款芯片的性能略低于H20约10%至20%,价格则降低约30%至40%。 这一策略旨在进一步提升NVIDIA在中国市场的竞争优势,市场分析师预计,B30芯片的备货量可达120万颗。 此外,美国近期调整政策,允许NVIDIA恢复向中国大陆出口H20芯片,市场预计下半年出货量可达40万颗。 目前,中国台湾半导体供应链中约有100万颗H20芯片库存,其中成品芯片库存约70万颗。 由于半导体晶圆龙头大厂的投片已经完成,未来是否新增H20芯片订单尚不确定,因此当前的重点是消化现有库存,以带动服务器零部件订单的重新活跃。
A卡新传言:UDNA最高旗舰规模大增50%,384Bit位宽 来源——AMP实验室 还会是MCM吗? 时间来到了25年7月下旬,现在已开始流传关于RDNA5或者说是UDNA的消息。我们知道,这一代RDNA4显卡没有真旗舰产品,AMD正在争取时间,为后续的联合架构UDNA铺路,而接下来这一代的成败将大大影响AMD的图形产品道路。一些早期谣言指出,UDNA架构将是一种全新设计,从头开始构建,并且还提供了一些关于光线追踪性能和AI性能的巨大改进。 知名爆料者Kepler_L2 在老牌硬件论坛Anandtech 发表了一些消息,他指出了三种潜在的芯片配置: ▲Navi 5X(高):96 个 CU + 384 位显存总线 ▲Navi 5X(中):64 个 CU + 256 位显存总线 ▲Navi 5X(低):32 个 CU + 128 位显存总线 相传,顶级的Navi 5X将配置最多96CU计算单元,这比当前顶级RDNA4中的RX 9070XT的64CU提升多达50%。并且新的GPU还升级到384Bit显存位宽,这样可以提供更多的显存容量,而AMD大概率会在下一代换装GDDR7显存,3GB颗粒也将列装,所以我们有可能看到36GB的消费级A卡旗舰,毕竟AMD在显存方面给的还算慷慨。这款顶级芯片可能不会成为一些死忠A粉的超级发烧产品,或者英伟达的xx90杀手,但是它的规模也注定它将会是一款发烧产品,并且提供良好的性价比。据称,该芯片的预计性能将卡在RTX 5080与RTX 5090之间——不是说新A卡不够强,而是RTX 5090太过怪兽。 随后是256Bit的64CU芯片,这款规模和当下的RX 9070XT配置接近,但是在新架构、RT核心和AI引擎改进下, 将带来更多可靠提升,大概率能充分摸到RTX 5080的屁股。 最后则是不值一提的128Bit 32CU的芯片,这个配置和RX 9060系列相似,提升主要来自架构和工艺,以及新的G7显存的高带宽,指望有很大提升?不是很现实。 AMD的下一代游戏显卡预计在2026年第二季度开启进入量产,而在此之前, 英伟达还将推出RTX 50系的中期“SUPER”升级,英特尔也将发布Battlemage架构的BMG-G31显卡,2026年的竞争应该会让游戏玩家感到兴奋。
计划有变!Intel新一代Arrow Lake Refresh仅提升频率:NPU不变 最新消息显示,Intel新一代Arrow Lake Refresh处理器的升级将仅限于频率提升,NPU部分将保持不变。 前不久才有消息称,新一代Arrow Lake Refresh不仅会提升频率,还会将NPU升级为NPU4,这是一款更强大的AI处理器,已经用于Lunar Lake等产品中。不过英特尔似乎已经改变了计划,Arrow Lake Refresh将不会升级NPU,而是专注于提升处理器的频率。 这一改变意味着,虽然Arrow Lake Refresh可能会带来更高的性能,但其AI处理能力将与当前版本相同。此前还有传闻称,Arrow Lake Refresh可能会有更多核心(8P+32E)版本,但这一配置现在似乎已被取消。 该系列处理器将继续采用LGA-1851接口,命名也将保持在“200”系列下,也就是可能会看到类似酷睿Ultra 9 295K这样的型号。 Intel显卡方面,在BMG-G21系列显卡发布之后,Intel似乎正在推进其更大型的Battlemage芯片“BMG-G31”,在Compute Runtime项目中发现了四款有关的设备ID。 Phoronix发现,BMG-G31显卡的支持已经被添加到Compute Runtime 25.27.34303.5中,这也确认了Intel正在为其更大的BMG-G31显卡做准备。新增的四个设备ID分别为0xE220、0xE221、0xE222和0xE223,这些ID很可能是为即将到来的BMG-G31显卡产品线准备的。根据之前的报道,BMG-G31显卡预计将配备32个Xe2核心,保留GDDR6显存,并可能采用256位位宽,支持16GB的显存,比Arc B580的12GB显存(192位)增加不少。 核心数量的增加预计将达到60%,因此WccFtech表示,预期BMG-G31 GPU的产品性能将接近RTX 5060 Ti和RX 9060 XT,这两款显卡都位于350至450美元的市场段。 Intel已经通过锐炫B580 12GB显卡证明了其在价位上的竞争力,如果BMG-G31显卡的定价在329至349美元之间,它可能会成为一款具有竞争力的显卡产品。 预计Intel将在2025年底推出其顶级BMG-G31“Battlemage”显卡及相关产品。至于AMD CPU这边,AMD的锐龙5 7600X3D处理器终于在英国一家大型零售商上架,这是继美国、德国和中国之后,全球第四个可以购买这款处理器的地区。 这款处理器是AMD上一代Zen 4架构中的预算X3D产品,拥有出色的性价比和不错的游戏性能。锐龙5 7600X3D处理器最初仅在美国MicroCenter独家发售,随后在德国Mindfactory上架,差不多一个月后在中国也上市开售。 随后其他地区一直未能见到其身影,直到最近,这款处理器终于在英国LambdaTek上架,售价为299.57英镑(含增值税)和249英镑(不含增值税),含税价约合人民币2887元。 相比之下,这款处理器在中国上架时价格为2199元,如今降价到1949元,在美国刚开始的售价为299美元(约2146元人民币)。锐龙5 7600X3D采用6核12线程,其基础频率为4.1GHz,加速频率为4.7GHz,相比非X3D版本的7600X(4.7/5.3GHz)要低一些。 但由于其额外的64MB L3缓存,它在游戏和某些应用中的表现仍然优于7600X,此外,7600X3D的TDP为65W,相比7600X的105W更为省电。 LambdaTek是英国主要的PC硬件零售商之一,目前该处理器尚未到货,但预计很快就会有库存,这也表明AMD正在扩大这款处理器的销售范围,未来可能会在更多地区看到它的身影。同时AMD新一代Zen5架构的线程撕裂者PRO 9000WX系列的国行价格已经公布,其中96核心撕裂者PRO 9995WX售价为99995元,接近10万元。 在Chiphell论坛相关帖子中,Napoleon放出了线程撕裂者PRO 9995WX在Cinebench R23多核测试中得分,获得了高达173452分。这一分数相比前代7995WX的平均得分(约100000至110000分)提升了近60%,根据他的说法应该是开启了PBO模式,而功耗也达到了840W。 除了旗舰型号外,AMD线程撕裂者PRO 9965WX(24核48线程)也在Cinebench R23测试中表现出色,得分60336分。相比前代7965WX提升了22%,与32核的线程撕裂者7975WX相当,这一成绩似乎是在默认设置下取得的,开启PBO模式后,性能有望进一步提升。需要注意的是,Cinebench R23的测试结果与核心频率密切相关,比如线程撕裂者PRO 7995WX在液氮冷却和超过6000MHz的频率下,可以突破200000分大关,因此,9995WX在实际应用中的表现可能会更加出色。
首页 1 2 3 4 下一页