纳罗斯之牙🌙
-
关注数: 4
粉丝数: 208
发帖数: 13,926
关注贴吧数: 5
G7果然全方位由于G6,除了成本 不管是性能、能效还是散热,RDNA4没用真的很可惜
RGB各家东西都出齐了,简单做个比较 就拿9060 XT、5060 TI、和B580这哥仨举例,1440p性能从上到下(以9060XT为100%,抄TPU的数据) 5060 TI: 面积181,带宽448gb/s,光栅性能106%,混合光追104%,功耗166w平均183w最大 9060 XT: 面积199,带宽320gb/s,光栅性能100%,混合光追100%,功耗182w平均183w最大 B580: 面积272,带宽456gb/s,光栅性能77%,混合光追74%,功耗165w平均193w最大 你大英成功以最大的面积、最高的带宽,做到性能垫底 我再加个4060 TI 16G的:面积188,带宽288gb/s,光栅性能93%,混合光追96%,功耗154w平均162w最大
新计算单元越做越宽了 有种搞双发射多加的那组SIMD32转正的美
R4这代显存带宽瓶颈还严重吗 9070XT 640gb/s的小带宽能做到这份性能感觉已经相当不错了 如果能支持和用上28甚至32gbps的gddr7显存还能不能再压榨出5-10%的性能
怪不得FSR4要下半年正式推出 还能靠驱动更新dll小半年
真的很难想象FSR4要怎么在R3的卡上跑 看看这计算性能差距,可以把计算单元数量和频率带入算一下
R3.5和R4每个SE的面积基本相当啊 不精确计算每个SE(不含专有的L2缓存)的面积约占芯片总面积的9.4%,乘上官方给的356.6mm^2面积,得到的结果约是33.6mm^2 再看看我之前算的STX1的结果,基本差不多对比一下R3每个SE的面积约为27.33mm^2 注意啊这三个对比都是8WGP/SE,不存在谁计算单元比谁多的情况。
UDNA如果还做500+面积的次旗舰,那5090就是性能标杆了 就是从N4到N3,不知道实际密度能提高多少
Anandtech论坛那帮人手挺快 轮子删掉的图全让他们保存起来了,我索性也转过来吧
这N48看着是单芯片啊,面积不小 红笔圈上的,谁说的MCM来着
N44现在都没什么消息啊 面积功耗性能?
你大英要退独显市场了 不幸的是,对于 PC 图形爱好者来说,英特尔的独立 GPU 努力现在似乎同样被视为一次失败的实验。Gelsinger 表示,他现在专注于简化公司的消费产品,而独立显卡/芯片显然即将被淘汰。他说: 我们如何处理图形?集成显卡功能越来越强大,因此未来市场对独立显卡的需求会越来越小。 如果英特尔放弃它们,也不会让人感到非常意外——它的游戏图形计划在独立显卡方面只取得了非常有限的成功,并且只在超低预算领域发挥作用,而AMD 现在对该领域构成了更大的威胁。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.theverge.com%2F2024%2F11%2F1%2F24285513%2Fintel-ceo-lunar-lake-one-off-memory-package-discrete-gpu&urlrefer=b99740aba9ba0645cf6febe9780e1233
还真就 44+44 = 48
128C亦有差距 经过测试的 AMD EPYC 9575F 高频 Turin 64 核处理器、EPYC 9755 128 核 Turin 处理器和 EPYC 9965 192 核 Turin Dense 处理器在测试的各种服务器/技术计算/HPC 工作负载中占据主导地位。双 128 核 EPYC 9755 Turin 处理器比配备 MRDIMM 的双 Xeon 6980P Granite Rapids 服务器快 40%。即使是单个 EPYC 9755(和 EPYC 9965)也能在比最初为 Granite Rapids 运行的基准测试范围更广的基准测试中有效地与双 Xeon 6980P 处理器相媲美。 EPYC 9755 旗舰 Turin(非密集型)处理器的性能是 96 核 EPYC 9654 Genoa 处理器的 1.55 倍。EPYC 9965 192 核 Turin Dense 处理器也比双核 EPYC 9754 旗舰 Bergamo 处理器快 45%。这些都是跨代的重大改进。
7800X3D成叹息之壁了 Core Ultra -2%,牙膏倒吸 以为台积电工艺能拯救intel,做梦呢
这一代RGB三家出完新品最小丑的还是I卡 350-400平的面积,性能目标4070,放到2024年都不知道该怎么定价 不能还卖两千多块跟N44坐一桌吧,卖一张亏一张
24.8.1有各种各样问题的去下这个驱动 几小时之前刚出的:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.amd.com%2Fen%2Fresources%2Fsupport-articles%2Frelease-notes%2FRN-RAD-WIN-24-20-11-01.html&urlrefer=1083c21d2911b6ce28afaae633d80661 已修复的问题和改进 玩《Warhammer 40,000: Space Marine 2》时出现间歇性驱动程序超时或应用程序崩溃。 在某些 AMD 显卡产品(例如 Radeon™ RX 5700 XT)上玩《战锤 40,000:太空陆战队 2》并加载到某些地图时,会出现间歇性驱动程序超时或应用程序崩溃。 在某些 AMD 显卡产品(例如 Radeon™ RX 6600 XT)上玩《最终幻想 XVI》时,某些过场动画期间会出现间歇性驱动程序超时或应用程序崩溃。 当全局照明为“中等”或更高时,玩《黑神话:悟空》时可能会观察到过暗的阴影或不饱和的色彩。 在启用 AMD 软件:Adrenalin Edition™ Record & Streaming 和 HDR 的情况下玩《对马岛之魂 DIRECTOR'S CUT》时,可能会出现间歇性游戏损坏现象。 AMD 软件:Adrenalin Edition 可能会在系统从睡眠模式唤醒时意外启动。 使用 AMD 软件:Adrenalin Edition 中的 AV1 编解码器录制时,音频和视频可能会间歇性地不同步。
AGESA 1.2.0.2改善了 Zen 5 CPU 的核间延迟并大幅提升了性能 Anandtech 论坛成员Det0x设法用最新的 BIOS 更新了他的 ASUS ROG Crosshair X670E Gene 主板,并使用 CapFrameX 核心到核心延迟工具发布了旧版 BIOS 与最新版 BIOS 的比较结果。结果非常令人印象深刻。使用旧版 BIOS,用户发现 CCD 之间的平均延迟为 180 纳秒,而当核心在同一 CCD 上通信时,延迟约为 18-20 纳秒。 使用新的 BIOS 后,跨 CCD 通信时的平均延迟下降了 58% 至 75 纳秒,而 CCD 间延迟保持不变,为 18-20 纳秒。现在,核心间延迟不应对整体性能造成很大影响,因为 AMD 的调度程序主要利用单个最快的 CCD 来运行游戏应用程序,但在多线程应用程序中,看起来 AGESA 1.2.0.2 BIOS 修复带来的提升相当可观。 用户报告称,他们在 Cinebench R23 中的得分提高了 400-600 分。一些拥有 Ryzen 9 9950X 的用户还报告称,CPU-z 和 3DMark CPU 基准测试都出现了明显提升,最好的部分是 BIOS 运行完美无缺,没有任何问题。
这PS5 PRO的所谓技术演示等于什么也没说 浪费生命的十分钟看完发现全是一年前被爆料爆到烂的东西 不过RDNA4这个IP看上去不错,光追吞吐翻两到三倍,也能跑高性能升采样算法,可惜没旗舰
AMD Ryzen 9 9950X 和 Ryzen 9 9900X 提供出色的 Linux 性能 总的来说,我在所有 CPU 上运行了近 400 个基准测试。 对所有原始性能结果取几何平均值时,Ryzen 9 9950X 比 Ryzen 9 7950X 快 17.8%。 与此同时,在这种广泛的工作负载组合中,Ryzen 9 9900X 比 Ryzen 9 7900X 快 21.5%。 Ryzen 9 9950X 的整体性能比 Intel Core i9 14900K 快 33%,甚至 Ryzen 9 9900X 也比 Core i9 14900K 快 18%。 对于仍在使用 AM4 的用户来说,Ryzen 9 9950X 的性能是 Ryzen 9 5950X 处理器的 1.87 倍。 这些都是 Ryzen 9 9900 系列的巨大进步。 对于英特尔酷睿基准测试,还值得一提的是,该测试是在新发布的英特尔 0x129 微代码更新之前进行的,我很快就会有更多关于该变化的基准测试。截至撰写本文时,酷睿 i9 14900K 的零售价约为 550 美元,而锐龙 9 9950X 的零售价将高出约 18%,但总体而言,其地理平均值性能提高了 33%。与此同时,锐龙 9 9900X 的售价为 499 美元,比 i9-14900K 便宜约 50 美元,但总体性能提高了 18%。与竞争对手相比,AMD 锐龙 9 9900 系列在性能、价值和能效方面都毫不逊色。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.phoronix.com%2Freview%2Famd-ryzen-9950x-9900x%2F15&urlrefer=37efb10f5592f5208048e626cd1f8243
黑吗喽配置的三个升采样各有各的问题 FSR树叶有很严重的拖影,不知道他们用的是哪个版本,不像是3.1的样子 而TSR和XESS的树叶像素化都很严重,TSR的画面给我一种过锐的感觉,XESS还没有插帧
从STX1的集显面积来看250mm^2还真能塞得下32WGP+64MB的缓存
Q2财报前夕大英传出要裁员 再叠加最近蓝屏门,Intel的事情总是这么糟糕
质量提升了,都是性能换的 看国外懂哥说FSR使用FP16计算,因为计算成本的关系仅在运动矢量方面使用了AI推理,别的部分都没有 不用矩阵加速指令就是带着镣铐跳舞,但是用了又会杀死兼容性,两难选择来源:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fgpuopen.com%2Fmanuals%2Ffidelityfx_sdk%2Ffidelityfx_sdk-page_techniques_super-resolution-upscaler%2F&urlrefer=f7ca3517d2def31eec5570e560db1345
AMD 申请了可配置多芯片 GPU 专利——图示显示三个芯片 如今,将复杂的芯片设计拆分为多芯片解决方案风靡一时。AMD 已经在其 CPU 和数据中心 GPU 中使用了多芯片设计,并且其当前一代RDNA 3 RX 7000 系列 GPU也采用了不太复杂的芯片。根据 2022 年 12 月 8 日提交并于本周发现的一项新专利,现在该公司似乎正在寻求为更广泛的应用生产更复杂的多芯片 GPU。“处理系统的图形处理单元 (GPU) 被划分为多个芯片(称为 GPU 芯片),这些芯片可配置为在第一种模式下作为单个 GPU 共同运行并与应用程序交互,在第二种模式下作为多个 GPU,”专利申请的摘要描述写道。 这显然不同于当前的 RDNA 3 架构,在 RDNA 3 架构中,AMD 使用中央 GCD(图形计算芯片)芯片来实现 GPU 的所有主要功能,并使用多个 MCD(内存缓存芯片)芯片来实现内存接口和缓存。CDNA 数据中心 GPU 更像这里描述的,具有多个计算/处理芯片。 该专利描述了一种相当具体的 GPU 实现,该实现具有三个 GPU 芯片组和一个多媒体芯片。每个 GPU 芯片组由一个前端芯片和着色器引擎芯片组成(专利显示了三个 SE 芯片,但实际数量可能不同)。这种多芯片 GPU 可以以三种模式运行: 第一种模式,单 GPU:所有 GPU 芯片作为一个统一的 GPU 协同工作,共享资源并协同处理任务。在此模式下,一个前端芯片通常负责 GPU 内所有着色器引擎芯片的命令调度。这基本上就是传统 GPU 的工作方式。 第二种模式,多 GPU:GPU 芯片被分成不同的组,每个组都作为独立的 GPU 运行。每个组都有自己的前端芯片,负责为其相关的着色器引擎芯片调度任务。 第三种模式,混合配置:此模式提供灵活的配置,其中一些 GPU 芯片作为单个 GPU 运行,而另一些则作为独立 GPU 运行。 AMD 的数据中心 GPU 设计已经分拆了好几年,该专利最有可能首先针对多芯片数据中心 GPU,但也可能扩展到客户端 GPU。AMD 未来可能希望分拆其客户端 GPU 的原因有几个。 首先,随着高 NA EUV 光刻技术的出现及其减半的曝光场(或光罩尺寸),多芯片设计将变得更加普遍。鉴于 AMD 在多芯片设计方面已经拥有足够的经验,多芯片 GPU 可能是一个可行的选择。 其次,由于大型单片芯片的流片和生产成本过高,采用多芯片设计来打造客户端 GPU 是 AMD 降低成本的好方法。它已经在 GCD/MCD 芯片中部分实现了这一点,但这是目前客户端芯片的第一次迭代,我们预计 AMD 将在未来的设计中继续走这条路。芯片组还可以将着色器引擎和主要计算硬件放在前沿节点上,而前端引擎则采用更老、更便宜的工艺技术。 有了多个芯片组,将 GPU 性能从入门级解决方案扩展到高端产品就变得更加容易了。事实上,AMD 的摘要描述是这么说的: “通过将 GPU 划分为多个 GPU 芯片组,处理系统可以根据操作模式灵活且经济高效地配置一定数量的活动 GPU 物理资源,”专利声称。“此外,可配置数量的 GPU 芯片组被组装成单个 GPU,这样就可以使用少量的流片来组装具有不同数量 GPU 芯片组的多个不同 GPU,并且可以用实施不同代技术的 GPU 芯片组构建多芯片 GPU。” 同样,AMD 已经声称在 RDNA 3 中使用了 GPU 芯片组,但这显然代表着将功能分解到不同芯片中的水平又迈进了一步。我们在 Ryzen CPU 上看到了类似的情况,第一代小芯片更像是一个概念验证,后续设计更好地分离了功能,以实现最大的性能和可扩展性。AMD 尚未完成 GPU 小芯片的开发,我们怀疑 GPU 领域的大多数参与者最终都会采取类似的方法。
关于R4国外舅舅党和吧里供应链的说法已经出现较大偏差了 以开普勒为首的推特舅舅党和anandtech论坛舅舅党说N48是单芯片、4SE 8SA 32WGP 64CU,面积在200-250之间,用的GDDR6 18Gbps内存,性能预计在7900GRE和7900XT之间; 吧里的说法:大的是MCM,面积在N31和N32之间,性能目标7900XTX,以及4+4和5+4谜语。 不知道该信谁,我反正拭目以待
Zen 5发布完该看看Zen 6了 还是anandtech那个舅舅党,总结一下: Zen 6有至少三种CCD配置,8核16核32核,消费级依旧只用8大核的版本,但是会做>3个CCD,所以旗舰处理器的核心数有望上探到32核 Zen 6有新的IOD,里面的IP全部更新,AM5插槽,所以依旧是DDR5平台 登场时间2026上半年 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fforums.anandtech.com%2Fthreads%2Fzen-6-speculation-thread.2619444%2F&urlrefer=0de8436b652d012a081b6061d84d7710
Anti-Lag回来了,但是2 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fcommunity.amd.com%2Ft5%2Fgaming%2Famd-radeon-anti-lag-2-technical-preview-now-available-in-counter%2Fba-p%2F686012&urlrefer=e91cd5eeb4f369f37eea0fc02743f733 CS2开始公测,这次不能通过驱动自己开启了,还是得等开发者慢慢更新
RDNA和CDNA该统一了吧 早上看r/amd,看到首页又是WtfTech的转帖,没想到是chh出口的东西http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.chiphell.com%2Fthread-2604112-1-1.html&urlrefer=73548bdb4e9832956efe96bf0edb02f9 以后用RDNA搞ai,gcn接着做HPC?这样软件上消费级也好沾点MI的光
原来被取消掉的RDNA4旗舰有超过两百个CU http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fforums.anandtech.com%2Fthreads%2Frdna4-cdna3-architectures-thread.2602668%2Fpost-41199689&urlrefer=acb822e3aab037dc91c77a86ea1e9a62 看到了WTFTECH的报道,去这个贴子底下看了一圈,大概总结下: 被取消的RDNA4旗舰:9SE,超过两百个CU(我猜应该是216个),三个CCD(打G容易被吞),每个CCD里面三个SE,600w 老实说这个规模、N4的制程,综合面积加起来得冲着800去了,看样子被取消的时间点还非常晚,很可惜 看看能不能在RDNA5复活
这哥们在别的推里说RDNA4又回到单芯片了,和小吧说的MCM不一样
这个FSR团队总给我一种单线程开发的感觉 一次只能做一件事http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fcommunity.amd.com%2Ft5%2Fgaming%2Famd-fsr-3-1-announced-at-gdc-2024-fsr-3-available-and-upcoming%2Fba-p%2F674027%2Fjump-to%2Ffirst-unread-message&urlrefer=2490cd915eb782414452f89659bd4b0d
光追该翻倍了吧
FSR AI来不来得及跟着RDNA4一起发布?
8WGP/SA的配置似乎不止出现在STX,ps5 pro也是一样 从这个舅舅党的评论来看,n44和n48还是不是之前猜测的4SE和2SE还不好说ps5 pro要不就是64rops要不就是128rops
从MLID给的这两张图来看,Zen 6应该可以看到16c的CCD了 N3系列制程的16c CCD + 先进封装,CPU的整体性能应该可以得到很大的改善
gfx12的IP应该是首爆吧 从他这个代号来看,除非RDNA4一开始就没有旗舰的规划,否则应该叫gfx1202和gfx1203才对 另外48+48=44吗
chips&cheese又做了6900XT、7600、2060的对比测试 测试游戏还是之前的星空:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fchipsandcheese.com%2F2023%2F10%2F15%2Fstarfield-on-the-rx-6900-xt-rx-7600-and-rtx-2060-mobile%2F&urlrefer=daf7b8f08abc50550faf099a19867109
讨论FSR3之前,有几个问题必须要清楚 首先FSR3包含了什么?两个主要功能和一个修复: 第一是自建反延迟的帧生成功能,根据AMD的介绍:“对帧进行插值会增加延迟——这是设计使然。然而,AMD FSR 3 的开发目的是通过内置延迟减少技术最大限度地减少延迟的影响。游戏开发人员还可以实施通用和跨平台建议,以最大限度地减少游戏延迟的影响。” 第二是原生AA模式,这个东西包含了抗锯齿和锐化 最后是一个修复,从社群反馈来看基本消灭了开启FSR后的闪烁和伪影,属于质量升级 输入延迟这一块a卡直接开anti-lag或者anti-lag+,而对于n卡来讲可以通过黑客方式破解nv对reflex的限制来强行开启,我看有人提到special k但我不用n卡我不知道这是什么
AMD出了个预览版驱动带AFMF 就是发布会提到过预计明年Q1的驱动插帧功能,从笔记上来看还有不少bug,慎用 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.amd.com%2Fen%2Fsupport%2Fkb%2Frelease-notes%2Frn-rad-win-23-30-afmf-tech-preview&urlrefer=ddd00a80968bc8a907b305643ccf0f66
MLID终于放了点有用的东西 我这边直接转VCZ的文章了: 这位 YouTuber 分享了两张从 AMD 内部演示文稿中摘录的幻灯片,最初并不打算供公众使用。这些幻灯片提供了有关下一代 Zen 架构的最新进展和策略,揭示了一些基本细节,例如预期的 IPC 改进、支持的功能和核心数量。 路线图似乎经历了轻微的时间调整。然而,重要的是要记住,这些微架构涵盖广泛的产品,包括数据中心和面向消费者的系列。因此,发布时间表可能不仅反映了 AMD 对 Ryzen 8000 及更高版本的意图,还包含了对 EPYC 产品的考虑。 Nirvana Zen5 (1H 2024) 概述的新 4nm/3nm 微架构包括专为 Ryzen 8000 系列设计的 Nirvana (Zen5)。根据幻灯片,预计 IPC 将增长 10% 至 15%。IPC 可能仍会增加,因为演示仅显示了尚未经过零售芯片验证的目标。此外,该幻灯片还列出了 48K 数据缓存、8 个宽调度、6 个 ALU、FP-512 变体和一个新的低功耗核心选项。 更有趣的是,据说它提供了 16 核复合体。后者可能是专门使用 Zen5c 变体的选项。提醒一下,Strix Point APU将在一个芯片中使用两种子架构。换句话说,如果 AMD 走这条路(例如 8x Zen5 + 16x Zen5c),AM5 平台上的游戏玩家应该期待最多 16 核 Zen5 设计或 32 核 Zen5c,或两者的混合。 Morpheus Zen6 (2H 2025) Morpheus 是 Zen6 的微架构代号。现在预计将采用3nm和2nm工艺技术,AMD的目标是比Nirvana达到10%的IPC提升。AMD 计划推出用于 AI/ML 算法加速的 FP16 指令,以及新的内存分析器。在核心复杂度方面,AMD 将核心数量增加到 32 个,这又应该是指 Zen6c,而不是 Zen6。 MLID 称,Zen6 微架构据称将通过新的封装技术提供与 Zen2 类似的芯片布局重新设计。虽然尚未得到证实,但据称对于 Zen6,AMD 可能会将 CCD 堆叠在 IOD(输入/输出接口芯片)之上。这将是 AMD 芯片堆叠的分解小芯片设计方法的重大转变。目前尚待确认的是Zen6是否会采用AM5接口。
LLM初创公司采用AMD GPU,表示ROCm与Nvidia的CUDA平台“旗鼓相当 这个标题字数限制简直了,我都删了一堆空格还卡一个句尾引号没发出来 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.crn.com%2Fnews%2Fcomponents-peripherals%2Fllm-startup-embraces-amd-gpus-says-rocm-has-parity-with-nvidia-s-cuda-platform&urlrefer=cb6730c2805ff8bd00e21925da00c618 一家专注于微调大型语言模型的初创公司透露,它已经“秘密地在 100 多个”AMD Instinct MI200 系列 GPU 上运行,并表示该芯片设计商的 ROCm 软件平台“已经实现了与 Nvidia 针对此类模型的主导 CUDA 平台的软件平价”。 总部位于加利福尼亚州帕洛阿尔托的初创公司 Lamini 在周二的一篇博客文章中披露了这一消息,当时 AMD 对竞争对手 Nvidia 发起了迄今为止最大规模的攻势,Nvidia 的 GPU 是许多大型语言模型 (LLM) 和其他类型的主要引擎。今天的生成式人工智能应用。 Lamini 由机器学习专家 Sharon Zhou 和前 Nvidia CUDA 软件架构师 Greg Diamos 创立,是一家小型初创公司,其平台允许企业使用专有数据将 LLM 微调和定制为私有模型。该初创公司声称,有超过 5,000 家公司在候补名单上,等待使用其几个月前开放的平台。 Lamini 在博客文章中表示,它已经在自己的基础设施上运行了 100 多个 AMD Instinct MI200 GPU,该初创公司通过其新发布的 LLM Superstation 提供这些基础设施,可在云端和本地使用。 据这家初创公司称,这使得 Lamini 成为“唯一在生产中专门在 AMD Instinct GPU 上运行的 LLM 平台”,并表示运行 Meta 的 700 亿参数 Llama 2 模型的计算成本比运行 Meta 的 700 亿参数 Llama 2 模型的计算成本便宜 10 倍。在 Amazon Web Services 上执行此操作。 Lamini 表示,对 AMD Instinct GPU 的依赖是一个差异化因素,部分原因在于它们是可用的,这与 Nvidia 的旗舰 A100 和 H100 GPU 不同,后者由于运行 LLM 和其他类型的生成人工智能应用程序的基础设施的高需求而出现短缺。 Lamini 的首席技术官 Diamos 称赞 ROCm(AMD 用于在 GPU 上编码软件的软件堆栈)与 Nvidia 的 LLMS CUDA 平台“实现了软件对等”。 他表示,该初创公司选择2021 年推出的AMD 旗舰产品 Instinct MI250 GPU作为其平台的基础,“因为它运行我们客户所需的最大模型,并集成了微调优化。” Diamos 补充说,MI250 的 128 GB 高带宽内存容量使 Lamini 能够“运行比 Nvidia 的 A100 集群更低的软件复杂性的更大模型”。 根据 Lamini 运行的测试,AMD 功能较弱的 Instinct MI210 GPU 在通用矩阵-矩阵乘法 (GEMM) 方面实现了每秒高达 89% 的理论峰值万亿次浮点运算,在 ROCM 的 hipMemcpy 功能方面实现了高达 70% 的峰值带宽。 “这表明 AMD 的库有效利用了关键基元的 MI 加速器的原始吞吐量。凭借高效运行的基本构建块,ROCm 为微调 LLM 等高性能应用程序提供了坚实的基础。”Diamos 在博客文章中写道。 据 Lamini 称,AMD 正在利用这家初创公司的平台,由AMD自己的员工“针对众多用例”来微调大型语言模型
英特尔因向PC制造商付款阻止AMD进入市场而被欧盟罚款4亿美元 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.neowin.net%2Fnews%2Feu-fines-intel-400-million-for-blocking-amds-market-access-through-payments-to-pc-makers%2F&urlrefer=73d4cae499842b239ac2a248344f7177 欧盟委员会因 2002 年至 2007 年间通过赤裸裸的限制阻碍竞争对手进入市场而对英特尔处以 4 亿美元(3.76 亿欧元)的罚款。此次罚款是在一场长期的反垄断法庭斗争之后进行的,该斗争可追溯到 2009 年,当时欧盟委员会最初对英特尔处以罚款滥用市场支配地位造成的损失达创纪录的 11.3 亿美元。 虽然英特尔的一些行动(例如隐藏回扣)因缺乏损害证据而在上诉中被撤销,但委员会维持英特尔向 PC 制造商付费以推迟或限制使用 AMD 处理器的产品。 具体来说,委员会列举了一些例子,其中英特尔在 2002 年至 2005 年期间向惠普付费,要求其不得通过直接渠道向中小型企业销售采用 AMD 技术的商用 PC。它还付钱给宏碁,将基于AMD的笔记本电脑的推出时间从2003年底推迟到2004年初。英特尔还付钱给联想,将AMD笔记本电脑的推出时间推迟六个月。 根据普通法院的说法,通过对付款设定这些条件,英特尔能够限制 AMD 台式机在关键细分市场构成的竞争威胁。 欧盟委员会表示,新的 3.76 亿欧元罚款反映出英特尔在近 5 年内阻碍了其主要竞争对手在 x86 CPU 市场的发展和扩张。 由于这些限制,计算机制造商停止、推迟或限制了基于竞争对手芯片组的产品的商业化,这些产品是他们积极规划的并且有消费者需求。 因此,英特尔的赤裸裸的限制剥夺了客户本来可以拥有的选择,对市场竞争产生了不利影响。 然而,斗争尚未结束,委员会已就驳回案件中的回扣部分提出上诉。如果上诉法院裁定回扣也违反了竞争法,英特尔仍可能面临更多罚款。由于英特尔没有对该裁决提出上诉,3.76 亿欧元的罚款现已确定。 欧盟才是人类之光好吧
开贴简单统计一下星空的可招募船员 我这个档还少了狂热粉丝和卡西斯,以及隐藏船员乔恩斯威斯(数据库里表明她是可招募船员,但是我搜了搜还没有人招募到她)
GFX11.5添加了sALU跑浮点的新指令 舅舅党还是没说错的
chips&cheese做了星空这个游戏7900XTX和4090的对比测试 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fchipsandcheese.com%2F2023%2F09%2F14%2Fanalyzing-starfields-performance-on-nvidias-4090-and-amds-7900-xtx%2F&urlrefer=044240ceb7560595c1129cf7eef7d467 从他的分析和结论来看WGP数量是造成性能瓶颈的主要原因4WGP/SA还是堆太少了
RDNA4真的取消高端卡了吗 有人在推上发了一个截图,是从一条油管视频上截下来的,这个视频叫“Getting stable diffusion working on an AMD RX 6700xt using ROCM”,里面有一位自称AMD员工评论如下图:打开他的个人页面显示如下:稍微验证了下这哥们的身份,搜了搜他的名字,找到了他的领英页面:http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fwww.linkedin.com%2Fin%2Fbrock-suire-1576a149&urlrefer=0ffce23ea93593c5c7228e9bf3281971 最近推特舅舅党和员工以及来自供应链的吧友提到的一些信息有冲突,就看看不评论
这N6的7600的频率表现是真的不错 感觉这工艺红利只吃在密度上了,性能是一点都没有
推上有人做了RDNA4旗舰(已取消?)的渲染图 图一乐,可以参考看看这个GPU分两层:底层是以MID和AID构成,这里面我和他观点不一样的地方在于GDDR6 PHY应该做到AID里;顶层是负责互联的芯片桥和渲染引擎芯片。 渲染图效果如下:
原来RDNA1就有12WGP/SE的配置啊 当时发布的时候没注意,回去找了找图看看才发现
祥硕ASM4242主控是出了什么问题吗 怎么X670主板的USB4功能都使用的intel方案
快一年过去了,回头看Angstronomics这家爆料是真的准 这数据就像提前三个月从发布会ppt抄下来的一样,连7900xt的规格都精准预测
满改八旗也就这样了 还有个招募一队减.1腐败的效果没显示出来最后还是没有炮兵
73相性这块实在尴尬 琢磨给姜维搭配副将发现同73相性能用的几个哥们兵法和精通都尴尬的一批凑步兵凑骑兵凑弓骑凑弩兵都缺兵法和精通凑不起来,这四个人出场时间还都很尴尬:前期能凑齐的剧本只有281了 除了这四个以外还有邓芝和庞统,一个低武46、一个搭配到别的队伍做军师了 最后还是得跟附近相性凑,给个前期好拿的六韬礼记当高统高智军师带兵用 也是应了263剧本的介绍:能辅佐他的人很少
截至到法国GP 队友平均排位差距
双倍的SIMD32它来辣 能否带来双倍的快乐(指光追性能)?
四季宝归还任务不触发怎么办 拎着手枪清图,满大街找人射,吐了
推友活整起来了
萨夫瑙尔成雷诺新领队了
有推友根据Red Gaming Tech最新爆料做了几张图 Navi 31吧友看看可信度有多高看样子安培评测出来后SIMD32翻倍的猜想是要成真了
1
下一页