米线山️之父 路西法not
关注数: 127 粉丝数: 210 发帖数: 13,277 关注贴吧数: 541
如今的Intel为什么连AMD都打不过?arm架构有可能在未来取代x86成为PC平台的主流吗? Intel如今不仅错过移动和AI领域的机遇,在传统PC市场也被AMD吊打,因为amd可以随时从x86上跳车,而intel把自己的后路绑死了,现在x86的ipc都在gdc附近打转,花了5年也没有赶上初代Apple silicon。 另外amd那边似乎已经开始要从x86跳船的势头,从放弃给笔记本soc添加新架构核显转而给三星定制移动gpu架构,还有不积极响应跟进intel的avx10和apx,还有新传闻在zen7放弃更高带宽的ddr6内存不跟进客户端ai叙事,以及暗中推进的woa soc可以看出。毕竟用一个arm的公版架构就能吊打所有x86大核的ppa,还有什么做in house的x86的必要呢?不过amd自己就是让x86错过在向64bit迁移时更新isa设计的千古罪人,arm都可以做到一个架构同时支持v7和v8,你amd设计不出来? x86这艘船以后大概只有intel自己划了。 现在是网络时代,人们获取软件的途径极为便利,不再像 2、30 年前那样找个软件和挖金矿没啥区别,打开浏览器,搜索一下,甚至只需要 windows 内带的 copilot 问一下,各种解决方案就扑面而来,这对 x86 这种以兼容性作为主要卖点的 ISA 来说是非常致命的。 摆在 ARM 面前征服 PC 的主要难点在于缺乏严谨应用的支持,例如工作站应用等,在 Windows ARM 版方面,这是很大的问题,暂时无解,需要像 AMD、NVIDIA 等显卡厂商通力合作才能铺平这条道路。 但是另一方面,我们也的确看到有诸如 NVIDIA 联合MTK在准备插足 Windows ARM 的消息,所以我觉得一切皆有可能的可能性又大了几分。
为什么CPU架构几十年不动,显卡架构每年换? 如题 为什么CPU X86架构几十年不动,近几年来老有人想换arm架构 RiscV架构上的,但是显卡架构每年换? 都知道CPU有两大架构,X86和ARM,但你有没有想过显卡架构呢?有没有人告诉你,显卡的架构也是分门别类,打生打死的存在 英伟达有bw ada 安培,AMD有GCN CDNA RDNA 苹果有metal,底层配合apple GPU. 还有ARM的mali架构,intel的xe架构,你以为这只是名字不一样,错了,这就像CPU的X86核,him一样,是决定性能,效率,应用场景的大脑核心。 只是大多数人从来没意识到显卡其实也有价格战,架构战,只不过他藏得更深,更难懂,那为什么CPU几十年就俩架构,显卡却架构乱飞,五花八门,难道显卡就随便换架构不怕兼容炸吗? 我们今天就来掀开这个谜团,其实GPU架构和CPU架构本质上是同一种概念,都是设计一个计算器怎么工作,只是侧重点不同,CPU更像你办公室的经理,强调调度,逻辑判断,分值预测和异常处理,所以它的架构一旦定死。 我动不了,动一下,整个生态系统都得跟着重写,但GPU是干粗活的流水线工人,他负责把大量重复的图形,矩阵,像素操作以及高效率推进去跑,你甚至可以说GPU的架构就像并行吞吐型的CPU架构,它有自己的指令集,自主调度机制和执行核心,英伟达的ada的架构,比如,就在前台安培的基础上加入了Shader Execution Re ordering光栅缓存优化,更深度的融合 Tensor core。 这和X86的乱序执行演进本质是一个逻辑更强的预测,更聪明的调度,更极致的吞吐,而ARM从GCN演进到现在RDNA CDNA就是就是从SIMD矢量逻辑切换到Scalar标量逻辑,彻底把传统GPU思路拆了重建,提升吞吐效率,像ARM从冯诺依曼分离结构走向统一缓存那种飞跃。 更吊的是,这些架构有时候还能脱离CPU独立执行任务,比如英伟达,最新的GPU就支持硬件及视频编解码,AI推理,光线追踪全都自己完成,根本不走CPU,而苹果也搞了个全家桶,自研GPU,说是统一内存加统一架构,但其实把10年前手机SOC的那套搬到电脑上卖高价罢了,电话机小鬼天天吹M系列SoC显卡GPU架构牛逼。 可你真的去看apple GPU的架构文档会发现他就是改了点调度,堆了些小模块,外加用metal 4 API封了个壳,说白了metal4 apu就是个半残板vulkan1.4,更何况它的渲染管线结构跟NV ada安培相比,简直就像手动挡摩托比F1赛车,你要真跑专业任务,那些动不动几十G的模型或者图形编译,apple,GPU直接被吊起来打。 为什么苹果要这么干?因为他不追求顶级性,他追求的是控制权和利润率,说白了,苹果做GPU架构的核心目的不是吊打别人,而是把你锁进自己的生态里,回过头看,我们就能理解一个现象,GPU架构看起来很自由,其实它内部约束很强,只不过这种约束不是来自操作系统,而是,来自任务模型本身。 CPU执行的是通用程序,GPU执行的是统一格式的线程块,你换个架构,只要能把,试着照样吃下去,底层怎么变都行,所以GPU厂商就可以像乐高一样,每一代拼点新模块,拉高一点性能,驱动一更新就能兼容,而CPU你敢这么玩,整个软件世界都得陪你爆炸。 总结一句话,GPU架构百花齐放,不是因为它简单,而是因为它的任务够纯粹,CPU架构没法乱动,不是因为他落后,而是他背的包袱太多,两者根本不是谁先进谁落后的问题,而是你要干什么的问题,等你下一次听到某人吹某GPU资源架构多厉害,你可以淡定的告诉他,世界上没有任何一个GPU架构,没参考过图灵结构,也没有哪个GPU可以CPU生态独立成神。 将彻底搞懂GPU和CPU架构的关系,下一期我们直接对比NV的Tensor core架构和X86CPU的AVX512向量指令,侦探谁吞吐能力更暴力。
6000以上没人买安卓啊,要么苹果要么华为 锐评 “小米16”改名“小米17” 按照卢总的说法,是想和iPhone17同代同台竞技 卢总也称呼苹果为“伟大的对手” 但是吧,我觉得各家安卓都八斤八两,谁也别说谁 小米早期吃了营销红利,现在也是受到了流量反噬,貌似每次小米的操作,都会引发无尽的“嘲讽” 客观来说,其实不止小米,OPPO和VIVO等等也是模仿苹果的“熟面孔”。 OPPO Reno系列的直边中框、外方里圆的相机Deco,几乎是iPhone设计的“像素级复刻”。 还有就是默许“OPhone”的称呼流传;Find X8系列更是直接照搬iPhone的实体拍照按键,仿佛只要贴着苹果的设计模板走,就能蹭到高端的边。 VIVO也没闲着,X200s的直屏+金属中框组合,把“果味”焊在了机身里,系统层面还推出“原子岛”对标灵动岛,美其名曰“适配安卓用户习惯”。 实则是对苹果美化的劣质模仿,虽然后面“上岛 m”确实很好用,也很香。 不过,有意思的是苹果也开始偷偷“抄安卓的作业”。iOS 16的小组件、息屏显示,iOS 18的通话录音、AI消除,这些安卓用户用了好几年的功能,如今成了苹果发布会的“新亮点”。 说到底,手机圈的“互抄”早不是新鲜事:安卓厂商盯着苹果的设计和生态找对标,苹果盯着安卓的实用功能补短板,网上的争吵也不过是这种同质化竞争的情绪外泄。 但问题在于,模仿能当“敲门砖”,却成不了“垫脚石”。卢总说苹果是“伟大的对手”,可真正的“同台竞技”,从来不是靠改个数字、抄个设计就能实现的,当小米的澎湃OS能和iOS一样流畅再说话吧。 当OPPO、VIVO能拿出让苹果都要跟进的原创技术,那时候就不用像现在一样反复拉扯了。
6000以上没人买安卓啊,要么苹果要么华为 锐评“小米16”改名“小米17” 按照卢总的说法,是想和iPhone17同代同台竞技卢总也称呼苹果为“伟大的对手” 但是吧,我觉得各家安卓都八斤八两,谁也别说谁 小米早期吃了营销红利,现在也是受到了流量反噬,貌似每次小米的操作,都会引发无尽的“嘲讽” 客观来说,其实不止小米,OPPO和VIVO等等也是模仿苹果的“熟面孔”。 OPPO Reno系列的直边中框、外方里圆的相机Deco,几乎是iPhone设计的“像素级复刻”。 还有就是默许“OPhone”的称呼流传;Find X8系列更是直接照搬iPhone的实体拍照按键,仿佛只要贴着苹果的设计模板走,就能蹭到高端的边。 VIVO也没闲着,X200s的直屏+金属中框组合,把“果味”焊在了机身里,系统层面还推出“原子岛”对标灵动岛,美其名曰“适配安卓用户习惯”。 实则是对苹果美化的劣质模仿,虽然后面“上岛”确实很好用,也很香。 不过,有意思的是苹果也开始偷偷“抄安卓的作业”。iOS 16的小组件、息屏显示,iOS 18的通话录音、AI消除,这些安卓用户用了好几年的功能,如今成了苹果发布会的“新亮点”。 说到底,手机圈的“互抄”早不是新鲜事:安卓厂商盯着苹果的设计和生态找对标,苹果盯着安卓的实用功能补短板,网上的争吵也不过是这种同质化竞争的情绪外泄。 但问题在于,模仿能当“敲门砖”,却成不了“垫脚石”。卢总说苹果是“伟大的对手”,可真正的“同台竞技”,从来不是靠改个数字、抄个设计就能实现的,当小米的澎湃OS能和iOS一样流畅再说话吧。 当OPPO、VIVO能拿出让苹果都要跟进的原创技术,那时候就不用像现在一样反复拉扯了。
安卓系统本来就完全开源,真看不懂纯血鸿蒙有什么意义 1.安卓系统本来就是开源,连云代码都是完全来源的。连个人都可以随便使用,谷歌也根本卡不了脖子。最多卡你gms服务也就是(谷歌商场,谷歌地图,谷歌浏览器)可国内本来也不用这些东西阿。你再弄一个系统出来有什么意义呢? 2.我现在就vivo手机。现在橘子系统已经优化的非常好了,嘎嘎流畅。我去线下去摆弄纯血鸿蒙也没发现比橘子系统好在哪里。而且安卓现在经过国内厂调教,安卓和苹果都是强兼。我vivo和苹果传文件非常方便。纯血鸿蒙和苹果完全不通。和国内安卓也一般,非得自己玩有啥意义? 3.苹果系统当时能成功,是因为苹果定义了智能手机。功能和硬件远远超过当时的手机。你现在ios和安卓都非常成熟。你硬件落后好几代,软件系统照着苹果的方法,再做一遍这就行了? 4.现在软件厂商都要2套人马运营。压力就不小。你还要软件厂商再招人马分出第三套运营。这怎么可能承受的住。连腾讯这种巨无霸都焦头烂额,中小型软件商想都不要想了。很多大公司都是没有办法,做出来一个直接上架,然后功能缺失就摆烂了。你想卖到国外去,让国外厂商给你适配那可能吗?最后不又是自娱自乐? 反正实在想不通,安卓本来就不可能卡到脖子,你鸿蒙4.3继续优化下去。和橘子系统一样平稳发展就很好了,为啥非照这ios重头来一遍有啥意思。 况且你也没有跨时代的产品啊。你要能再次重新定义手机新鸿蒙。随便发新系统也是合理的。难怪现在有点卖不动了呢?😩
端侧AI成为智能手机“刚需”后,下一代芯片架构会如何演进? 在AI phone成为智能手机行业的下一个主流方向后,端侧AI成为了从“通信工具”向“智能体”迭代的关键底座。 简单来说,端侧AI就是指将AI模型与算力集成到智能手机本地(如NPU、CPU+GPU异构计算单元),实现数据的本地采集、处理与决策,而非依赖云端服务器。 其核心特征可概括为四点:低延迟(本地处理无需网络传输,响应速度达毫秒级)、高隐私(数据存储与计算均在设备端,杜绝泄露风险)、离线可用(无网络环境下仍能执行智能任务)、个性化(通过本地学习适应用户习惯,提供定制化服务)。 而作为整个智能手机芯片的最上游供应商——Arm,也开始将Arm架构的升级方向聚焦到端侧AI。目前全球99%的智能手机都采用Arm架构,基于Arm架构的芯片出货量迄今已累计超过3100亿颗。 Arm Unlocked AI技术峰会上海站期间,Arm推出了全新的Arm Lumex计算子系统(Compute Subsystem,CSS)平台。Arm方面称,这是一套专为旗舰级智能手机及下一代个人电脑加速其人工智能(AI)体验的计算平台。 搭载SME2技术的CPU,AI性能提升五倍 新的CPU架构中,Arm发布了搭载SME2(第二代可伸缩矩阵扩展技术)的Arm C1 CPU集群。 “SME2是SME的新一代版本。第一,它新增了更多指令集,可进一步提升性能和能效。第二,它支持更小的数据类型——具体而言是2 bit和4 bit。” Arm终端事业部产品管理副总裁James McNiven表示,随着每年高度量化模型的不断增多,这类小数据类型在移动生态系统中的重要性正日益凸显。这也是我们重点将SME2整合到Arm Lumex平台中的原因所在。 Arm C1 CPU集群为实际场景中的AI驱动型任务带来了显著的AI性能提升,包括:AI性能提升高达五倍,语音类工作负载延迟降低4.7倍,音频生成速度提升2.8倍。 此外,通过Arm、支付宝与vivo的三方合作下,将大语言模型(LLM)的交互响应时间缩短了多达40%,证明了SME2可为终端设备带来更快速的实时生成式AI体验。 除了速度的提升,在搭载SME2的单个核心上运行神经摄像头降噪功能,可以在1080P分辨率下实现帧率超120帧/秒 (fps),或在4K分辨率下实现帧率达30fps。这使得智能手机用户即使身处光线最暗的场景,也能捕捉到更锐利、清晰的图像。 “我想强调的是,由于SME2直接集成到了CPU当中,在工作负载的支持上能起到高度可扩展性。这意味着,SME2 带来的AI功能不仅能应用于4000元以上的高端手机,还能下沉到2000元等不同价位段的手机中,最大幅度地推广AI技术落地。”Arm高级副总裁兼终端事业部总经理Chris Bergey表示。 Mali GPU,让AI推理性能提升最高20% CPU之外,全新的Arm Mali G1-Ultra GPU则搭载了新一代光线追踪单元RTUv2。 与前一代Arm Immortalis-G925 GPU相比,Mali G1-Ultra的光线追踪性能提升高达两倍,并在主流图形基准测试中,性能表现提升20%。在AI方面,通过新的FP16矩阵计算路径,该GPU在AI与机器学习网络上的推理速度比 Immortalis-G925快20%。 在边缘计算方面,Mali G1-Ultra引入新的矩阵乘法单元(MMUL) FP16指令,可加速如语义分割、去噪、深度估计、物体检测、语音识别和图像增强等端侧关键AI工作负载。与上一代Immortalis-G925相比,其性能提升高达104%。 Arm提供的数据显示,目前搭载Arm GPU的芯片累计出货量突破120亿颗。 “AI已不再仅仅是一项技术功能,它已成为下一代移动与消费技术的支撑底座。依托Arm Lumex平台,我们持续提升端侧AI体验,以满足用户日益增长的需求与期待。” Arm高级副总裁兼终端事业部总经理Chris Bergey表示,从出货量角度来看,手机行业的增长已趋于平缓。但是,我们仍处于AI发展的初期阶段,尤其是在手机领域,AI正推动着更高的计算需求,并创造全新的价值。 此外,Chris Bergey还强调领先的手机厂商——无论是苹果还是三星——都已不同程度地朝着自研芯片的方向发展。这实际上是整个泛半导体行业所面临的趋势,Arm CSS平台正是顺应这一趋势而生。 “我们提供一个经过验证的计算基础,让客户能够以相对较低的成本实现自身所需的定制化。” Chris Bergey称,Arm CSS平台真正的价值并非是“做出比Arm工程师设计的更优秀的Arm CPU”,而是客户通过在 Arm 平台基础上构建自己的SoC,额外创造更大的商业价值。(本文首发于钛媒体APP,作者 | 饶翔宇 编辑 | 钟毅)
1 下一页