有沙口我不说 watcher4396
高通吧管理都是酪蚕-÷
关注数: 25 粉丝数: 44 发帖数: 3,900 关注贴吧数: 4
讨论讨论adreno的未来 目前a740规格已经板上钉钉了,规格+50%,来到768alu x3,也就是等效1536sp,传8g2上的a740频率为680(有说740),wl说性能为210,8cx g4也使用a740,不过频率会提升很多,传频率为1.2g。 那么再往后呢,规格的提升需要跟着制程提升和带宽提升走,不能随意增加,并且会降低最低频的能效。 高通很早就调整了alu的比例,继续fp32翻倍提升会非常小,能效甚至会较大幅度倒退,这条线是走不通的。 同时单sp ipc对于高通这种sp规格来说也到了高原期了,想要提升代价不如增加规模了。 那么应该怎么提升呢,我先举两个例子: 1.pascal和maxwell maxwell到pascal的提升堪称奇迹,cuda规模甚至同级没有特别大的提升,除了有制程的跃升,架构ipc的提升外,还有一个不容忽视的点,频率的大幅提升,maxwell显卡的基本盘(小超)在1.3—1.4g,pascal则来到了1.9—2g,40%的频率差距,甚至功耗还更低 2.rdna1和rdna2 以57xt和67xt为例,都是2560sp,制程也都为n7系列hp库(密度接近,但是晶体管数量navi22提升70%,面积差距不小),抛开上面不谈,并且rdna2由于架构的改进,甚至同频ipc还要略低一点,但是navi10的频率基本盘只有2—2.1g,navi22自动boost便能来到接近2.6g,制程没有什么提升,频率提升30%以上的同时,功耗甚至还下降了,前者要225—250w,后者只要200w 讲了这么多,再回过头来看睾通的adreno,从adreno430开始,有没有发现最适的工作频率永远保持在470—670这个区间里,尽管制程在不断进步,架构的“性能甜蜜点”基本没有变化,友商苹果很早就保证了800mhz就能保持的惊人能效,峰值频率就算冲到了1.4g(m2)能耗依然在可接受的范围内,而以a730为例不说做到1.4g,做到1.2g,就需要至少13w(这还是估少了,提升33%频只提升了60%的功耗,高通的性能功率线早就脱离这种缓坡了)而M1 同样规模,1.278g也不过10—11w,甚至架构ipc还要高一点。 所以,个人观点:高通未来的提升方向只要着力于架构频率的提升,就有非常大的升级空间,只需要把频率/功耗做到苹果等级,靠着现在更高的同规模面积效率,就能在全频率对抗苹果。
从rdna3看mcm小芯片时代的新思路 在制程逐渐走向瓶颈的现在,mcm封装技术成为了未来性能大幅提升到必由之路 插播一下:tsmc在今年制程大会上提出了后续提供新2.5d cowos的服务,为高性能mcm和hbm内存堆栈提供帮助。 目前我们能看到的在市售或者已经有介绍的mcm芯片大致有如下图几种情况: MTL就是把原本的cpu的几块部分拆分成小芯片,通过foveros 3d封装在一起,是最循规蹈矩的方法。 M1u则是直接把两块完整的soc通过互联接口用高速“胶水”互联,简单粗暴。 intel的p什么玩意,就是那个hpc,则是单纯的炫技,没有什么实用性。 rdna3架构为我们提供了新的角度:内存(显存)控制器可不可以不在io上? 长久以来,ic市场的ram控制都是以UMC为主导,强调内存控制的整体性,随着带宽需求的膨胀,除了永远128bit的x86 pc,位宽整体呈现膨胀的趋势,苹果M1系列128/256/512bit就是最好的证明。膨胀的内存控制器占用了不小的面积,512bit的pny甚至面积要超过一般的入门级soc。 rdna3采用gcd和mcd分装的方式,gcd是纯粹的计算单元,mcd中包含32bitx2的gddr6 pny和高达64M的高速三级缓存,说sram也对。因为ram的层级是从ram到可能有的sram,到总线上的L3或者L2的缓存池,再进入到核心前端,实际上只要总线能高速访问ram,内存性能并不会受到明显影响(如zen架构,用的chiplet,虽然有一丢丢延迟和性能影响,但是得益于大缓存的帮助,总体表现很不错)而MCD模式还有自带的高速缓存,只需要io和高速缓存通过硅互联高效连接,内存效能得益于高速缓存还会有大幅度提高。 MCD是一个相当高明的设计,减轻io的面积压力,也能通过额外的缓存提升ram性能,尤其是延迟不敏感的gpu性能,在后续的mcm soc设计里完全可以把pny和slc扣出来做成独立tile,甚至还能再贴个基带,还能连接cmos给cmos提供高速缓存从而提升摄影和拍照效果,是一个具有优越性的方向
手机等便携移动端的硬件光追到底有没有用? arm新发了g715构架 其中10—16cu的被归入新系列immortalis 拥有硬件光追单元RTU,号称性能提升三倍。不少吧友分享了这个信息,也看到了很多吧友的留言怀疑其实用性。这里就来掰扯掰扯,手机平板芯片的硬件光追到底有没有用 诚然,移动端gpu,区区二级光追(可能只有1.5级),加上较小的规模,低功耗,物理性能也不算高等等debuff,它的光追性能是相当孱弱的。想要以全局反射的“真”光追,进行720—1080p 30帧高质量光追游戏都是相当困难的事情。 但是光线追踪不仅仅是在现在大作上呈现的那样,通过设置光源来进行真实反射。ray tracing也是渲染的手段,比如经典跑分软件cinebench 就是通过cpu来解算光线追踪进行渲染,渲染的成品二维图获得了非常高的质感和真实感。这里就能引入一个概念,混合渲染。 渲染方式目前大体有三种,光栅化 计算着色器 光线追踪着色器。将光栅化和RT相结合,便得到了一种混合方式 oppo在去年“发布”的光追,便是通过这种方式实现的,被“追踪”的光线并不是依据点光源进行的空间遍历,而是光栅渲染的3d图形的材质和阴影。把材质和阴影通过光追的质量呈现出来,从而以较低的光栅需求获得高精度的材质和阴影表现。这就是手机端光追的意义。 在此之外 RT的应用也不止于游戏,光追能让AR增强现实的呈现和手机滤镜拍摄更加真实,当然这块Android厂商就纯飞舞了,和arm没关系啦。 总的来讲,随着发哥设备的部署,和可以预见的苹果 高通(三星已经rdna2😄)逐步部署硬件光追还有目前主流soc已经支持软件光追。一个属于低功耗光追的生态会逐步建立起来 未来可期
1 下一页