@yuyu68156698 :我又去看了下Intel核显开发手册,发现算错了,EU单元一个周期可以完成4元素或8元素矢量,那么我就太低估Intel核心显卡了
HD4000(16个EU,1350MHz):那么16*8*2FLOPS/MHz*1150MHz=294Gflops
GT650m(384sp 745MHz):384*2*745=570Gflops
GT3要达到650m水平至少要600Gflops左右,按照40EU,1000MHz算,有640Gflops,如果要考虑架构效率问题,还要更高才行啊。。。
![[汗]](/static/emoticons/u6c57.png)
以前把EU算错了,低估了EU高估了架构哎
