超级大M3的个人资料

dev beta 2 + iPhone mirroring 目前体验小结： 1. 只要在同一个无线网就能用，距离也很长。这下在室内上下楼就不用带手机了。多台 mac 不会挤掉线，因为只有一台能用。 2. 窗口太小了，至少得扩大 25%-50% 才能用着舒服。 3. 能替代掉模拟器的功能，也可以为 Mac 省掉一部分资源，比如桌面端 QQ。 4. Mirroring 这块苹果鼠标比触控板自然。点 iPhone 的 home bar 就可以显示主界面，不过窗口上也有 home 和任务管理的按钮。 5. 输入法切换有些蛋疼，比如 emoji 在中间。 6. 直接拖拽现在完全不能用，贴吧发照片还是得从本地上传。 macOS dev beta 2 把壁纸卡壳的毛病修了，但不完全。

压缩这个圈子挺小的 7z/xz 算法 Igor Pavlov；zstd/lz4 Yann Collect；brotil 两个作者五个开发者，而这些就差不多是当下压缩先驱了。 x86 用户数量远高于 arm，以至于后者有个支持就不错。这么看 arm64 想要被深度优化还有很长一段时间了。这么看 SPEC17 选择 xz 也是没更佳候选了。

三级是吧。

【Suno AI 十三愤怒快乐曲】 IPC布鲁斯在想着为十三哥写一首战歌，想不出来词就随便生成了几首英文曲，结果爆笑我一年。这个词黑通黑果的能力简直可以薄纱十二级号 [Verse] Snapdragon's new processor Oh what a shame Can't keep up with Apple's game Slower and weaker It's a sorry tale Feels like a punch right in the gut Oh hell 晓龙新处理器哦，简直是个耻辱完全跟不上苹果的步伐又慢又菜鸡杯具的故事像是内脏被来了一拳我擦 [Verse 2] Snapdragon X Elite What went wrong? Apple's M4 came and sang a different song Instructions per cycle It's a sad sight Snapdragon's left in the dust Try as it might XE 处理器到底哪地方出错了 M4 一来高歌猛进，完全不同 IPC 完全是个悲剧好吗晓龙吃灰罢再试也没鬼用 [Chorus] Oh Snapdragon What happened to you? Apple's M4 It stole the show It's true But we still love you Oh Snapdragon X Just need a little more power To flex 哦晓龙你到底咋了苹果 M4 直接抢了你的舞台太真实了但我们仍然爱你啊晓龙 X 你就再强一点就能摆了 @NPacific @卧楼听松 @巴萨7号 @jht5132 @☜웃情自控유☞

黑了一通 arm64 的压缩，不如看看新压缩技术 7z，xz 等等一票主流压缩算法都是老东西了。新出的这几个潜力都很大。首当其冲是不要脸书的 Zstandard，可以算综合最平衡的压缩算法之一，速度快的同时压缩能力又比常见的 gzip 强的多。其压缩速度能轻易达到 1G 多，十几 G 的文件用几秒就可以压缩/解开。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fgithub.com%2Ffacebook%2Fzstd&urlrefer=bc2e9df781149a4eebc5f4530a525f2b 其次是 LZ4，这个主打一个傻快，能轻易撞瓶颈的东西。当初 open benchmarking 选了一个不太能压缩的 iso 文件，我单核跑出了 22GB/s…… 之前说苹果，其实苹果也有个自己开发的 Apple Archive（LZFSE）。这个跟 Zstandard 很类似，但是目前发展的不如后者吧。设计初衷也有为了能耗比优化，但是这东西往往是越快的能耗越低。不过有一个优点就是可以用多线程解压缩，zstd 目前还不能。 ZSTD 压缩上 M3 Max 很能打，能到吊着 139K，略胜 7950X 的程度。速度仅次于 X3D，说明这个算法能撞到缓存瓶颈。当然解压缩还是一样的菜了。

都在发苹果 CPU 逆天，我当一次“黑粉”想谈谈一个死穴压缩（十三等人可尽情享受这枚炮弹）跑主流 LZMA 算法，M 系都很菜鸡，而且能菜到不如两代前的 x86。 557xz 和 7z -b，M1U/M3M 不如 129K，那 M2U 估计也不会强多少。M3U 没出所以谁也不知道，但看几代表现肯定也不会太好看。 7z 对超线程优化很好，IPC 也不高，未必是 M 系的菜，所以我琢磨是不是新出的压缩算法（LZ4，ZST 和苹果自己的 LZFSE）就好很多。 Open benchmarking 上有较全面的记载，而且跑测试也相对简单。不能跑或者跑很差的，看一遍脚本自己跑也没问题。结果 LZ4 也不行。ZST 压缩是猛一些，用 silesia 测试包，各级压缩最理想*状况能超越桌面旗舰，仅次于 X3D；解压缩依旧是菜鸡。压缩像是有缓存瓶颈，不过 zst 的解压缩是单线程的，那就没什么可说的了。我有几种猜测： 1. 可能真就是菜鸡，并且没人关心文件压缩的性能了。 2. 真就是优化的问题。7z（LZMA）肯定不适合，我也就不纠结了。新出的算法要对 arm64 这大杂烩全负责，就不能面面俱到（开发者原话）。 *. 苹果上 7z 和 zst 给比 CPU 更高的线程数就会有挺大的性能提升，理想情况下这个情况不应该出现？如果真是优化的锅，那苹果自己的 LZFSE 就有存在价值了。但是目前自家算法还是不如 zst，唯一优势在于可以多核解压缩。 3. 或者苹果的架构在这有点偏科，强的强，弱的弱。但是强的不太强，弱的是真弱，总分一出来就显得拉。

算法推荐把我笑抽了刷贴吧偶然看到的。贵英吧截图，我删一下 ID。这年头做 i 炮还真得学会罔顾事实。先不说默认就缩肛爆炸了，稍微超一点就爆炸还都是你们的错，那你卖 K 干嘛啊话说 KS 默认电压都要 1.5 了，这不爆炸那才怪。顺便发一下贵英股票图，再岁月静好几年，回去给别的企业当打工仔罢。反正也就这么混上来的嘛。

iPad Pro 更新前期的一点见解油管有个 Rene Ritchie，前几年对这个事有过分析，有兴趣可以看。简单说，iPadOS 不是不可以复杂，而是不能复杂。iPad 设计初衷就是“傻快”，即操作比 PC 更简单，所有人都可以上手即用。 Pro 无非就是提高性能配置的版本。让不是“电脑大师”的人做“电脑大师”的活。但随着 iPad 发展壮大，又吸引了一批相对小众但声势浩大的老 PC 用户，这群人会看着 iPad Pro 的性能觉得软件浪费硬件。但要讨好这群用户又是自挂行为。失去存粹性这个卖点不说，君不见那个叫好不叫座的苏菲平板？更何况还有个 MBA 在，有了更专业的个人电脑为啥还要准专业的平板？其实苹果内部也比较分化，也是两种声音。iPadOS 也就成了这种两头不讨好的局面。

20TB 3.5 寸 SATA SSD，小众产品值不值一直好奇为毛没人做 3.5，可能没需求。这回头一次见。容量 20TB，但是走的 SATA 3。感觉定位是跟 NAS 硬盘差不多，但是 SATA3 的速度用来跑程序和游戏也该足够了。厂商 Planet Computers，就是现在还在做键盘 PDA 的小众作坊。 http://tieba.baidu.com/mo/q/checkurl?url=https%3A%2F%2Fstore.planetcom.co.uk%2Fproducts%2Fstardisk20-3-5-solid-sate-disk%3Fpr_prod_strat%3Dcollection_fallback%26pr_rec_id%3D1b73742f5%26pr_rec_pid%3D8929266008358%26pr_ref_pid%3D3878141526110%26pr_seq%3Duniform&urlrefer=b89e5d56fac08df0555abe45d476a439

多核瓶颈（M3 Max 半年有感）很多人也没概念。简单解释，CPU 多核相当于 1n 而不是 1/n。这不像其它单输出多个核心部件的机械，每一个“核心”都是八分之一，综合 100%。多核就是多个 CPU，每一个都是能输出的整体。所谓“并行”就相当于同时运行 n 个独立的进程，把一个大项目分成若干个毫不相干的小项目，每一段互不干扰。但问题是有些计算就必须得是序列的，前一个结果是下一个输入，不能独立。这样其余核心就成了摆设。所以给多核优化很难，有时甚至不可能。霸王硬上弓的话，恐怕还没单线程的算法快。按 502GCC 和我个人编译 marlin 固件的速度看 M3 Max 怎么也得比 M1 强三倍，但是 3D 打印切片时必须要前后衔接，所以切我这个模型最快也就只有 55%。这也就是高端 CPU 的尴尬，取决于你干什么，实际上效益递减很明显。三倍系统未必就永远三倍快。而两台系统里选，如果更快的效益递减到一定程度，其它部分就成了决定性优势。

M3 Max 编译 linux 内核只有 i5-12400 的水平倒不意味着 x86 设计多好，反倒说明它这个生态优势死活绕不开。这个没有十几年累积还是追不上。毕竟 SPEC17 下的编译结果是完全相反。这么一来，十三弟的精英叉叉得更是一坨

现在想真正了解 M 系性能似乎没那么容易。最近拿 M3 Max 跑了下 linux 内核编译。defconfig 硬干出了 12400 的水平，allmodconfig 距离 7900 差了 20%。这个成绩跟 SPEC17 跑出来的天差地别，502_GCC 里 M3 Max 能高出旗舰 1/4。反正确实让我感受到了 x86 不可撼动性，不过这纯是靠性能以外的东西撑起来的。毕竟三四十年也只有它这么一个选择，ARM 这一头到 M 系以前都是菜鸡，而百花齐放的结果就意味着不可能做针对性优化。而看起来真能发挥苹果芯片性能的场景，目前只能算刚有成色。所以真实性能怎么样，不知道，应该接近 SPEC17 的表现？但是实际使用上完全倒着来。

我可以借 M1 对比 9300 的 SPEC17 成绩 M1 Air，7GPU 9300 可以用任意方式刷 Linux，魔改散热一跑定胜负，应该没啥不服了吧？手机能准确测性能的东西还是太少。

先别下多核 x86 一定比苹果强的结论了 M3 Max，SPEC17 里子项有四个能压 x86 台式旗舰。总分确实是不如。剩下的问题就是现在能利用到苹果 CPU 优势的程序还是不多。比如 SPEC17 的 xz，可以拿 7z 的成绩说事。 LZMA 的 IPC 不高，但强调延迟会对分支预测的惩罚。多核还得加一个吃线程的特性。苹果宽发射的优势基本利用不到，延迟吃亏，频率还不高。那这块能跑得过 x86 才见了鬼。然而你换成 gb6 用的 LZ4 就是另一个景象：一级单线程压缩 M3 Max 能压过 x86 一倍左右，九级解压缩还能有 30% 的优势。因为 LZ4 能更好发挥带宽优势。分不只是看一个总分就完了，还得往下深究架构的优劣之处。所以简单一句薄纱其实没法反映现实情况。想攒点钱弄个 AM5 对比一下，看想不想花吧。

苹果个人电脑 CPU 所处的位置早上零下再去刷一下单核，同时试试多核。不过再怎么刷，趋势应该是比较明显了。再结合看过的所有评测跑分来分析一下：跟自家比，M3 Max 在十六核规模内的表现应该最好。绝大部分程序的优化用不完，这样轻松拿下九成的程序。绝对性能就有点复杂。拿 M1 Ultra 对比，优势应该是更倾向于纯计算。拿苹果最擅长的访存高并行怕还是差了一些。毕竟 M3 Max 的带宽毫无提升，还差了四个大核。不过两个优劣区别都不大吧。对 x86，笔记本的 HX 就算能全开应该没啥可说的，另一方面 M3 Ultra靠绝对的规模也能力压旗舰一个档。咱不如直接一步到位，拿旗舰跟着 M2U 以内的比。苹果处理器最大的特长应该集中在高访存，大带宽，高并行。对这三个需求越高的就越是苹果的优势场，对这些没需求的那还是看主频和线程。 xcode 编译/ cinebench 和 SPEC17 （尤其 502 编译和 505 跑大客）应该就能很好展现这点。后者苹果可以下克上，前者 M2U 被吊着打。当然要把能耗比加进来考虑，那也没什么可说的了。谈实用，intel 的大小核特性也得拖沓，16 核内的程序未必就真能比 M 系更灵敏，不过也是看干什么吧。不过这么一看苹果同定位的 CPU 好像比 x86 更适合做服务器

论实用 M3M 背刺 M2U，论绝对性能 M3M 又被双面夹击 RT 明天我会去后院看看节电模式下的 spec 性能，目前为止分刷不上去，让我担心我很可能是踩了雷不过我担心的事还是发生了。M3 Max 在极客湾的一系列测试都超越了 M1 Ultra，但换回更权威严谨的 SPEC 就变得……很难说吧。以我目前的多核 rate 来看，M3 Max 唯一能跑过 Ultra 的就只有 perl（加了一分）和极高的 exchange2，唯独靠这两项才能干翻跑分小王子的 M1 Ultra。当然也许只有 howl 才能战胜 howl，我比的不是一赛道，分数也上不去。另外小王子没有跑 502.gcc，没法横向对比。拿极客湾的 xcode 编译来看，m3 max 是要优于 ultra，只不过这个编译测试里苹果各系处理器都是被 139K 的黑苹果吊着打，里面跑的什么名堂我是看不懂了。跑分这东西看了糟心，不看了又闹心。

正好我有一 AI 生成的玛丽苏公主求修衣服或者补全下半身

请问大佬，SPEC17 该怎么刷首先说下 M3 Max 目前 x264 单核。Howl 大佬 25.8，我 24。算一下能差了7%。我的多核 304，这个水平是比大佬 gcc11 下的 M1 Ultra 还要差，他是 312。我琢磨要是有 7% 的提升那就往 320+ 奔去了。后台能退的我都退了，所以暂时想不出怎么还能往高了跑。求帮助。另一面跑 x264 要 64.5W 的能耗，单核心 6W。压力远高于 cb2024。

算知道贵英拿 MTL 对 M3 的底气哪来的了 RT，刚看了三台 mtl 本子，两台（华硕和 MSI），155H，32G 5X/1T 可以卖到 1300 美元，相比之下，同储存丐版 M3P 直接翻倍。 M3P 14” Pro 的确能力压 MTL 一头，有部分配置能高出许多（这还不提让嘤粉们喜闻乐见的 PL2 设置）。贵一些到没啥，最后还是这镀金储存芯片的锅。但要是谈 M2/M3 的 Air 那情况就不太一样了。24G/1T 的价格 2100 美元，配置上的确压不了。性能，储存强不了，屏幕得看怎么比，最多能勉强算各有千秋吧。Air 在这最大优势还是续航，零噪和体积。所以贵英 PPT 对 M3，有底气不足的原因，估计也是销售团队想到了可以玩价格战。反正 M3 跟我的产品一个定价，那性价比上来说是可以力压，毕竟瘦死的骆驼也比马大。所以苹果这储存定价真得改一改了。

发现一铁律凡是那些不敢承认自己是某牌铁杆粉的，干的事基本比任何粉都要铁杆为啥？ 1. 知道铁杆粉往往偏激，而“理中客”显得像是在公平论事（迫真） 2. 这样就能忽悠自己是真在就事论事结果也总一个德行：得罪路人粉，被集体暴打。兄弟们以后见到“不是铁杆粉”，记住这跟“史上最大突破”一样诚实潇洒。

试图推进 M3 Max 16“ Pro 的散热极限昨天晚上刚产生一个想法，既然 wle 测不准，为何不用 AI 跑图来看看实际能撑到哪。于是在不纯净的环境下跑了遍 SD + cb。发现两个单元距离 105 都有距离，CPU 在 80-85 区间，GPU 没超过 86。 PKG 峰值 60W，CPU 平均接近 20W，GPU 35-40W。后台一堆程序，但就是想看看还能不能流畅的用。下边发图，欢迎批评。

我去了刚买四周的 5700 大 M3 MBP又进了个虫子死屏幕里了，我特么才买四周，哎 M1 那虫子是我自己的锅，按死了。特么大 M3 怎么就死里边了？话说这屏幕贴合缝隙怎么这么大？ 🤦