level 9
rockingbaby
楼主
跑70b模型每秒大概5tokens/s, 速度有些慢
换了32b模型推理速度能翻一番,10tokens/s左右,但至少比5080强,不会爆显存
M4pro 64G的满血配置,具体见截图左下角生成信息





2025年02月03日 08点02分
1
换了32b模型推理速度能翻一番,10tokens/s左右,但至少比5080强,不会爆显存
M4pro 64G的满血配置,具体见截图左下角生成信息





