level 10
      
	  rockingbaby
	  
	  楼主
	  
	
	
	  跑70b模型每秒大概5tokens/s, 速度有些慢
换了32b模型推理速度能翻一番,10tokens/s左右,但至少比5080强,不会爆显存
M4pro 64G的满血配置,具体见截图左下角生成信息





	
	2025年02月03日 08点02分
	1
	
      换了32b模型推理速度能翻一番,10tokens/s左右,但至少比5080强,不会爆显存
M4pro 64G的满血配置,具体见截图左下角生成信息




