level 6
A770 (之前的版本没测过)6458~8331横跨两个大版本的显存分配问题,开游戏时加载模型将显存拉高,之后关闭游戏卸载模型,之后再加载模型会发现有一部分会跑到共享gpu显存,哪怕专用CPU显存未满
2025年12月20日 11点12分
1
level 6
降级了LM-Studio到16版依旧能复现这个问题
2025年12月20日 11点12分
4
level 1
你是不是上下文的长度设置太多了?我一般用Qwen3-vl-8B-thinking的Q8的gguf版本,上下文设置47768,共享内存也就0.1,速度基本不影响。
2026年01月06日 05点01分
6
这个bug只和显存占用有关,我同样的模型,同样的参数,重启电脑就可以完全加载进专用gpu内存,而不是到达一个限制之后,直接强制被加载到共享显存
2026年01月06日 06点01分