出图特别慢，换什么配置，求解 - stablediffusion吧

level 7

泥巴纯种楼主

大佬们好，之前SDwebui出图秒出，自从用了comfyUI，特别特别慢，出一张图目测需要3分钟,用的work- fisher的工作流，用的qwen-aio-v18大模型，大家帮我看看，显卡不够我换显卡，内存不够我换内存，这是在时间太长了，目前用的虚拟内存跑的，帮我看看，我好换电脑，谢谢🙏

2026年01月04日 10点01分 1

level 7

泥巴纯种楼主

不用虚拟内存，加内存条会好一点么

2026年01月04日 10点01分 2

森林火焱🔥

插个楼，你这个贴，会燃起硬件党的热情。

2026年01月05日 00点01分

level 10

K◎nBai

模型都不一样，不能对比，你这是千问模型。硬件消耗本来就更大

2026年01月04日 10点01分 3

泥巴纯种

是呀，我也不知道我为啥要用这个模型，我就说要做真人涩涩NSFW图，吧友就推荐这个模型给我了

2026年01月04日 10点01分

泥巴纯种

即便如此，3分钟正常么？不太正常吧，太慢了感觉

2026年01月04日 10点01分

nanpar

换模型，Z-image解决你的问题

2026年01月05日 00点01分

level 7

泥巴纯种楼主

来人来人，我要换电脑

2026年01月04日 10点01分 4

贴吧用户_GD6KQUZ

上5090

2026年01月04日 17点01分

level 7

泥巴纯种楼主

不知道为啥，现在又变成1分钟左右了

2026年01月04日 11点01分 6

洛夫·克劳夫特

你可能跑在爆显存的边界上了，这次是将将没有爆显存所以快，你之前可能是还开了其他什么东西你的显存就爆了，跑在内存里就慢了

2026年01月05日 08点01分

level 8

五月十二日那天

直接5090不就好了吗，还问啥问

2026年01月04日 13点01分 8

チンハン

@泥巴纯种没啥好卡了，有钱可以一步到位花9千多换32G的4080s，再往上就是4090了 [滑稽]

2026年01月04日 14点01分

泥巴纯种

问的是最低的配置嘛，5090得买得起才行嘛，要不我直接换100W电脑，我还问啥...话糙理不糙 [滑稽]

2026年01月04日 13点01分

泥巴纯种

尽量还是希望便宜点的东西，所以来问最低~中等配置

2026年01月04日 13点01分

level 8

AAA保登面包心师傅

内存太小+显存太低+没开启块交换

2026年01月04日 15点01分 9

level 6

贴吧用户_GZXV2VZ

Qwen 大模型都是非常吃显存+cuda的模型你显卡不好当然跑不动。

2026年01月04日 15点01分 10

level 5

Dr.MMG

这配置别用qwen。用z- image

2026年01月04日 15点01分 11

-龙脉常歌-

楼主上个帖子就是用zimage用不好才换qwen，你又给人家打回去了 [笑眼]

2026年01月04日 19点01分

_冰華

这配置qwen包没问题的。我那台4070+64都照样冲

2026年01月04日 19点01分

我爱小黄鱼

用qwen可以用GGUF的，Q4版本。容量小很多

2026年01月04日 23点01分

Dr.MMG

@-龙脉常歌- 哦

2026年01月04日 23点01分

level 1

_冰華

今天刚测，2060s 8G 千问2512 fp8 8步也就2分出头。

2026年01月04日 19点01分 12

level 8

我爱小黄鱼

你看看你下的模型容量多大？如果它有30个G那你这就是爆内存了。你内存只有32GB，除去系统必须占用的一部分，你只有不到30GB的使用空间，那么你加载到内存中的数据如果超过30GB，绝对会爆。不光是模型，还有clip ，vae， lora，如果用了图像反推，图像控制，还会加载更多数据。

2026年01月04日 23点01分 13

level 5

薛定😺的谔

爆内存了吧。看看窗口信息有没有完整加载

2026年01月04日 23点01分 14

level 8

索尔古德曼

这个配置跑千问fp8没问题，速度也应该可以接受，加速lora加入进去，二三十秒一张没问题。如果还觉得慢，换模型，不要用qwen-image和flux模型。

2026年01月05日 01点01分 15

泥巴纯种

加速lora叫什么名字，在哪下载的 [花心]

2026年01月05日 02点01分

level 1

lishita

qwen-aio-v18大模型28.4G，你显存才12G，这种情况你用老版webui会因为爆显存直接报错，跑都跑不起来，还秒出？？？
ComfyUI使用的块交换技术，允许先把所有模型加载到内存中，推理时用到哪个块就加载哪个块到显存中推理，推理完卸载这个块，再加载下一步推理用到的块，这使你能跑比显存大的模型，但是因为要和内存频繁交换数据且内存速度大大低于显存，推理速度会比完全加载慢。
要提高推理速度，有两个方案，一是花钱升级显卡，显卡显存大于模型，模型就能完全加载。qwen-aio-v18用的是FP8精度的unet，19G，你显存至少要20G。内存要加载所有模型，加上操作系统和后台应用占用的，还有ComfyUI和其它节点占用的，最好是有48G。
另一个方案是换量化版的模型，抱脸上搜索Qwen-Image-Edit-Rapid-AIO-GGUF可以找到别的作者量化好的模型，
12G显存可以用Q4的，会牺牲出图质量。Q3的虽然更小，但是质量更差。

2026年01月05日 01点01分 16

lishita

另外qwen系的模型推理速度天生就慢，同样步数下慢于Z-Image是正常的，这也是Z-Image被称为人民的模型的原因，因为它更小巧更高效无需太高配置更亲民。

2026年01月05日 01点01分

lishita

最后联系下你的需求，其实不推荐为了跑qwen去升级硬件，因为qwen-aio是融合模型，融合的也就是社区训练了的那些Lora，NSFW能力也就那样，并不能创造奇迹，它的价值在于是个编辑模型，可以对照片里的角色做这样那样奇怪的改变，所以满足一部分老蛇皮的需求，你如果也是这种需求，那可以继续深入。

2026年01月05日 01点01分

lishita

如果你的需求是文生图画两个真实系的人真刀真枪的肉搏，并不要求他们是现实中存在名人，那用qwen就有点南辕北辙，因为实现起来可能会很麻烦。这种需求可以考虑两个方向，倾向自然语言写提示词的可以考虑Chroma，Chroma唯一的劣势是社区生态不太好，风格比较少，花样也少。

2026年01月05日 01点01分

lishita

倾向于标签式提示词的可以考虑pony和Illustrious系列模型，社区真实系的微调模型非常多，Lora也够多，可以玩出非常多的花样。而且配置要求不高，在Z-Image生态完善起来之前，是目前当之无愧的最强。

2026年01月05日 01点01分

level 7

夸张哥哥👀

显卡和内存都不够

2026年01月05日 02点01分 17