出图特别慢,换什么配置,求解
stablediffusion吧
全部回复
仅看楼主
level 7
泥巴纯种 楼主
[汗]大佬们好,之前SDwebui出图秒出,自从用了comfyUI,特别特别慢,出一张图目测需要3分钟,用的work- fisher的工作流,用的qwen-aio-v18大模型,大家帮我看看,显卡不够我换显卡,内存不够我换内存,这是在时间太长了,目前用的虚拟内存跑的,帮我看看,我好换电脑,谢谢🙏
2026年01月04日 10点01分 1
level 7
泥巴纯种 楼主
[汗]不用虚拟内存,加内存条会好一点么
2026年01月04日 10点01分 2
插个楼,你这个贴,会燃起硬件党的热情。
2026年01月05日 00点01分
level 10
[汗] 模型都 不一样,不能对比,你这是千问模型。硬件消耗本来就更大
2026年01月04日 10点01分 3
[汗]是呀,我也不知道我为啥要用这个模型,我就说要做真人涩涩NSFW图,吧友就推荐这个模型给我了
2026年01月04日 10点01分
[汗]即便如此,3分钟正常么?不太正常吧,太慢了感觉
2026年01月04日 10点01分
换模型,Z-image解决你的问题
2026年01月05日 00点01分
level 7
泥巴纯种 楼主
[你懂的]来人来人,我要换电脑
2026年01月04日 10点01分 4
上5090[滑稽]
2026年01月04日 17点01分
level 7
泥巴纯种 楼主
[汗]不知道为啥,现在又变成1分钟左右了
2026年01月04日 11点01分 6
你可能跑在爆显存的边界上了,这次是将将没有爆显存所以快,你之前可能是还开了其他什么东西你的显存就爆了,跑在内存里就慢了
2026年01月05日 08点01分
level 6
这配置除了视频外已经是全胜任了
6W块的专业卡可以10秒出图
尽量保持在显存跑
实在不行爆显存内存顶上也就慢3倍
不会影响出图质量
物理内存都爆了
就1小时起步建议取消任务
连续出图会省下加载大模型的时间
2026年01月04日 12点01分 7
[啊]啊,是这样么,那看来暂时我不用换了,谢谢大佬,我用的虚拟内存,现在大概1分左右生图,就那个WORK-FISHER的工作流,用的QWEN,1分钟正常么请问
2026年01月04日 12点01分
生图报错,说内存不够,所以用的虚拟内存,不知道为啥不够
2026年01月04日 13点01分
@泥巴纯种 很快了,我的7700出1000*1500要2分钟
2026年01月04日 18点01分
level 8
直接5090不就好了吗,还问啥问
2026年01月04日 13点01分 8
@泥巴纯种 没啥好卡了,有钱可以一步到位花9千多换32G的4080s,再往上就是4090了[滑稽][滑稽]
2026年01月04日 14点01分
[汗]问的是最低的配置嘛,5090得买得起才行嘛,要不我直接换100W电脑,我还问啥...话糙理不糙[滑稽]
2026年01月04日 13点01分
[滑稽]尽量还是希望便宜点的东西,所以来问最低~中等配置
2026年01月04日 13点01分
level 8
内存太小+显存太低+没开启块交换
2026年01月04日 15点01分 9
level 6
Qwen 大模型都是非常吃显存+cuda的模型你显卡不好当然跑不动。
2026年01月04日 15点01分 10
level 5
这配置别用qwen。用z- image
2026年01月04日 15点01分 11
楼主上个帖子就是用zimage用不好才换qwen,你又给人家打回去了[笑眼]
2026年01月04日 19点01分
这配置qwen包没问题的。我那台4070+64都照样冲
2026年01月04日 19点01分
用qwen可以用GGUF的,Q4版本。容量小很多
2026年01月04日 23点01分
2026年01月04日 23点01分
level 1
今天刚测,2060s 8G 千问2512 fp8 8步也就2分出头。
2026年01月04日 19点01分 12
level 8
你看看你下的模型容量多大?如果它有30个G那你这就是爆内存了。你内存只有32GB,除去系统必须占用的一部分,你只有不到30GB的使用空间,那么你加载到内存中的数据如果超过30GB,绝对会爆。不光是模型,还有clip ,vae, lora,如果用了图像反推,图像控制,还会加载更多数据。
2026年01月04日 23点01分 13
level 5
爆内存了吧。看看窗口信息有没有完整加载
2026年01月04日 23点01分 14
level 8
这个配置跑千问fp8没问题,速度也应该可以接受,加速lora加入进去,二三十秒一张没问题。如果还觉得慢,换模型,不要用qwen-image和flux模型。
2026年01月05日 01点01分 15
加速lora叫什么名字,在哪下载的[花心]
2026年01月05日 02点01分
level 1
qwen-aio-v18大模型28.4G,你显存才12G,这种情况你用老版webui会因为爆显存直接报错,跑都跑不起来,还秒出???
ComfyUI使用的块交换技术,允许先把所有模型加载到内存中,推理时用到哪个块就加载哪个块到显存中推理,推理完卸载这个块,再加载下一步推理用到的块,这使你能跑比显存大的模型,但是因为要和内存频繁交换数据且内存速度大大低于显存,推理速度会比完全加载慢。
要提高推理速度,有两个方案,一是花钱升级显卡,显卡显存大于模型,模型就能完全加载。qwen-aio-v18用的是FP8精度的unet,19G,你显存至少要20G。内存要加载所有模型,加上操作系统和后台应用占用的,还有ComfyUI和其它节点占用的,最好是有48G。
另一个方案是换量化版的模型,抱脸上搜索Qwen-Image-Edit-Rapid-AIO-GGUF可以找到别的作者量化好的模型,
12G显存可以用Q4的,会牺牲出图质量。Q3的虽然更小,但是质量更差。
2026年01月05日 01点01分 16
另外qwen系的模型推理速度天生就慢,同样步数下慢于Z-Image是正常的,这也是Z-Image被称为人民的模型的原因,因为它更小巧更高效无需太高配置更亲民。
2026年01月05日 01点01分
最后联系下你的需求,其实不推荐为了跑qwen去升级硬件,因为qwen-aio是融合模型,融合的也就是社区训练了的那些Lora,NSFW能力也就那样,并不能创造奇迹,它的价值在于是个编辑模型,可以对照片里的角色做这样那样奇怪的改变,所以满足一部分老蛇皮的需求,你如果也是这种需求,那可以继续深入。
2026年01月05日 01点01分
如果你的需求是文生图画两个真实系的人真刀真枪的肉搏,并不要求他们是现实中存在名人,那用qwen就有点南辕北辙,因为实现起来可能会很麻烦。这种需求可以考虑两个方向,倾向自然语言写提示词的可以考虑Chroma,Chroma唯一的劣势是社区生态不太好,风格比较少,花样也少。
2026年01月05日 01点01分
倾向于标签式提示词的可以考虑pony和Illustrious系列模型,社区真实系的微调模型非常多,Lora也够多,可以玩出非常多的花样。而且配置要求不高,在Z-Image生态完善起来之前,是目前当之无愧的最强。
2026年01月05日 01点01分
1 2 尾页