comfyui已经原生支持int8,速度比fp8快接近一倍
stablediffusion吧
全部回复
仅看楼主
level 9
前段时间还需要插件才能用现在已经原生支持了,据说出图质量还有比fp8好一点点。
int8的好处是这个加速20系的n卡都能用,对于现在许多用30和40系显卡的用户利好,50系显卡也一样能用,不过50系的可以用mxfp8,速度和int8差不多。(以前mxfp8也要用插件,前俩个月也原生支持了。)
我用zit做了个简单的测试:
bf16:17秒
fp8:17秒
int8:10秒
mxfp8:9秒
2026年06月28日 06点06分 1
level 9
int8模型体积和资源占用也是和fp8差不多,所需资源并没有减少,只是生产速度变快了,且质量损失比较小。想要资源占用比较小还是得用4bit量化的模型,但是双截棍已经很久没更新了,升级comfyui后还经常出毛病,nvfp4的模型也只能在50系显卡上获得加速,目前来看整体形式对于低显存用户来说依然不太友好。
不过主玩儿二次元的影响其实不大,anima和光辉需求的资源本来就不大,并且也可以用fp8的量化,高清放大的时候分块解码vae就可以了。
2026年06月28日 06点06分 2
level 9
现在c站和抱脸上近期的发布的模型也都有int8的版本了。期盼它能成为未来主流的量化版本吧……
2026年06月28日 06点06分 3
level 6
说是支持int8,但是只支持特定格式的int8,还要等大佬们重新量化一遍,而且lora适配有问题,有的加后lora图蹦的几率变大了,生图时间也会比fp8的变长。
2026年06月28日 07点06分 4
INT8 ConvRot,lora问题昨天就已经修复了。
2026年06月28日 08点06分
level 9
ComfyUI官方目前就提供了一个INT8量化的模型Boogu-Turbo,在5080上速度只有nvfp4的三分之一[喷],另外INT8不是啥先进技术,gguf量化早就是int8了,只能说适应一部分模型,而20系就支持int8了,照顾老显卡。未来是属于mxfp8和nvfp4的
2026年06月28日 08点06分 5
这个用得是ConvRot是新技术,和gguf的int8是两码事,boogu的int8我没有试过,但是zit和krea2都是有明显的速度提升的。
2026年06月28日 11点06分
我试了下boogu的,mxfp8:5.8秒,int8:6.3秒,nvfp4大概率和mxpf8速度差不多。
2026年06月28日 11点06分
level 9
2026年06月28日 11点06分 6
level 9
zit的不明显,但是boogu的这个感觉int8的放大后画质确实要好上一点点。
2026年06月28日 11点06分 7
1