视频模型remix 3.0 发布，但迎来的并非喜讯 - stablediffusion吧

level 12

Arclite 楼主

remix是肥猴大佬微调的基于wan2.2 的视频模型，与wan2.2 社区模型中与擅长运动的smooth，擅长动漫的dasiwa并称“三驾马车”。
作者说wan2.2 的上限也就这样，挖不出什么新玩意，本次更新之后就去研究LTX了。
视频模型和生图模型的体量差别太大，wan2.2 发布了这么久，知名的社区模型一只手就数的过来，可见其二次开发难度之大。
随着一位大作者官宣停更，另外“两架马车”估计也好不到哪儿去，wan2.2 也许终究是等不到它的pony/光辉了。
至于LTX 2.3，现在的社区评价也没多积极，配置高，运动表现不行，能否扛起开源的大旗？

2026年03月18日 04点03分 1

level 1

电脑就是玩游戏

试了ltx2.3，感觉对提示词要求太高了，固定镜头说话的时候人物的小动作，小动态还是不错的，比较自然，但是大的动态，就要你写的很清楚，比如跳舞，哪只手做什么都要写，不然它就很容易发呆不动。

2026年03月18日 05点03分 2

level 5

如花般的村姑

与其说wan2.2上线就这样了，不如说闭源模型上线就这样的，目前来看flux,qwen image,zimage目前的生态感觉都比较一般

2026年03月18日 06点03分 3

vuekoooo

说反了吧，这些不都是开源模型吗 [阴险]

2026年03月18日 06点03分

有困难汪汪队🐶

开源吧，闭源动态高太多了

2026年03月18日 07点03分

如花般的村姑

@vuekoooo 说反了，开源上限 [吐舌]

2026年03月18日 07点03分

level 9

安纳金🌌

LTX2.3底子不错，但是自己写提示词很难，必须加一个LLM节点来写

2026年03月18日 07点03分 5

level 7

ga405

主要是没什么人给wan2.2做全量微调，没有像danbooru这种现成的够大的数据集，肥猴那个包括其它wan2.2的定制版本都是用融合一堆lora的手法做的，局限性很大，面多加水，水多加面，很难面面俱到

2026年03月18日 09点03分 6

level 7

ga405

但以后我估计还是会有一个比较好的nsfw版本的wan2.2。我一直在说，从sdxl到光辉都用了一年半的时间，sdxl还只是个35亿参数的小模型，wan2.2微调需要的硬件成本和时间成本要高很多。还要考虑到danbooru数据集是标签化的，现在的这些新模型都要求输入是自然语言，现在没有类似规模的nsfw的自然语言描述的数据集，好在现在标注可以用AI完成，但是还是要等

2026年03月18日 09点03分 7