wan2.2能生成连贯的视频吗？ - comfyui吧

level 1

焰焰焰焰😈 楼主

我现在需要生成一个大概16秒的视频，主角用望远镜看远处，然后放下望远镜说话，然后再拿起望远镜继续看，背景有路人在走动。
我现在已经生成了主角拿着望远镜的图了，使用wan2.2图生视频，我发现模型不能理解我的动作提示词。
请问有什么办法可以完成我的需求吗？

2026年03月30日 10点03分 1

level 2

code27

把你的需求详细描述给 AI 然后让 ai 生成 comfyui 提示词

2026年03月30日 13点03分 2

焰焰焰焰😈

这个不行，我试过ds 和chatgpt ，生成的提示词，单图不能生成我想要的视频，动作全是乱搞的

2026年03月31日 00点03分

code27

@焰焰焰焰😈 试试 grok 的我用下来还行不过也是要不断微调的

2026年03月31日 01点03分

焰焰焰焰😈

@code27

好，我试试。我也是调一天了，一张图，让人物先右转过头来说个字，然后再转回去继续用望远镜。结果wan2.2生成的一只是瞎扭头

2026年03月31日 01点03分

level 6

zgmfrx782

需要svi

2026年03月30日 22点03分 3

焰焰焰焰😈

请问我需要了解哪些，直接搜这个吗

2026年03月31日 00点03分

level 6

cloudprince013

用SVI，动漫用DASIWA

2026年03月31日 01点03分 4

焰焰焰焰😈

好，我搜搜看，谢谢！

2026年03月31日 01点03分

level 3

贴吧用户_QJRVy78

当前的智商不够，连贯生成的大多是乱七八糟。

2026年03月31日 01点03分 5

焰焰焰焰😈

是的，我都详细到每一秒做什么了，生成视频里的人还是乱动乱转头的。但是分开生成再拼接的话，背景有路人在走，这我感觉会导致路人闪现，也很苦恼

2026年03月31日 01点03分

贴吧用户_QJRVy78

@焰焰焰焰😈 实在不行可以用尾帧生成。唯一缺点画质有折损

2026年03月31日 10点03分

level 3

生化危机XD

别这么干，连贯视频连闭源都不行，中间有几段穿帮就直接废片了，何况开源和闭源还有差距。你切成6~8秒的小段，电脑压力还小

2026年03月31日 02点03分 7

焰焰焰焰😈

我看他们说的svi似乎可以，我刚刚用演示的跑了一下，效果一般，但是感觉跟我的提示词有关，改改提示词应该能做到。分段生成的话，因为背景有路人，感觉有点麻烦。需要保持连贯性，你有好的建议吗

2026年03月31日 02点03分

jakNPT

@焰焰焰焰😈 svi也一般，本质模型能力也就那样了，即使你用精度最高的umt5，它模型也是很多理解不了，不如选择ltx2.3，配合一个prmote插件，应该能满足你的需求。

2026年05月09日 11点05分

level 3

vyjfsh😞

wan不能这么长时间吧，控制5s以内

2026年03月31日 03点03分 8

焰焰焰焰😈

所以想要做一个十几秒的，是需要拆分生成再剪辑么

2026年03月31日 03点03分

vyjfsh😞

@焰焰焰焰😈 要不然就分首尾帧衔接，拼接长视频

2026年03月31日 06点03分

level 1

贴吧用户_0QJSSbe

你需要一个首尾帧图来做视频，这样可以尽量控制住人物的动作

2026年03月31日 03点03分 9

level 1

狮城狼

为什么不试试LTX2.3,可以首，中，尾，三帧生成视频，又快又好。

2026年03月31日 05点03分 10

level 5

伊吹萃香☞

先生成分镜然后收尾帧在然后剪在一起

2026年03月31日 10点03分 11

level 2

极好的呢😄

为什么广场里那个5b的图生视频wan2.2，直接用生成的都是黑黑的乱闪，不然就是赛博马赛克

2026年04月01日 08点04分 12

vyjfsh😞

爆显存了吧

2026年04月03日 05点04分