三、训练tag和提示词tag的关系
1、训练的tag和提示词的tag之间存在着密切的关系。
在训练过程中,tag作为训练数据的一部分,与对应的图片进行关联。通过这种关联,模型可以学习到不同tag和图片之间的关系,从而理解和捕捉tag所代表的特征和属性。例如,假设我们有三张分别标记为“猫”、“狗”、“鸟”的图片,并且只使用这三张图片和tag训练模型,那么,模型可以学习到这三个tag对应的视觉特征。比如猫有两只尖尖的耳朵,大瞳孔的眼睛,毛茸茸的身体,四只小短腿等等特征。这样,当我们需要生成一张关于"猫"的图片时,我们只需要在提示词中提及"猫",模型就可以根据学习到的猫的特征生成一张猫的图片。但如果你要让这个模型生成一张“猪”的图片,那是不可能的,因为它没见过带有“猪”tag的图片,意味着它还没有学习过“猪”的特征。


**这是极其简化的过程,而实际情况是无论训练数据还是生成过程都要复杂得多!
这个过程类似于人类的认知方式。我们之所以能够识别不同的事物,是因为我们接触过大量的样本,并通过大脑对这些样本中的特征进行学习和理解。我们的大脑可以自然而然地识别熟悉的特征,从而让我们能够准确识别和想象不同的动物,如猫和鸟。但是对于我们没见过的事物,我们同样无能为力。
因此,如果你输入的tag与训练时使用的tag差异很大,甚至在训练集中根本没有出现过,那么显然,你无法获得你所期望的结果。就像要求模型生成一张关于"猪"的图片,但它从未学习过"猪"的特征一样。
2、tag对应图片的特征强度很重要
Tag对应的图片特征越明显,模型学习的难度就越低,训练效果也更好。当tag与图片的特征之间存在明显的对应关系时,模型能够更轻松地学习到这种关联,并生成符合预期的结果。
如果tag所代表的特征在图片中非常显著,那么模型在观察大量样本时会更容易捕捉到这些特征的模式和规律。例如,如果tag为 "sunflower"(向日葵),而图片中的主体正是一朵鲜艳明亮、有明显花瓣形状的向日葵,并且没有复杂的背景信息(图左一)。那么模型很容易通过学习到这种形状、颜色和纹理等特征来识别并生成向日葵的图片。相反,如果我们仍然以 "sunflower"作为tag,但图片中的内容有其他干扰因素(图左二),甚至没有明显的向日葵(图左三),这时模型就可能面临更大的挑战。因为tag对应的特征不够明显,模型可能难以准确地学习到向日葵的特征。


因此,在训练模型时,提高tag与图片特征匹配程度可以显著增强模型的学习效果。如果你有训练模型的打算,那么这点你需要特别注意。
然而遗憾的是,训练模型需要大量的资源,因此相信我们大部分人都没有能力训练模型(dreambooth除外),因而使用别人训练好的现成模型则是更好的办法,也因此对于模型本身的问题我们大部分人是没办法干预的。不过我们可以去了解训练模型所使用的tag,以帮助我们更好控制提示词中的tag。
3、控制提示词tag以获得理想效果
利用tag生成图片同样有需要我们去注意的地方。首先是选择特征性强的tag,这样可以更好地缩小生成图片的范围,从而更容易得到我们想要的图片。
举个例子来说明,假设我们想生成油画效果的图片,但只使用了 "oil painting" 这个tag,你会发现好像油画效果并不明显。你可能会很困扰为什么得不到自己想要的结果,其实这是因为 "oil painting" 的特征性还不够强。在训练模型所使用的数据中,任何油画作品都可能带有 “oil painting” 的tag。这些油画作品涵盖了不同时期,不同风格,有细腻有粗犷,有鲜艳有素雅,有古典有现代。
你可以从下图中观察其多样性:


如果我们只是想要特定的艺术效果,那么可以添加艺术家的名字作为补充tag以将生成的结果限制在更小的范围内。艺术家的tag具有很强的特征性,每个艺术家的作品风格都非常明显。通过添加艺术家的名字,模型就能更准确地理解我们的意图,生成出更符合预期的图片。当然你也可以将许多艺术家的风格进行融合以形成更多样的画风,这是SD很擅长的地方。
以下是个例子:
Model: Realistic_Vision_V2.0
Prompt: a young woman with vintage dress is sitting on the grass, oil painting, light smile, vintage, detailed face, clear eyes, sunlight, shadow, van gogh


如上图所示,可以观察到只以 ”oil painting” 作为tag,油画风格其实并不是很强烈,缺少油画该有的纹理。当额外添加关键词 van gogh(梵高),画风出现明显转变,有高饱和的颜色,有强烈的线条感。当额外添加关键词monet(莫奈),则出现素淡的颜色,且有明显的短小线条纹理。将两者结合则会发现有monet素淡的颜色,也有van gogh 弯曲的线条。
所以说,在可以更具体描述的条件下应该避免使用相对抽象的表达。这其实与人类的思维方式相似。当我提到"油画"时,你可能会想到各种各样的油画,涵盖了不同的艺术家、不同的风格等等,这样我们对油画的想象比较抽象。但是当我提到"梵高的油画"时,就会变得更具体,你可以更准确地想象出来,比如他作品中那独特的弯曲线条等等。