StableDiffusion中保持人物外观一致性的尝试作者：进击的蘑菇来源：进击的蘑菇照例，还是通过自然语言大模型先分镜，以下为提示词：你知道守株待兔这个故事吗我想要请你为这个守株待兔剧情内容设计4个分镜。每个分镜要具体说明故事场景，角色行动，摄影角度。请注意：该故事的背景应当在中国古代我要替

StableDiffusion中保持人物外观一致性的尝试

By AiBard123
April 9, 2024 - 2 min read

作者：进击的蘑菇来源：进击的蘑菇

照例，还是通过自然语言大模型先分镜，以下为提示词：

你知道守株待兔这个故事吗

我想要请你为这个守株待兔剧情内容设计4个分镜。
每个分镜要具体说明故事场景，角色行动，摄影角度。
请注意：该故事的背景应当在中国古代

我要替这个故事制作角色概念草图，
请你帮我设计以下农夫、兔子这两个角色，
要求：农夫角色包含体型，外貌，穿着服饰，发型及颜色等，
兔子要求体型，毛发颜色等

好，接下来我需要请你把农夫和兔子的角色描述改写成两个midjourney prompts（使用英文），
格式类似下面这个句子：A little boy with short light red curly hair and blue eyes

拿到角色描述之后，尝试制作角色概念图，先随机生成几张角色图，选择一张看的顺眼的图片

A diligent peasant farmer with a robust physique, clad in coarse, earth-toned garments typical of ancient rural attire, his countenance weathered by years of toil, featuring deep-set eyes beneath a furrowed brow, and a simple hairstyle, perhaps tied up in a traditional knot or adorned with a simple headpiece.

发送到图生图，先保留原本的提示词，在原本的提示词前面强调想要修改的内容，例如：白发，蓝眼睛，(red hair:1.5)的这种小括号代表的是1.1倍，比如（red hair）就代表红发这个词语的权重变成1.1倍，(((red hair)))，代表1.1x1.1x1.1等于1.331倍。

controlNet中选择Reference，如果生成的效果不明显，控制模式可以改成以提示词为主

可以看到测试效果还可以

例如，让其变得愤怒((angry face))

((happy face))

不过在controlnet的预处理为Reference时，提示词对场景进行更改描述，能生效的概率很低 ，例如，我加入了如下提示词

discovers a deceased rabbit beneath a tree in his field.

刷了20张图，只有两张图片刷出了兔子，并且效果并不是特别好，因此关于场景的描述后续可能还得继续研究下。

参考：

https://zhuanlan.zhihu.com/p/639245307

更多AI工具，参考Github-AiBard123，国内AiBard123

可关注我们的公众号：每天AI新工具