AI 文摘

StableDiffusion中保持人物外观一致性的尝试





作者: 进击的蘑菇 来源: 进击的蘑菇

照例,还是通过自然语言大模型先分镜,以下为提示词:

你知道守株待兔这个故事吗

我想要请你为这个守株待兔剧情内容设计4个分镜。
每个分镜要具体说明故事场景,角色行动,摄影角度。
请注意:该故事的背景应当在中国古代


我要替这个故事制作角色概念草图,
请你帮我设计以下农夫、兔子这两个角色,
要求:农夫角色包含体型,外貌,穿着服饰,发型及颜色等,
兔子要求体型,毛发颜色等

好,接下来我需要请你把农夫和兔子的角色描述改写成两个midjourney prompts(使用英文),
格式类似下面这个句子:A little boy with short light red curly hair and blue eyes

拿到角色描述之后,尝试制作角色概念图,先随机生成几张角色图,选择一张看的顺眼的图片

A diligent peasant farmer with a robust physique, clad in coarse, earth-toned garments typical of ancient rural attire, his countenance weathered by years of toil, featuring deep-set eyes beneath a furrowed brow, and a simple hairstyle, perhaps tied up in a traditional knot or adorned with a simple headpiece.

发送到图生图,先保留原本的提示词,在原本的提示词前面强调想要修改的内容,例如:白发,蓝眼睛,(red hair:1.5)的这种小括号代表的是1.1倍,比如(red hair)就代表红发这个词语的权重变成1.1倍,(((red hair))),代表1.1x1.1x1.1等于1.331倍。

controlNet中选择Reference,如果生成的效果不明显,控制模式可以改成以提示词为主

可以看到测试效果还可以

例如,让其变得愤怒((angry face))

((happy face))

不过在controlnet的预处理为Reference时,提示词对场景进行更改描述,能生效的概率很低 ,例如,我加入了如下提示词

discovers a deceased rabbit beneath a tree in his field.

刷了20张图,只有两张图片刷出了兔子,并且效果并不是特别好,因此关于场景的描述后续可能还得继续研究下。

参考:

https://zhuanlan.zhihu.com/p/639245307

更多AI工具,参考Github-AiBard123国内AiBard123

可关注我们的公众号:每天AI新工具