AI 文摘

4StableDiffusion提示词怎么写





作者: 辉哥伴你码上破茧 来源: 辉哥伴你码上破茧

什么是提示词

简而言之就是你想要什么那就写道正面提示词里,你不想要什么,那就写到负面提示词里。

AI 会通过寻找符合关键词描述的噪点图进行有明确指向的去噪点(diffuse)。同样,如果包含 Negative Prompt(负面关键词),AI 就会尽可能避免含有负面相关要素的去噪点方式。换句话说,prompt 就像是哈利波特里面的咒语,它直接决定了最终我们会得到什么。

提示词高级操作

特殊符号权重控制

权重控制可以通过对prompt加括号进行。一对小括号()意味着把括起来的 prompt 权重 * 1.1,中括号[]则是 / 1.1,可以同时使用多个括号进行叠加,但是这种写法不易于理解,更推荐的是(prompt:权重乘数)来进行权重调整air,在后 80% 步数被视为 a girl with red hair flower。

先后顺序控制权重

模型读取 promot 有着明确的先后顺序,这体现为理解顺序的不同。越靠前的 prompt 对构图的影响越“重”,而越靠后的则往往会成为靠前 prompt 的点缀或附加物。顺序对于构图的影响在大多数情况下甚至大于权重的影响。

将最着重体现的元素靠前摆放,然后是它的细节,再将抽象、全局化、影响极度强烈的 prompt 写在靠后处,例如场景和画风滤镜。

循环绘制语法

[A | B]

两个或者多个关键词之间加 | 可以表示循环绘制:
例如[cat | dog]

这个句式的基本逻辑是先画一步cat再画一步dog,按照这样的顺序循环画下去。

分步渲染语法

[A:B:step]

这个语法具体表示为“在执行到step前,先绘制A的内容,之后再绘制B的内容”

step为大于1的整数时表示步数,为小于1的正小数时表示总步数的百分比。

比如a girl with [white idol dress:red hanfu:0.2]会在前20%步数被视为a girl with white idol dress,在后80%步数被视为 a girl with red hanfu。

我们可以将其视为,ai在画了一部分white idol dress后,再在white idol dress的基础上画red hanfu。

负面词怎么写

无论如何负面提示词都会对画面产生一定的影响,并且很多影响是不可预见。这将会导致很多想要达到的效果无论如何也无法实现。更建议的做法是当生成图出现自己不想要的东西的时候再作为补充。

在C站可下载一个叫 Easynegative 的文件,它的作用是把一些常用的反向提示词整合在一起了,让我们只需输入简单的关键词就能得到较好效果。把它放到 xxx/enbeddings 文件夹,需要触发时在 negative prompt 中输入 easynegative 即可生效。

标准三段术式编写咒语

前缀+主体+场景(+后缀)

前缀(基本前缀+画风词+整体效果器)

用于确定图片的总体生成质量。基本前缀为强调图片质量的词汇:masterpiece,bestquality等;

画风词用于凸显图片的画风:插画illustration,水彩watercolor_medium,厚涂impasto等。

效果器为光线效果bestlighting,炫光lensflare,景深Depthoffield等用于图像整体光效的词汇。

主体(画面中的主体部分)

主体为图画想要凸显的主体,可以是人物,建筑,景物等,主体部分要进行丰富的描述才能获得细节丰富的图像。

主体部分要进行详细的描述才能获得重视,通常我们对主体词要加权重,以提高主体的清晰程度。

对于角色来说,通常包括了面部,头发,身体,衣着,姿态等描写。

没有角色时,可以将场景中的重要点即高耸如云的城堡,绽放的花朵,破碎的钟表等,想要位于画面中心的物体进行描述。

场景(背景,环境)

场景是主体存在的周围场景,没有场景描述时容易生成纯色背景或者是效果tag相关的背景,且主体会显得很大。部分主体会自带场景内容,例如建筑,景物。

单独的环境词汇会形成环绕与主体周边充斥整个画面的场景。如繁花草甸flowerymeadow,羽毛feather,阳光sunlight,河流river,碎玻璃Brokenglass等。环境词汇进行堆叠就能丰富整个场景,主要不要让主体内容太少。

背景词汇即环境词添加background做背景,例如:clockbackground,这样的描述可以稳定让背景词出现与主体的背后

提示词运行逻辑

之前的文章详细分析过sd的实现原理

  1. 我们输入的词句,会被蓝色的自然语言处理器解析成一个个数字,存进蓝色的数组中。
  2. 这个输入数组会按顺序结合高斯噪声输入到红色的生成器中,生成粗糙的图像。
  3. 将粗糙的图与输入数组重复第二步,对生成的图像进行迭代
  4. 将迭代完的输入黄色的放大器,扩大图像分辨率,使图像细致。

通过上述理论过程分析:

  1. 为什么ai画不好手脚,因为ai在生成图像的过程中,图像都是以一个小尺寸在进行迭代,最后再进行放大。像手,脚趾这类细小的物体,一开始占据的原始像素就少,所以放大后效果也不好
  2. 因为输入算法的逻辑,对tag的处理就是有序性的
  3. 太长的tag可能会被分割开来处理,webui会自动把过长的输入量按照最长75个输入量一组的形式放入CLIP。就可能会造成照片污染

提示词辅助工具

在成为经验丰富的魔法师之前,参考一些优秀的咒语是非常有必要的

提示词工具:
https://www.prompttool.com/home/NovelAI
https://promlib.com/
https://magic-tag.netlify.app/#webview

优质提示词库:https://docs.qq.com/sheet/DYUtXVGJJSFZ1R3FF?tab=ss_0gqnt7
资源大全: https://wolfchen.top/tag/doc.html

更多AI工具,参考Github-AiBard123国内AiBard123

可关注我们的公众号:每天AI新工具