实战技巧

这个简短的实战指南，可以让你快速了解如何合理调整参数达成目的效果。

目前，AI 处理不好细节和多人物，如果一个个处理，光影结构就会乱掉。如果修图，不如重画。但是画背景和做预览很实用。

核心逻辑就是缩小预选数据的范围，调节天平在消极和积极提示之间的方向，还有使用部分语法控制提示词效果的强烈程度和起效过程。

灵感表

角度
人物	表情	头发	眼睛	衣着	状态	姿势位	镜头位
场景	广狭选择	光影选择	背景主体	人物事件地
数据限定	绘画类型	评价限定	联想元素	3D/2D
事件	缩写词	SFW/NSFW	出品公司	作品品牌

画作焊接！

通过 PaintHua-无限外延画布的在线工具，你可以连续 “焊接” 作品，非常方便。只需要在启动命令加上 --api 参数，然后打开网页就可以使用。

GitHub

并不支持在任意模型上进行图像外延，因为它们不是 Inpaint 模型 (Stable Diffusion 有专用的 Inpaint 模型。)

遏制风格污染

介绍如何在 WebUI 中生成图片时，将主体作为重点，而不是画风。[^12]

为了得到预期结果，我们将 style 改为 [style:10]

Automatic 1111 的 WebUI 提示词语法中，[x:10] 告诉稳定扩散直到第十个 step 再渲染这个提示词。

当达到 10 步的时候，一个基本的图像已经形成了，所以风格化肆意污染主体成分，而是像在现有图像上进行 IMG2IMG(你可以把它看成是 Img2img 的形式)

你可以根据你所做的整体步骤的多少来试验这个数字。如果你把格式改为 [x:0.2]（即低于 1 的数字），那么它就变成了百分比，[x:0.6]告诉 SD 等到总步骤数的 60% 时再渲染 x ，以此类推。

尺寸选择

不应该将其与画质挂钩，尺寸一定程度上影响了主题，因为它潜在代表选择的类别(比如竖屏人物，横屏风景，小分辨率表情包居多)。

若需提升画质，可采取如 waifu2x 等的成熟技术提升分辨率。

视角

推荐使用 Danbooru 含有的术语

shot

引用来自日本 Wiki 的图片，作者不明

参数	解释
`extreme closeup`	脸部特写
`close up`	头像
`medium close up`	证件照
`medium shot`	半身
`cowboy shot`	无腿
`medium full shot`	无脚
`full shot`	全身

噪声

分类	描述	处理
粗糙	细节不够，人物像米糕一样	需要适当提升 step
波浪	密集的波浪或图案	向量不“均匀”，可能是权重设置太高
模型	训练处理的模型非常抽象	向量不“均匀”，可能是炼丹炼炸了
冲突	实景中的扁平动漫纸片儿	可能混用了不同次元或主题的提示词
彩虹	输出混乱的彩虹色图片	可能是生成分辨率被设置得太低。
尺寸	大尺寸下输出扭曲的图片	开启`Highres Fix`选项或使用 `小分辨率+超分` 的方法

动漫风格

anime coloring 会有很好的效果，像动漫截图一样。(如果遇到黑白色，需要指定人物部件的色彩)

av304175820 - AI 绘 | 让你的图片更特别！32 种风格化 prompt 简介 @ Bilibili

优化作品效果

对目标进行审视

想一想，自己想要的作品，在互联网上会被打上什么标签呢？

贴纸肯定不会打上 masterpiece, best quility, 吧。

另外就是如果要求的是像素作品，应该移除一些冲突的消极提示(如果有的话)。

顺序调整

在前面的词汇会锚定画面的色彩分布。什么重要什么放前面。

语义偏移防范

为了防止语义偏移，优先考虑 emoji，然后少用不必要的 with 一类的复杂语法。

彩虹混乱图

如果输出混乱的彩虹色图片，可能是生成分辨率被设置得太低。

波浪噪点图

密集的波浪或图案，可能是因为权重设置太高了。

抠图？

扣过的图，其余背景都会被处理成黑色。

如果你需要背景，效果一般不是很好，建议填色后再操作。

粗糙的噪声

细节不够，人物像米糕一样。需要适当提升 step.

保护图片不被分割线切割

消极提示加入

comic 2koma 3koma 4koma collage

应该可以改善。

跨领域术语/奇门遁甲

跨领域术语的核心逻辑就是缩小指定的数据范围，从画面内容之外的平台，领域，事件上入手来提升效果。

是的！你可以在提示中使用 Film Glossary、FILM GLOSSARY 摄影术语、Cinematic techniques 摄影技术，以及绘画术语 (类型) 来控制基本情况。

跨领域！你甚至可以使用各种惊险运动的名词来生产一些特效...比如空降

比如，景深，光圈，构图，拍摄机位，运动元素，艺术摄影术语表中文介绍

但是这种效果可能会带来附加作用:引入你不希望见到的风格(如实景而不是而二次元)数据进入图片。把握好量度。适当增加 Step 和风格提示来改善.

你还可以使用 平台名 来限定数据集的范围，比如 pixiv 之类的词汇。

扩展阅读

有用的电影术语 https://en.wikipedia.org/wiki/Category:Cinematic_techniques
镜头类型 https://www.bhphotovideo.com/explora/video/tips-and-solutions/filmmaking-101-camera-shot-types
电视术语 https://en.wikipedia.org/wiki/Category:Television_terminology
摄影类型 https://en.wikipedia.org/wiki/Category:Photography_by_genre
摄影术语 https://zh.wikipedia.org/zh-cn/高速摄影
极限运动 https://en.wikipedia.org/wiki/Extreme_sport https://en.wikipedia.org/wiki/Category:Sports_by_type
构图艺术 https://en.wikipedia.org/wiki/Composition_(visual_arts)

迭代草图

详见 GitHub Discussions 讨论串。

这里讨论一下如何将 手绘草图 通过 AI 绘画优化，注意不是二次元。

在第一次迭代中，您不需要太多 Steps，CFG 可以非常低（以获得更好的多样化结果），如果不想完全丢失草图，Denoising 应该在 0.3 - 0.4 左右。

在最后的迭代中，增加 Steps 和 Denoising 强度（但不超过 0.8，否则图像将被破坏，尤其是在大于 512*512 时）请参见这里，同时根据需要提高 CFG 和尺寸。

你可以随时修复提示（添加或删除出现的细节）并尝试不同的采样器。

另外，你不应该在初次生成使用一个固定不变的种子。

如果你提供一个种子（而不是随机的 -1），你的图像很快就会变得过饱和、过度锐化、过度像素化..... 当然如果想微调，可以使用固定种子。

多人物 / 宽幅单人物

单纯使用 txt2img 无法有效指定多人物情况下单个人物的特征。

较为推荐的方案是打草图 + IMG2IMG 的方式。

宽幅画作单人物生成最好打草图，进行色彩涂抹，确定画面主体。

多人物确定人物数量，最好使用草稿 / 有色 3D 排列 + 图生图。

进行手掌修复

将图片送入 inpaint，使用大致相同的提示词，将关于 手 的提示放在前面，根据你希望它变动多少来设置降噪（如果只是希望手更完整，调至 0.25 以下)，然后保留步骤和 CFG 与 txt2img gen 相同。

或者仅遮住手部，以全分辨率修复，大大降低填充（它使用周围的像素来创建上下文，但只是在重新制作手部）并仅提示手部问题（详细的手部描写等）

CFG 越高，越符合提示词，降噪越高越偏离原图。

同人物 & 差分

需要用到进阶的 Img2Img 相关内容，最好的方法是准备一个带有色彩的 3D 母本模型，然后这样就可以保证基本一致。

也可以用很多提示词来限制角色内容，出很多张，挑能用的作品。

如果是表情或者是背景，可以采用重绘画技巧。

如果你想了解一些差分的实例，5CH 日语 Wiki 提供了一个实例。

复刻

如果想复刻他人生成的图片，需要相同的 seed ，提示词和其他参数(包括尺寸)。不过如果对方使用了微调模型，那么你就几乎无法复刻。

~~自欺欺人式复刻：图转图，降噪拉到到 0.3 以下...~~

使用 AI 进行设计

背景

拿到一张饱和度稍微高的照片后，可以用 AI 进行处理，然后当作背景使用。使用 anime coloring 来增强动漫风格。

图标

看这个

表情包

表情包效果真的很好。 sticker 配合西方颜文字完成度超高！

文档编写者试了一下，以下 prompt 可以出高质量表情包。

不要对贴纸要求质量提示词。

积极词汇

1girl,sticker,chibi,Q,
white background,

masterpiece,best quality 可加可不加，质量不够就加

lowres 可加可不加，不够复古就加

chibi 控制角色为 Q 版(大头小身)，不够 Q 就加

sticker 是指定风格为社交软件贴纸，必须

消极词汇

bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, jpeg artifacts, signature, watermark, username, blurry, bad feet

low quality 可加可不加

尺寸要求正方形。

立绘

av559362671 - 【AI 绘图】画师不是 AI 的附庸！手绘+AI 辅助展示！StableDiffusion/NOVELAI 辅助角色立绘设计最详细分享！ @ Bilibili

BV14e4y1U7r9

修改画作

想要用 WebUI 改画或者手动添加元素？下面是一个小指南。

首先，IMG2IMG2 和 Inpaint 的效果是完全不同的。如果你不希望风格发生变动，不要选择 IMG2IMG2.

为了避免图片拉伸，尺寸上都应该 尽量靠近原图尺寸，选择 Crop and resize 也就是裁切后调整大小

Masked Content

Masked content 相关设置确定在修复之前放置到遮罩区域中的内容，它决定了初始的参考内容(origin 就是模糊之前蒙版的内容，而 latent nosie 是以噪声(很多随机色素点点做参考)。

aidrawfix2

latent noise 是确定 AI 参考的内容，而 Denoising strength 可以理解为对参考的偏离度。

变动元素

如果需要变动元素，抠图、贴图即可。

如果需要添加元素，我们可以通过 PS 给角色移植一个手让 AI 来润色，或者为没有下半身的半身像嫁接其他作品的下半身让 AI 修复。

test1

基于原图进行微调

使用 Inpaint，主要场景是去除/替换。

首先要对人物边缘描细线，然后打上色块（如果有阴影，取亮色或者画全阴影）。变动强度选择较低的 0.3 左右的去噪（越低越接近输入的图片）。

然后使用 Img2Img Inpaint + 相关提示词修复，不满意可以再改，直到满意。然后对图像进行 realesrgan 超分，去除图像纹理。

fix_exp

修复绘画技巧/Inpaint/PS 重绘画/嫁接修复/躺姿补全

使用 PS 软件增删元素，然后重新生产。这可以解决画手的问题。

AI 也接受其他成图进行嫁接(解决躺姿没有下半身的问题)

比如

test_woman

一张图片展现 WebUI 下 img2img 中不同参数下效果的详细对比图（prompt、steps、scale、各种 seed 等参数均保持一致）

纵轴是 Denoising strength（线上版的 strength），横轴是 Variation strength

实战技巧 #

灵感表 #

画作焊接！ #

遏制风格污染 #

尺寸选择 #

视角 #

噪声 #

动漫风格 #

优化作品效果 #

对目标进行审视 #

顺序调整 #

语义偏移防范 #

彩虹混乱图 #

波浪噪点图 #

抠图？ #

粗糙的噪声 #

保护图片不被分割线切割 #

跨领域术语/奇门遁甲 #

扩展阅读 #

迭代草图 #

多人物 / 宽幅单人物 #

进行手掌修复 #

同人物 & 差分 #

复刻 #

使用 AI 进行设计 #

背景 #

图标 #

表情包 #

积极词汇 #

消极词汇 #

立绘 #

修改画作 #

Masked Content #

变动元素 #

基于原图进行微调 #

修复绘画技巧/Inpaint/PS 重绘画/嫁接修复/躺姿补全 #