实战技巧
这个简短的实战指南,可以让你快速了解如何合理调整参数达成目的效果。
目前,AI 处理不好细节和多人物,如果一个个处理,光影结构就会乱掉。如果修图,不如重画。但是画背景和做预览很实用。
核心逻辑就是缩小预选数据的范围,调节天平在消极和积极提示之间的方向,还有使用部分语法控制提示词效果的强烈程度和起效过程。
灵感表
角度 | |||||||
---|---|---|---|---|---|---|---|
人物 | 表情 | 头发 | 眼睛 | 衣着 | 状态 | 姿势位 | 镜头位 |
场景 | 广狭选择 | 光影选择 | 背景主体 | 人物事件地 | |||
数据限定 | 绘画类型 | 评价限定 | 联想元素 | 3D/2D | |||
事件 | 缩写词 | SFW/NSFW | 出品公司 | 作品品牌 |
画作焊接!
通过 PaintHua-无限外延画布的在线工具 ,你可以连续 “焊接” 作品,非常方便。只需要在启动命令加上 --api
参数,然后打开网页就可以使用。
并不支持在任意模型上进行图像外延,因为它们不是 Inpaint 模型 (Stable Diffusion 有专用的 Inpaint 模型。)
遏制风格污染
介绍如何在 WebUI 中生成图片时,将主体作为重点,而不是画风。[^12]
为了得到预期结果,我们将 style
改为 [style:10]
Automatic 1111 的 WebUI 提示词语法中,[x:10] 告诉 稳定扩散 直到第十个 step 再渲染这个提示词。
当达到 10 步的时候,一个基本的图像已经形成了,所以风格化肆意污染主体成分,而是像在现有图像上进行 IMG2IMG(你可以把它看成是 Img2img 的形式)
你可以根据你所做的整体步骤的多少来试验这个数字。如果你把格式改为 [x:0.2](即低于 1 的数字),那么它就变成了百分比,[x:0.6]告诉 SD 等到总步骤数的 60% 时再渲染 x ,以此类推。
尺寸选择
不应该将其与画质挂钩,尺寸一定程度上影响了主题,因为它潜在代表选择的类别(比如竖屏人物,横屏风景,小分辨率表情包居多)。
若需提升画质,可采取如 waifu2x 等的成熟技术提升分辨率。
视角
引用来自日本 Wiki 的图片,作者不明
参数 | 解释 |
---|---|
extreme closeup | 脸部特写 |
close up | 头像 |
medium close up | 证件照 |
medium shot | 半身 |
cowboy shot | 无腿 |
medium full shot | 无脚 |
full shot | 全身 |
噪声
分类 | 描述 | 示例 | 处理 |
---|---|---|---|
粗糙 | 细节不够,人物像米糕一样 | 需要适当提升 step | |
波浪 | 密集的波浪或图案 | 向量不“均匀”,可能是权重设置太高 | |
模型 | 训练处理的模型非常抽象 | 向量不“均匀”,可能是炼丹炼炸了 | |
冲突 | 实景中的扁平动漫纸片儿 | 可能混用了不同次元或主题的提示词 | |
彩虹 | 输出混乱的彩虹色图片 | 可能是生成分辨率被设置得太低。 | |
尺寸 | 大尺寸下输出扭曲的图片 | 开启Highres Fix 选项或使用 小分辨率+超分 的方法 |
动漫风格
anime coloring
会有很好的效果,像动漫截图一样。(如果遇到黑白色,需要指定人物部件的色彩)
av304175820 - AI 绘 | 让你的图片更特别!32 种风格化 prompt 简介 @ Bilibili
优化作品效果
对目标进行审视
想一想,自己想要的作品,在互联网上会被打上什么标签呢?
贴纸肯定不会打上 masterpiece, best quility,
吧。
另外就是如果要求的是像素作品,应该移除一些冲突的消极提示(如果有的话)。
顺序调整
在前面的词汇会锚定画面的色彩分布。什么重要什么放前面。
语义偏移防范
为了防止语义偏移,优先考虑 emoji,然后少用不必要的 with
一类的复杂语法。
彩虹混乱图
如果输出混乱的彩虹色图片,可能是生成分辨率被设置得太低。
波浪噪点图
密集的波浪或图案,可能是因为权重设置太高了。
抠图?
扣过的图,其余背景都会被处理成黑色。
如果你需要背景,效果一般不是很好,建议填色后再操作。
粗糙的噪声
细节不够,人物像米糕一样。需要适当提升 step.
保护图片不被分割线切割
消极提示加入
comic 2koma 3koma 4koma collage
应该可以改善。
跨领域术语/奇门遁甲
跨领域术语的核心逻辑就是缩小指定的数据范围,从画面内容之外的平台,领域,事件上入手来提升效果。
是的!你可以在提示中使用 Film Glossary、FILM GLOSSARY 摄影术语、Cinematic techniques 摄影技术,以及绘画术语 (类型) 来控制基本情况。
跨领域!你甚至可以使用各种惊险运动的名词来生产一些特效...比如空降
比如,景深,光圈,构图,拍摄机位,运动元素,艺术摄影术语表中文介绍
但是 这种效果可能会带来附加作用:引入你不希望见到的风格(如实景而不是而二次元)数据进入图片。把握好量度。适当增加 Step 和 风格提示 来改善.
你还可以使用 平台名 来限定数据集的范围,比如 pixiv 之类的词汇。
扩展阅读
- 有用的电影术语 https://en.wikipedia.org/wiki/Category:Cinematic_techniques
- 镜头类型 https://www.bhphotovideo.com/explora/video/tips-and-solutions/filmmaking-101-camera-shot-types
- 电视术语 https://en.wikipedia.org/wiki/Category:Television_terminology
- 摄影类型 https://en.wikipedia.org/wiki/Category:Photography_by_genre
- 摄影术语 https://zh.wikipedia.org/zh-cn/高速摄影
- 极限运动 https://en.wikipedia.org/wiki/Extreme_sport https://en.wikipedia.org/wiki/Category:Sports_by_type
- 构图艺术 https://en.wikipedia.org/wiki/Composition_(visual_arts)
迭代草图
这里讨论一下如何将 手绘草图 通过 AI 绘画优化,注意不是二次元。
在第一次迭代中,您不需要太多 Steps,CFG 可以非常低(以获得更好的多样化结果),如果不想完全丢失草图,Denoising 应该在 0.3 - 0.4 左右。
在最后的迭代中,增加 Steps 和 Denoising 强度(但不超过 0.8,否则图像将被破坏,尤其是在大于 512*512 时)请参见 这里,同时根据需要提高 CFG 和尺寸。
你可以随时修复提示(添加或删除出现的细节)并尝试不同的采样器。
另外,你不应该在初次生成使用一个固定不变的种子。
如果你提供一个种子(而不是随机的 -1
),你的图像很快就会变得过饱和、过度锐化、过度像素化..... 当然如果想微调,可以使用固定种子。
多人物 / 宽幅单人物
单纯使用 txt2img 无法有效指定多人物情况下单个人物的特征。
较为推荐的方案是 打草图 + IMG2IMG 的方式。
宽幅画作单人物生成最好打草图,进行色彩涂抹,确定画面主体。
多人物确定人物数量,最好使用草稿 / 有色 3D 排列 + 图生图。
进行手掌修复
将图片送入 inpaint,使用大致相同的提示词,将关于 手
的提示放在前面,根据你希望它变动多少来设置降噪(如果只是希望手更完整,调至 0.25 以下),然后保留步骤和 CFG 与 txt2img gen 相同。
或者仅遮住手部,以全分辨率修复,大大降低填充(它使用周围的像素来创建上下文,但只是在重新制作手部)并仅提示手部问题(详细的手部描写等)
CFG 越高,越符合提示词,降噪越高越偏离原图。
同人物 & 差分
需要用到进阶的 Img2Img 相关内容,最好的方法是准备一个带有色彩的 3D 母本模型,然后这样就可以保证基本一致。
也可以用很多提示词来限制角色内容,出很多张,挑能用的作品。
如果是表情或者是背景,可以采用 重绘画 技巧。
如果你想了解一些差分的实例,5CH 日语 Wiki 提供了一个实例。
复刻
如果想复刻他人生成的图片,需要相同的 seed
,提示词和其他参数(包括尺寸)。不过如果对方使用了 微调模型,那么你就几乎无法复刻。
自欺欺人式复刻:图转图,降噪拉到到 0.3 以下...
使用 AI 进行设计
背景
拿到一张饱和度稍微高的照片后,可以用 AI 进行处理,然后当作背景使用。使用 anime coloring
来增强动漫风格。
图标
表情包
表情包效果真的很好。 sticker
配合 西方颜文字 完成度超高!
文档编写者试了一下,以下 prompt 可以出高质量表情包。
不要对贴纸要求质量提示词。
积极词汇
1girl,sticker,chibi,Q,
white background,
masterpiece,best quality
可加可不加,质量不够就加
lowres
可加可不加,不够复古就加
chibi
控制角色为 Q 版(大头小身),不够 Q 就加
sticker
是指定风格为社交软件贴纸,必须
消极词汇
bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, jpeg artifacts, signature, watermark, username, blurry, bad feet
low quality
可加可不加
尺寸要求正方形。
立绘
av559362671 - 【AI 绘图】画师不是 AI 的附庸!手绘+AI 辅助展示!StableDiffusion/NOVELAI 辅助角色立绘设计最详细分享! @ Bilibili
BV14e4y1U7r9
修改画作
想要用 WebUI 改画或者手动添加元素?下面是一个小指南。
首先,IMG2IMG2 和 Inpaint 的效果是完全不同的。如果你不希望风格发生变动,不要选择 IMG2IMG2.
为了避免图片拉伸,尺寸上都应该 尽量靠近原图尺寸,选择 Crop and resize
也就是裁切后调整大小
Masked Content
Masked content
相关设置确定在修复之前放置到遮罩区域中的内容,它决定了初始的参考内容(origin 就是模糊之前蒙版的内容,而 latent nosie 是以噪声(很多随机色素点点做参考)。
latent noise 是确定 AI 参考的内容,而 Denoising strength 可以理解为对参考的偏离度。
变动元素
如果需要变动元素,抠图、贴图即可。
如果需要添加元素,我们可以通过 PS 给角色移植一个手让 AI 来润色,或者为没有下半身的半身像嫁接其他作品的下半身让 AI 修复。
基于原图进行微调
使用 Inpaint,主要场景是去除/替换。
首先要对人物边缘描细线,然后打上色块(如果有阴影,取亮色或者画全阴影)。变动强度选择较低的 0.3 左右的去噪(越低越接近输入的图片)。
然后使用 Img2Img Inpaint + 相关提示词修复,不满意可以再改,直到满意。然后对图像进行 realesrgan 超分,去除图像纹理。
修复绘画技巧/Inpaint/PS 重绘画/嫁接修复/躺姿补全
使用 PS 软件增删元素,然后重新生产。这可以解决画手的问题。
AI 也接受其他成图进行嫁接(解决躺姿没有下半身的问题)
比如
一张图片 展现 WebUI 下 img2img 中不同参数下效果的详细对比图(prompt、steps、scale、各种 seed 等参数均保持一致)
纵轴是 Denoising strength(线上版的 strength),横轴是 Variation strength