实战指南

这个简短的实战指南，可以让你快速了解如何才能更好地调整参数。

核心逻辑就是缩小预选数据的范围，调节天平在消极和积极提示之间的方向，还有使用部分语法控制提示词效果的强烈程度和起效过程。

灵感表

角度
人物	表情	头发	眼睛	衣着	状态	姿势位	镜头位
场景	广狭选择	光影选择	背景主体	人物事件地
数据限定	绘画类型	评价限定	联想元素	3D/2D
事件	缩写词	SFW/NSFW	出品公司	作品品牌

视角

推荐使用 Danbooru 含有的术语

引用来自日本 Wiki 的图片，作者不明

参数	解释
`extreme closeup`	脸部特写
`close up`	头像
`medium close up`	证件照
`medium shot`	半身
`cowboy shot`	无腿
`medium full shot`	无脚
`full shot`	全身

噪声

分类	描述	示例	处理
粗糙	细节不够，人物像米糕一样	![缺少示例图片]	需要适当提升 step
波浪	密集的波浪或图案	![缺少示例图片]	向量不“均匀”，可能是权重设置太高
模型	训练处理的模型非常抽象	![缺少示例图片]	向量不“均匀”，可能是炼丹炼炸了
冲突	实景中的扁平动漫纸片儿	![缺少示例图片]	可能混用了不同次元或主题的提示词
彩虹	输出混乱的彩虹色图片	![缺少示例图片]	可能是生成分辨率被设置得太低。
尺寸	大尺寸下输出扭曲的图片	![缺少示例图片]	开启`Highres Fix`选项或使用 `小分辨率+超分` 的方法

降噪

动漫插图推荐使用 Real-ESRGAN 降噪。

效果图

超分图像 extras

WebUi 的 extras 页有自带的超分功能，可以使用 ESRGAN_4x 等模型提升图像品质。

如果你要超分 Anime 风格的插图，请直接使用 realesrgan 或者 realcugan 工具进行超分。

WebUi 辅助绘画指南

想要用 WebUi 改画或者手动添加元素？下面是一个小指南。

首先，IMG2IMG2 和 Inpaint 的效果是完全不同的。如果你不希望风格发生变动，不要选择 IMG2IMG2.

为了避免图片拉伸，尺寸上都应该尽量靠近原图尺寸，选择 Crop and resize 也就是裁切后调整大小

Masked Content

Masked content 相关设置确定在修复之前放置到遮罩区域中的内容，它决定了初始的参考内容 (origin 就是模糊之前蒙版的内容，而 latent nosie 是以噪声（很多随机色素点点做参考）。

latent noise 是确定 Ai 参考的内容，而 Denoising strength 可以理解为对参考的不参考度。

变动元素

如果需要变动元素，抠图，贴图，即可。

如果需要添加元素，我们可以通过 PS 给角色移植一个手让 Ai 来润色它，或者为没有下半身的半身像嫁接其他作品的下半身让 AI 润色它。

基于原图进行改动

使用 Inpaint, 主要场景是去除/替换。

首先要对人物边缘描细线，然后打上色块（如果有阴影，取亮色或者画全阴影）。变动强度选择较低的 0.3 左右的去噪（越低越接近输入的图片）。

然后使用 Img2Img Inpaint + 相关提示词修复，不满意可以再改，直到满意。然后对图像进行 realesrgan 超分，去除图像纹理。

嫁接图像

使用 PS 软件增删元素，然后重新生产。这可以解决画手的问题。

Ai 也接受其他成图进行嫁接（应用举例：解决躺姿没有下半身的问题）

多人物/单人物

打草图+IMG2IMG, 这就秘诀～

宽幅画作单人物生成最好打草图，进行色彩涂抹，确定画面主体。

多人物确定人物数量，最好使用草稿/有色 3d 排列 + 图生图。

人数超过三个就难以控制效果，人数大于 6 的图像模型里估计没有。..

进行手掌修复

将图片送入 inpaint，使用大致相同的提示词，将关于 手 的提示放在前面，根据你希望它变动多少来设置降噪（如果只是希望手更完整，调至 0.25 以下），然后保留步骤和 CFG 与 txt2img gen 相同。

或者仅遮住手部，以全分辨率修复，大大降低填充（它使用周围的像素来创建上下文，但只是在重新制作手部）并仅提示手部问题（详细的手部描写等）

CFG 越高，越符合提示词，降噪越高越偏离原图。

同人物&差分

我们可以使用 LoRA 训练出相似角色的风格模型，然后使用 VRoid 粗略的再现角色并导出为 VRM 格式，接着利用 UE5 的 Control Rig 功能来调整它们的动作，最后利用 Img2Img 方式生成这些拥有相同外表的人物。¹⁰

如果是表情或者是背景，可以采用进阶教程中的重绘画（部分 Img2Img) 技巧。

ControlNet

ControlNet is a neural network structure to control diffusion models by adding extra conditions.

https://github.com/Mikubill/sd-webui-controlnet

迭代草图 ⁵

这里讨论一下如何将手绘草图通过 Ai 绘画优化，注意不是二次元。

在第一次迭代中，不需要太多 Steps，CFG 可以非常低（以获得更好的多样化结果），如果不想完全丢失草图，Denoising 应该在 0.3-0.4 左右。

在最后的迭代中，增加 Steps 和 Denoising 强度（但不超过 0.8，否则图像将被破坏，尤其是在大于 512*512 时）请参见这里，同时根据需要提高 CFG 和尺寸。

你可以随时修复提示（添加或删除出现的细节）并尝试不同的采样器。

另外，你不应该在初次生成使用一个固定不变的种子？

如果你提供一个种子（而不是随机的 -1），你的图像很快就会变得过饱和、过度锐化、过度像素化。.... 当然如果想微调，可以使用固定种子。

色彩而不是线条

无论是 3D(DAZ 这样的 3D 模型）还是线稿，AI 只识别色彩，而不是线条，色彩直接决定图转图的效果。

如果你要修复线稿，那么降噪应该降低到 0.2.

遏制风格污染

介绍如何在 WebUi 中生成图片时，将主体作为重点，而不是画风。⁹

为了得到预期结果，我们将 style 改为 [style:10]

Automatic 1111 的 WebUi 提示词语法中，[x:10] 告诉稳定扩散直到第十个 step 再渲染这个提示词。

当达到 10 步的时候，一个基本的图像已经形成了，所以风格化肆意污染主体成分，而是像在现有图像上进行 IMG2IMG（你可以把它看成是 Img2img 的形式）

你可以根据你所做的整体步骤的多少来试验这个数字。如果你把格式改为 x:0.2，那么它就变成了百分比，[x:0.6] 告诉 SD 等到总步骤数的 60% 时再渲染 x ，以此类推。

尺寸影响

不应该将其与画质挂钩，尺寸一定程度上影响了主题，因为它潜在代表选择的类别（比如竖屏人物，横屏风景，小分辨率表情包居多）。

画质可以使用超分指南进行操作。

AiPhotoShop

通过 AiPhotoShop-无限外延画布的在线工具，你可以连续 “焊接” 作品，非常方便。只需要在启动命令加上 --api 参数，然后打开网页就可以使用。

不支持某些动漫模型的图像外延，因为它们不是 Inpaint 模型 (Sd 有专门的 Inpaint 模型。)

GitHub

琐碎的细节

表情符号

emoji(💰💶💷💴💵,🎊🪅🪄🎀,👩‍🚀) 表情符号也是可以使用并且 非常准确 的，经过我多次测试，Ai 可以认识表情符号。

emoji 因为只有一个字符，所以在语义准确度上表现良好。

表情符号参考

动漫风格

anime coloring 会有很好的效果，像动漫截图一样。（如果遇到黑白色，需要指定人物部件的色彩）

优化作品效果

对目标进行审视

想一想，自己想要的作品，在互联网上会被打上什么标签呢？

贴纸肯定不会打上 masterpiece, best quility, 吧。

另外就是如果要求的是像素作品，应该移除一些冲突的消极提示（如果有的话）。

顺序调整

在前面的词汇会锚定画面的色彩分布。什么重要什么放前面。

语义偏移防范

为了防止语义偏移，优先考虑 emoji, 然后少用不必要的 with 一类的复杂语法。

抠图？

扣过的图，其余背景都会被处理成黑色。

如果你需要背景，效果一般不是很好，建议填色后再操作。

保护图片不被分割线切割

消极提示加入

comic 2koma 3koma 4koma collage

应该可以改善。

跨领域术语

跨领域术语的核心逻辑就是缩小指定的数据范围，从画面内容之外的平台，领域，事件上入手来提升效果。

是的！你可以在提示中使用 Film Glossary FILM GLOSSARY 摄影术语， Cinematic techniques 摄影技术，以及绘画术语（类型）来控制基本情况。

跨领域！你甚至可以使用各种惊险运动的名词来生产一些特效。... 比如空降

比如，景深，光圈，构图，拍摄机位，运动元素，艺术摄影术语表中文介绍

但是这种效果可能会带来附加作用：引入你不希望见到的风格（如实景而不是而二次元）数据进入图片。把握好量度。适当增加 Step 和风格提示来改善。

你还可以使用平台名来限定数据集的范围，比如 pixiv 之类的词汇。

扩展阅读

推荐使用 Danbooru 含有的术语

Danbooru tag 组

有用的电影术语 https://en.wikipedia.org/wiki/Category:Cinematic_techniques

镜头类型 https://www.bhphotovideo.com/explora/video/tips-and-solutions/filmmaking-101-camera-shot-types

电视术语 https://en.wikipedia.org/wiki/Category:Television_terminology

摄影类型 https://en.wikipedia.org/wiki/Category:Photography_by_genre

摄影术语 https://zh.wikipedia.org/zh-cn/%E9%AB%98%E9%80%9F%E6%91%84%E5%BD%B1

极限运动 https://en.wikipedia.org/wiki/Extreme_sport

https://en.wikipedia.org/wiki/Category:Sports_by_type

构图艺术 https://en.wikipedia.org/wiki/Composition_(visual_arts)

复刻

如果想在生成上复刻，需要相同的 seed ，提示词，和其他参数（甚至尺寸）。不过如果对方使用了风格化，那么你就几乎无法复刻。

--自欺欺人式复刻：图转图，降噪拉到到 0.3 以下。..--

使用 Ai 进行设计

背景

拿到一张饱和度稍微高的照片后，可以用 AI 进行处理，然后当作背景使用。使用 anime coloring 来增强动漫风格。

图标

看这个

表情包

表情包效果真的一级棒。 sticker 配合西方颜文字完成度超高！

文档编写者试了一下，以下 prompt 可以出高质量表情包。

不要对贴纸要求质量提示词。

积极词汇

1girl,sticker,Chibi,Q,
white background,

masterpiece,best quality 可加可不加，质量不够就加

lowres 可加可不加，不够复古就加

Chibi 控制角色为 Q 版（大头小身），不够 Q 就加

sticker 是指定风格为社交软件贴纸，必须

消极词汇

bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, jpeg artifacts, signature, watermark, username, blurry, bad feet,3D

low quality 可加可不加，如果想更加平面化，请加入 3D 到负面提示。

尺寸要求正方形。

立绘

BV14e4y1U7r9

参数

为什么不去这里，看原始数据站点的参数呢？

E 站标签翻译项目

NAI 在使用的出图参数

使用全量模型（官方的 GPU 云特别强悍）
CLIP layer = 2
使用 ema 权重加载，将 yaml 配置其中的 use_ema 设置为 true
将 sigma noise/strength 重置为默认值 1
设定 eta noise seed delta 为 31337（使 sigma noise/strength 无需使用 0.69 / 0.67）
如果 prompt 有权重，转换权重（ WebUi 占比 1.1 ，NAI 占比 1.05）
使用 --no-half 参数启动程序（次要）

NAI 默认的模型设置

steps": 28, "sampler": "[sampler]", "seed": [seed], "strength": 0.69, "noise": 0.667, "scale": 11.0,

Strength ， noise 是 eta 和 sigma

scale 就是 CFG scale

NAI 默认的 SFW 消极提示词为

lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry

其他

将所有提示词前面加入 masterpiece, best quality

Clip 跳过 0，其他一切都很好（afaik 不要使用超网络、v2、yaml、VAE）

转换——NAI 和 WebUi(SD) 的增强语法不同

Prompts 参数括号转换

在 NAI 和 Webui 之间转换加强参数，相关的机器人服务 M2NM2NBot

元素法典

元素法典提供了一个即查即用的模板库（类比作文大全），里面有 Tag 的调试记录，方便快捷。

元素法典一卷

元素法典第一点五卷

元素法典制作委员会

良好参数（风格趋向插画）¹

{an extremely delicate and beautiful}

艺术家列表/SD1.4/1,833 位艺术家

艺术家博物馆

稳定扩散的艺术家风格研究

草图风格

词	描述
sketch	可以让图片看起来像随手画的草稿
{{lineart}}	可以让线条变得很粗
{{{posing sketch}}}, {{monochrome}}	黑白草图
{rough sketch}	上了颜色的草图
monochrome+lineart	情况下一般只会让眼睛上色，强调发色后头发也可以上色
{{{monochrome}}}, {{{gray scale}}}, {{{pencil sketch lines}}}	做出的铅笔速写的感觉

利用 sketch，pastel color，lineart 的 tag 模拟一张图的绘画过程

艺术风格

词	描述
chibi	可以画出低头身比的效果（二头身，三头身）
{{watercolor pencil}}	可以生成彩铅画
{{faux traditional media}}	可以做出签绘的风格
anime screeshot，	可以让画面变成动画风格
{{{retro artstyle}}}	赛璐璐风
{photorealistic}, {painting}, {realistic}, {sketch},	厚涂
pastel color 和 sketch	搭配会有速涂的质感

杂志/设定集风格

词	描述
official art	变得更加官方一点
three views from front, back and side 和 costume setup materials	可以用来生成设定图
multiple views	会出现类似设定图
{character sheet}	会出现设定图
magazine cover	会把背景换成杂志封面，配合 office art 更像真实杂志（虽然字没法看）
magazine scan	类似杂志内页的风格
posing	会强调有一个动作，不至于出现混乱的动作（露出有六个手指头的手）
caustics	画面向主题聚焦，类似海报

常用参数：SFW

人物数量	描述
数量	, one boy , one girl , two boy ,two girl,one_boy_one_girl（这是错误的）

人物画风	描述
质量提升参数	, masterpiece, best quality
原神	, Genshin Impact
萝莉	, female child , loli 画风差

人物样貌	描述
头发	hair
长发	longhair
短发	shorthair
眼睛	eyes
渐变颜色长发	gradient pink longhair
渐变颜色眼睛	gradient pink eyes
粗眉毛	thick eyebrows
猫尾巴	cat tail
猫耳朵	cat ears
动物耳朵	animal ears
毛茸茸的动物耳朵	animal ear fluff
刘海	bangs
两眼之间的头发	hair between eyes
眉毛后面的头发	eyebrows behind hair
锁骨	collarbone
斗篷（要在很前面才有效）	cape
乳房尺寸	small breasts
出汗	sweating
颜色丝袜（和长丝袜冲突）	white stockings , black stockings
长丝袜	thighhighs
女仆	maid
发带	ribbon
爱心眼	heart-shaped pupils
御姐/JK/辣妹？	gyaru
肌肉发达	muscular
天使翅膀（要是形容人的第一个才正常）	angel wings
颜色内裤（赠内衣）	pink underpants
肚脐	navel
颈部颜色项圈	white collar
黑色皮肤	dark skin
撕裂的衣服	torn clothes
撕裂的裤子	torn legwear
开襟夹克（配合叉开腿特色）	open jacket
异色瞳	heterochromia_blue_red
吊袜带（会和内衣冲突）	garter straps
靴子	boots
眼罩	blindfold
流泪	tears
项链	necklace
眼镜	glasses
比基尼	bikini
湿衣服	wet clothes
透明衣物	transparent raincoat , transparent jacket , transparent tshirt
唾液（自动伸舌头）	saliva
流口水（和唾液冲突）	drooling
水手服	sailor dress

环境样式	描述
在床上	on bed
光线反射	reflection light
赛博朋克	cyberpunk, city, kowloon, rain
在地毯上	on carpet
在瑜伽垫上（它分不清什么是瑜伽垫，只知道色块比较大，所以要配合 one girl 用）	on_yoga_mats

人物视角	描述
正面视角	from viewer
从上到下视角	from below
全身	full body

人物状态	描述
叉开腿	spread leg
露出腋下	armpits
举起手	hands up , arms up
爪子手	paw pose
站立	standing
行走	walking
吐舌头	tongue out
抬起腿	legs up
手放背后	arms behind back , hidden hands
衬衫	shirt
长袖	long sleeves
连帽衫	hoodie
褶边	frills
喇叭裤	bloomers
白色连衣裙	white dress
捆绑	bondage , bondage body , bondage foot , bondage hand
蹲下	crouch , squatting
真画风	photorealistic
跪下	kneel down
湿身	wet body

市场应用情况调查

这里是稳定扩散（非 NAI 模型）的应用情况。查看有关讨论。

3D

在 blender 上，Ai 有渲染插件

设计

Microsoft 365 工具套件
为 Age of Empires 3 Definitive edition 的游戏模组生成肖像
产品和架构设计/素描
画师裁切贴高光
漫画创作 @852
小说插图，AI 画背景（据说原版模型也很好用）

专辑图

用稳定扩散生成歌手的图像放入视频

配图

自媒体

视频平台有很多

服务

某些公司对开源项目进行再包装，以创作者社区的形式，对用户收取订阅费用。比如 XX 画廊，XX 版图。小程序多一些。
腾讯 QQ 小世界可以让用户使用 Ai 进行作画

NFT - ... ...

最后更新: 2023年3月16日 01:14:29
创建日期: 2022年11月2日 03:59:46