赛博炼丹师手记

本文提供了详细的炼丹（训练AI模型）指南，主要针对的是使用Lora模型进行个性化定制。文章首先介绍了丹炉（训练工具）的选择和下载方式，然后详细阐述了炼丹手法，包括前置准备、数据标注、开始炼丹和结果验收等步骤。在炼丹心法部分，作者深入讲解了炼丹过程中的一些重要参数，如步数、效率和质量相关参数，这些参数的设置会直接影响到模型的训练效果。最后，作者还提供了一些相关的参考文献，以供读者进一步学习和探索。

shenmingik

3473人浏览 · 2024-04-06 18:32:26

shenmingik · 2024-04-06 18:32:26 发布

文章目录

0. 丹炉安置
1. 炼丹手法
2. 炼丹心法
3. 相关文献

0. 丹炉安置

个人推荐b站up主朱尼酱出品的道玄丹炉，新手易懂，老手易用。

丹炉下载地址如下：

1. 炼丹手法

1.1 前置准备

首先我们需要准备好我们的底模和触发关键词，同时选择丹炉的风格（一些预制好的参数）。
收集20~30张的素材，对其裁剪为固定尺寸大小，然后上传到丹炉之中

注：裁剪可以使用如下网站进行批量裁剪：birme

1.2 数据标注

勾选【脸部加强训练】，点击预处理，即可进行AI自动标注：

注：勾选了之后就会再多裁剪出来一组只有脸的照片，这样AI能学到更多的脸部细节

在这里插入图片描述

点击【TAG编辑】，这里面就是形容照片的一些标签，右边是所有照片的标签，单独点击某一张照片就可以看到这张照片的标签。

注1：如果你想保留人物的某个特征，那就要把对应的标签删掉，这样AI就会默认这个人就是有这个特征
注2：如果你想灵活调整某个特征，那就要把这个特征打上标签

1.3 开始炼丹

点击【开始训练】即可开始炼丹。其中Steps”就是训练步数，每训练50步右下角就会出现一张图片，那样就可以实时看到Lora的泛化能力。

注：Loss可以用来参考模型的好坏，一个好的模型Loss值在0.07~0.09之间具体好不好还是要在Stable Diffusion实际测试才知道

请添加图片描述

1.4 结果验收

等训练完了之后，点击【模型】，就可以看到生成出来模型按照默认参数训练会出来N个模型，但不是说最后一个模型就是最好的。有可能炼到第六第七个模型就已经够了，再往后的模型就已经训练过度了。所以这些模型还要实际在SD测试一下，才知道哪个是最好的
在这里插入图片描述
选了Lora之后，我们就会在关键词的文本框里看到这串Lora的编号

然后把“000006”那段数值改成“NUM”，把最后的数字“1”改成“STRENGTH”，也就是权重的意思。

然后滑到最下面找到【脚本】，在脚本里面选择【X/Y/Z图表】，X轴、Y轴类型都选择【提示词搜索/替换】：

X轴的值输入：NUM,000001,000002,000003,000004,000005,000006,000007,000008,000009,000010

注：这里的序号对应的就是我们10个Lora的编号

Y轴值输入：STRENGTH,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9,1

注：这里的序号代表的是Lora的权重

在这里插入图片描述
最后点击【生成】，可以得到如下的图表，大家根据自己的需要选择合适的模型。

2. 炼丹心法

注：此章节主要会介绍有关lora 模型训练的超参数

炼制模型的本质是在如下的图像中，找到全局最低点（函数最优解）：
在这里插入图片描述

2.1 步数相关

丹炉的步数设置主要给我们暴露的时候如下的两个参数：

Repeat：学习步数，其指的是对于一张图片模型要学习多少次。

注：理论上学习次数越多，模型越能习得图片特征。但是这个数值并不是越大越好，当到达某个临界点之后，模型对图片认知就会得到固化，失去了创造能力。这就是模型训练之中的过拟合现象。

经验参数	Repeat
人物	80~120
风景	20~30
二次元	20~50

Epoch：模型训练循环次数。在每个epoch之中，都需要对一张图片进行Repeat次学习。

注：假如当前的 $repeat = 150, epoch = 15, image_{size} = 10$ ，则本次模型的总训练步数为 $repeat*batch*image_{size}=22500$

2.1 效率相关

BatchSize：模型一次参数更新中使用的样本数量。

注1：训练数据会被划分为多个小批次进行处理，每次处理的样本（图片）数量就是BatchSize。
注2：此参数会直接影响模型的内存占用和训练速度。假设每一步训练的时间是1s，总步数为22500，BatchSize为5，那么总得训练时间为： $(22500/5) * 1 = 4500 s$
注3：此时的模型训练Loss Function为BatchSize个样本结果的平均值，这以为着当BatchSize过大的时候，模型在每次更新时的梯度更新将更为平均，失去一定的拟合泛化能力。当前样本数量仅为20时，建议这个值不要超过4

Optimizer：优化器，其用于更新和调整模型参数以最小化训练误差的算法。优化器能够使用损失函数的梯度来指导模型参数的更新，从而帮助模型更好地学习和适应数据。

优化器	推荐	备注
AdamW8bit	1e-4	-
DAdaptation	1	常用作测试最优学习率
Lion	-	DA最优结果的1/3

Save Every N Epochs：每N轮保存一个模型。

注：假设其值为1， $Ep oc h = 15$ ，则每个Epoch结束之后都会保存一个模型，总共会保存15个模型

Lr Scheduler：学习率调度器，用于动态调整学习率，避免模型训练中得到局部最优解。

调度器	解释
constant	恒定学习率，此时学习率为静态学习率
constant with warmup	带预热恒定学习率，前期会有一个预热抬升，帮助AI在不熟悉训练集的时候慢慢接触，防止掉入局部最优的陷阱
cosine	余弦退火，一开始给出较高学习率，后期使得学习率更加平稳的降低，帮助跳出局部最优
cosine with restarts	余弦退火重启，每隔几步会重启