最近给家里的小朋友用 SD(Stable Diffusion) 生成卡通头像,顺便记录一下 SD 的基础使用教程。

教程目录

  1. SD 安装与部署

  2. 认识模型和插件

  3. 基础使用教程

SD 安装与部署

SD 安装和部署可以分为本地和云端。本地安装对电脑配置有一些基本要求,云端安装对电脑要求不高,但是云端服务商会收取使用费用,两种方法各有优劣。

本地电脑安装配置最核心的关键点:显卡、内存、硬盘、CPU。其中最重要的是显卡。

显卡:N卡(英伟达Nvida独立显卡)首选,效率远超集显/AMD/Intel显卡和CPU渲染,最低10系起步,体验感佳用40系,显存最低4G。建议 3060 8G 以上。
内存:内存最低8G,越大越好。
硬盘:建议使用固态硬盘,可以加快模型加载、切换速度。
系统:支持 Win10/Win11/macOS(仅限Apple Silicon,Intel 版本的 Mac 无法调用 Radeon 显卡)和 Linux 系统,苹果版 SD 兼容的插件数量较少,功能性不及 Windows 与 Linux 电脑。

如果没有合适的电脑可以考虑购买使用云端主机。若无法使用独立显卡和云服务,也可修改本地软件启动配置,使用CPU渲染(兼容性强,出图速度慢,需要16G以上内存)。或者使用第三方免费的体验产品。比如 LibLib ,每天可以免费生成 100 张图片。

本地安装与部署

目前普遍采用的 SD UI 是 Github 上的 Python 项目,在使用时需要对项目项目在不同的电脑和系统上编译源码,这需要使用者拥有一定的程序开发经验,所以这里我们直接使用 B 站秋叶大佬的整合包,直接安装使用。

1**.软件下载
**百度网盘:https://pan.baidu.com/s/1dl_ON9Yb4En8hW9WsicEng?pwd=y8cb 提取码: y8cb

2**.软件安装**

- 下载后,解压文件,首先安装运行依赖。

- 解压 sd-webui-v4.2

在刚刚解压的文件夹内找到启动器,双击后可以启动。

软件启动后,点击右下角的 “一键启动” 。

点击后会跳出如下界面,等待加载一段时间后,会自动跳转到网页操作页面。

云端安装与部署

云端服务厂商比较多,如果只是平时使用,不作为生成工具建议直接使用 第三方免费体验的功能。我这里免费体验使用的是 LibLib, 每天可以免费生成 100 张图片。

认识模型和插件

在使用 SD 中,我们需要了解大模型,LORA,另外还有 VAE ,hypernetworks(超网络模型),Embedding(嵌入式模型)等的一些常见基础知识。

模型

**- 大模型
**Checkpoint 是 SD 的核心,是最基本的必备模型,体积较大,也被称为大模型。越大的模型代表融合的元素越多,表现的效果细节越丰富。不同的大模型使用不同的图片训练而成,对应不同的风格,相当于最底层的引擎。我们在模型网站筛选 Checkpoint 就是筛选大模型。

大模型后缀分两种,ckpt 和 safetensor 。
一般 ckpt 融合的数据多一点,safetensor 融合的数据少一点,模型侧重不同,各有优略,不代表好坏。
模型存放位置:\models\Stable-diffusion
本地和云端部署模型在 SD 存放位置都是一样的。

- Lora

为某一风格特色的细分,是特征模型,体积较小,使用大模型后需要加一些独特的风格,就可以找这种风格的 Lora,或者自己训练。

多个 Lora 模型混合使用可以起到叠加效果,譬如一个控制面部的 Lora 配合一个控制画风的 Lora 就可以生成具有特定画风的特定人物。因此可以使用多个专注于不同方面优化的Lora,分别调整权重,结合出自己想要实现的效果。

lora的后缀:safetensors。

模型存放位置:\models\Lora
本地和云端部署模型在 SD 存放位置都是一样的。

**- VAE
**VAE 模型类似滤镜 + 模型微调,对画面进行调色与微调,一般需要搭配相应的模型一起使用。(如果图片比较灰,颜色不太靓丽,就可能是没加载对应的 VAE)
模型存放位置:\models\VAE
本地和云端部署模型在 SD 存放位置都是一样的。

- Textual inversion(Embedding)

关键词预设模型,即关键词打包,即等于预设好一个关键词打包,进而来指代特定的对象/风格。比如在描述一个叫 Jam 的人物的关键词时可以把描述词打包成 Jam。
模型存放位置:\models\Embedding
本地和云端部署模型在 SD 存放位置都是一样的。

- hypernetworks(超网络模型)

Hypernetwork 是一个比 Lora 更早的模型微调技术,现在使用的人数越来越少。

模型存放位置:\models\hypernetworks

本地和云端部署模型在 SD 存放位置都是一样的。

模型下载

模型下载模型下载的渠道很多,一种是网站下载,一个是本地部署的启动器内下载。

===

1.网站下载模型网站很多,这里主要介绍 2 个:

国内 - 哩布哩布:https://www.liblib.ai

=====================================

每个模型详细页面也有模型的参数、使用建议和效果图的具体信息,包括正反提示词,使用的什么模型,以及参数细节。

===

国外 - C站:https://civitai.com

备注:需要魔法访问

2.启动器下载,可以在启动器模型管理选择对应的模型直接下载。

模型切换

插件安装

众多开发者针对 SD 的应用开发出来的插件,使得 SD 的应用门槛降低,也增加了很多的玩法,插件的应用是 SD 的一大特色。

插件我们一般分为两种,辅助类和控制类。

插件存放位置:\extensions

本地和云端部署插件在 SD 存放位置都是一样的。

===

可以从 https://gitcode.net 下载相关的插件。

输入 SD-webui 查找对应的插件。

如果需要更新插件,可以在本地启动器中更新对应的插件。

基础使用教程

SD 涉及的内容较多,这里我们使用 https://www.liblib.art/sd 中的文生图做基础教程。进入操作界面,选择一个合适的大模型。

在 Lora 中选择自己喜欢的小模型。

输入正向提示词
正向提示词的作用简单来说就是告诉 SD 根据我的描述出图。注意正向提示词只支持英文。这里我们以生成一个男婴儿为例:

提示词我们写:
一个男婴,襁褓中,闭着眼睛,黄色的阴影,一个毛茸茸的玩具,短头发,上半身
我们需要将以上中文翻译成英文:
A male baby, baby, swaddling, eyes closed, shades of yellow, a furry toy,short hair,the upper part of the body

输入负向提示词
负面提示词的作用,就是告诉 SD ,我不要这样的效果,比如我们在负面提示词输入多余的手指,就是告诉 SD 在生成的图中,不要出现多余的手指。实际使用的过程中,很多开发者已经将导致出图质量差的负面提示词都做成模型,所以一般的情况下,我们只需要照搬一些负面提示词模板就可以。
比如:
(worst quality:2), (low quality:2), (normal quality:2), lowres, ((monochrome)), ((grayscale)), bad anatomy,DeepNegative, skin spots, acnes, skin blemishes,(fat:1.2),facing away, looking away,tilted head, lowres,bad anatomy,bad hands, missing fingers,extra digit, fewer digits,bad feet,poorly drawn hands,poorly drawn face,mutation,deformed,extra fingers,extra limbs,extra arms,extra legs,malformed limbs,fused fingers,too many fingers,long neck,cross-eyed,mutated hands,polar lowres,bad body,bad proportions,gross proportions,missing arms,missing legs,extra digit, extra arms, extra leg, extra foot,teethcroppe,signature, watermark, username,blurry,cropped,jpeg artifacts,text,erro

采样方法/Sampling method
SD 采样器是一个特色,简单的理解就是用不同的方法去生成图片,区别就是出图的质量,速度,稳定性等,后期熟悉以后可以自己测试不同采样方法的不同效果。

采样步数/Sampling steps
可以理解为生成图片的精度和质量,步数越高图片精度和质量越好,但是相对速度也越慢,摄影图一般选择步数在 20-30,如果过高也会导致图片过于拟合。

设置图片比例和生成数量
图片比例很好理解,就是生成图片的宽高比。
生成数量分生成批次,和每批数量。批次就是生成几批,而每批数量就是每一批次出多少张图。

生成/Generate参数都设置好以后,我们就可以点击生成,稍等后我们可以查看生成的图片。


生成图片,可以点击放大右键保存,也可以点击下方的保存按钮。
生成图片后还可以通过修改提示词和其他参数重新生成想要的图片。
AI绘画SD整合包、各种模型插件、GPT人工智能学习资料都已经打包好放在网盘中了,有需要的小伙伴文末扫码自行获取。

写在最后

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

感兴趣的小伙伴,赠送全套AIGC学习资料和安装工具,包含AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除
Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐