大家好,我是灵魂画师向阳

一、什么是“隐藏字”?

废话不多说,上图!

我不说,你能看出来这张图片有字吗?

很多人可能觉得不可思议,这张图哪来的字啊?就一张正常的图而已。而有些人可能依稀觉得是有文字的,但是又说不出来到底是什么。

让我们换种方式看这张图片,我们眯一下眼或者让眼睛失焦,又或者把手机放远点,都有助于我们看清图片中隐藏的文字。

这时候你应该看清楚了吧?还看不到?往下看!

↓↓↓

图片中的文字应该可以看得很清楚了吧!没错,就是 New York!是不是很神奇?

所以什么是隐藏字就不难理解了,就是通过光影明暗或颜色差异,使得文字与图片内容完全融合。在近距离观看图片的时候很难感知到文字的存在,而当距离拉远或将图片缩小时,图片中的文字就会变得非常清晰,而这就是所谓“隐藏字”能达到的效果。

为什么会这样呢?原理也不难。当我们近距离观察图片时,由于文本信息隐藏在复杂的画面元素中,我们的注意力都被这些画面元素所吸引,因此很难识别出文字。就如上图,我们的注意力都在建筑、鲸鱼和水面上了,很难注意到图片中的文字信息。而当远距离观察或将图片缩小之后,我们就会更加关注图片整体,凭借我们对文字信息以及对图片明暗和颜色的敏感程度,就不难发现图片中存在的 “隐藏字” 了,就如下图。

读到这里,相信你对 “隐藏字” 效果有了比较全面的认识,那么下面这张图里面的文字是什么,你能看出来吗?

二、如何实现?

让我们动动小脑瓜子好好好想想有什么方式可以做到这种效果。

当我们说需要生成某某效果图片的时候,其实就意味着我们需要限定图片的生成范围。对于 SD 模型来说,限定图片生成范围的方法最主要的是通过文本,毕竟SD本身就是一种文生图模型,但是我们都知道 SD 模型很难直接生成文字,更别提生成更高级的“隐藏字”效果了,因此如果想只通过提示词来达到这种效果几乎不可能;另外就是通过使用图片引导的方式,这是一种更加具体的限制图片生成范围的方法,往往控制效果更精确。对于一个需要精确控制图片内容的任务来说,通过图片引导是最好的方法。

比如生成“隐藏字”就是一个****精确限定输出的范围的生成任务。为什么这么说?因为我们想让图片中出现文字,而这个文字是我们指定的,甚至文字大小、字体等都是明确的,这是一个有特定目的的生成任务。

就拿本文的第一张图片来举例,我只想生成带 “New York” 隐藏字的图片,不想要其它文字,我们的目的很明确,就是生成带有该文字信息的图片。

那么很显然,写有 “New York” 的图片是必须的输入。

而说到能利用图片为限制条件引导SD生成特定图片的方法,你会想到什么?ControlNet 就呼之欲出了吧?

同样的方法还可以用来生成 “隐藏logo”,“隐藏二维码”,甚至是 “隐藏坤”…

不过好些人开始自己捣鼓的时候,可能会发现生成图片中的文字不怎么“隐藏”,比如下图,一眼就能看出来图片中的字体为“AI绘语”。我们可以将这种称为“艺术字”,但绝对不是“隐藏字”。

那么如何生成下图所示的“隐藏字”效果呢?认真往下看吧!

三、必要的工具

工欲善其事,必先利其器。必要的工具还是需要先准备妥当的。

**1、SD WebUI **

Stable DIffusion的图形界面是在网页当中打开的,所有的功能都被集成在网页当中,不管是提示词还是插件使用,亦或者图生图,一键蒙版,都是在Stable Diffusion的网页中进行的。

2、ControlNet

CotrolNet 是Stable Diffusion的插件,除了制作“隐藏字”,其应用方面非常广泛,是SD的必备的插件。插件下载安装请看文末扫描获取

3、ControlNet 模型

这里需要使用一种比较独特的 ControlNet 模型,对于生成“隐藏字”任务来说非常合适。此模型不是官方模型,因此需要额外下载。

模型下载地址:https://huggingface.co/monster-labs/control_v1p_sd15_qrcode_monster/resolve/main/control_v1p_sd15_qrcode_monster.safetensors
(如无法下载,请看文末扫描获取)

配置文件下载地址:https://huggingface.co/monster-labs/control_v1p_sd15_qrcode_monster/resolve/main/control_v1p_sd15_qrcode_monster.yaml
(如无法下载,请看文末扫描获取)

下载的模型和配置文件放在 \AI-stable-diffusion-webui\extensions\sd-webui-controlnet\models 或者 \AI-stable-diffusion-webui\models\ControlNet 路径下。注意两个文件要放在相同的文件夹。

四、生成步骤

1、准备一张文字图片。 黑底白字为佳,如下图所示。

2、设置 ControlNet 面板。 将准备的图片上传,其它参数设置如下。不需要选择预处理器,模型选择 control_v1p_sd15_qrcode_monster。模型强度设置为 1.2 以上。

3、输入提示词。根据自己的喜好输入不同的提示词。以下是我是用的提示词。

正向提示词:(cyberpunk_street), (neon-drenched alleyways), (holographic advertisements), (flying drones), (futuristic vehicles), (blurred faces in the crowd), (cybernetic implants), (glowing cyber eyes), (smoky steam vents), (rain-soaked pavement), (reflections on wet surfaces), (gritty urban decay), (virtual graffiti), (augmented reality billboards), (data streams in the air), (hovering delivery bots), (electronic music pulsating in the background), (stray electric sparks), (hidden hackers’ symbols), (mysterious shadows lurking in corners)

反向提示词:cartoon, anime

4、设置图片参数。图片尺寸设置为参考图大小,种子值设定为-1

5、点击生成。开始抽卡,直到抽到合适的图片位置。需要注意的是,如果一直抽不到自己想要的感觉,可以试着提高 ControlNet 模型的权重,也可以更改提示词,直到生成你想要的效果。

生成效果如下图所示。近距离看可能看不出来文字效果,将手机的距离拿得稍远一些,或者让眼睛失焦就可以看得很清楚了。

↓↓↓

更换参考图后得到下图,其中的“AI绘语”的文字还是相当明显的。

↓↓↓


五、参数设置

要想获得不同的效果,可以通过修改以下参数来实现。

1、参考图

参考图中的文字大小和字体粗细要合适。注意不要使用太细的字体,比如下图所示。“绘语”两个字就隐藏得太深了,很难识别出来。

稍微粗一点的文字出图的效果会更好。比如下图,眼睛稍微失焦就容易识别出来。

但有些人可能比较倔强,就想要用细的字体去生成“隐藏字”图片,那怎么办?答案就是设置 ControlNet 的强度。

2、ControlNet 强度

其它设置相同的条件下,ControlNet 强度越高,图片中的文字越容易被看见。强度设置为 1.0 时,“隐藏字”的效果往往很难被发现,即使是将图片缩小很多也是如此,因此建议将强度设置为稍高一点,比如1.2,否则眼睛看烂掉都不一定能看见图片里藏的文字到底是什么。

如果你的字体比较细,但也想拥有“隐藏字”效果,那么就需要将 ControlNet 的强度设置得更高,比如2.0。效果如下图所示。

ControlNet的强度设置很有意思,强度越低就需要将图片缩得越小才能识别出图像中的文字,也意味着需要距离越远才能看清。因此,可以通过设置不同的强度来决定图片文字的隐藏程度。

↓↓↓

3、提示词

不同的提示词对画面的影响是最大的,可以更换不同的提示词来获得不同的效果。

↓↓↓

↓↓↓

4、总结

我们在使用 stable diffusion 的时候需要注意,参数很少永远是固定的,而是需要灵活地设置。例如对于不同的提示词,我们可能需要更改 ControlNet 强度,而不是一直使用相同的设置。其它参数发生改变之后也是同理。

写在最后

感兴趣的小伙伴,赠送全套AIGC学习资料,包含AI绘画、AI人工智能等前沿科技教程和软件工具,具体看这里。

AIGC技术的未来发展前景广阔,随着人工智能技术的不断发展,AIGC技术也将不断提高。未来,AIGC技术将在游戏和计算领域得到更广泛的应用,使游戏和计算系统具有更高效、更智能、更灵活的特性。同时,AIGC技术也将与人工智能技术紧密结合,在更多的领域得到广泛应用,对程序员来说影响至关重要。未来,AIGC技术将继续得到提高,同时也将与人工智能技术紧密结合,在更多的领域得到广泛应用。

在这里插入图片描述

一、AIGC所有方向的学习路线

AIGC所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。

在这里插入图片描述

在这里插入图片描述

二、AIGC必备工具

工具都帮大家整理好了,安装就可直接上手!
在这里插入图片描述

三、最新AIGC学习笔记

当我学到一定基础,有自己的理解能力的时候,会去阅读一些前辈整理的书籍或者手写的笔记资料,这些笔记详细记载了他们对一些技术点的理解,这些理解是比较独到,可以学到不一样的思路。
在这里插入图片描述
在这里插入图片描述

四、AIGC视频教程合集

观看全面零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。

在这里插入图片描述

五、实战案例

纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
在这里插入图片描述

若有侵权,请联系删除
Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐