


“图生图”,是AIBox里面的一个超牛的功能。基本上它能做的事儿就是拿一张现成的图,再加上几个咱们指定的关键词,然后就能变出一张全新的、改头换面的图片。无论是工作上需要点创意,还是生活中想找点乐子,这个功能都挺给力的。
别光听我说,咱们赶紧来看看它到底能施展出什么样的魔法!今天的文章里我会为你详细介绍图生图的工作原理和图像重绘的应用方向及AIBox图生图功能区域。
1. 传统意义上的喂参考图
我们都知道,模型在运算时是根据我们提供的提示内容来确定绘图方向,如果没有提示信息,模型只能根据此前的学习经验来自行发挥。在之前的文生图篇,我们介绍了如何通过提示词来控制图像内容,但想要实现准确的出图效果,只靠简短的提示词是很难满足实际需求的。
AI 绘画的随机性导致我们使用大段的提示词来精确描述我们想要的画面内容,但毕竟文字能承载的信息量有限,即使我们写了一大段咒语,模型也未必能准确理解,不排除有时候还会出现前后语义冲突的情况。其实这个过程就像甲方给我们明确设计方向,除了重复沟通想要的画面内容外,有没有什么比口述更高效的沟通方式呢?这个时候,有经验的甲方会先去找几张目标风格的竞品图,让我们直接按照参考图的感觉走。
「感觉」这个词听起来似乎虚无缥缈,但在 AI 绘画领域是有实际道理的,因为图像能承载的信息要比文字多得多。以上面这张图为例,如果用提示词描述,可能写上几百字都难以向模型解释清楚画面的内容,但图生图不同,模型会自动从参考图上提取像素信息,并将其作为特征向量准确映射到最终的绘图结果上,通过这样的方式能最大程度还原参考图中的提示信息,实现更稳定准确的出图效果。
因此,传统意义上的图生图就是将提示词和参考图中的图像信息进行综合考虑并进行绘图的过程。
2. 真正强大的图像重绘
当然,如果仅仅是喂图功能,AIBox的图生图板块并不值得我们单独花一篇文章来讲解,它的真正价值在于提供了丰富的操作工具将图像可控性提升到了新的层次。
我们先来回顾下平时使用文生图进行 AI 绘画的过程:编写提示词进行绘图,然后根据出图结果再不断优化提示词和各类参数进行抽奖,最终得到一张比较满意的图片。而图生图则是直接根据现有图片进行优化调整,因此图生图的操作过程可以简单理解成省去了前期文生图的抽奖过程,直接在现有图像约束的基础上进行的二次重绘。
需要注意的是,配合参考图进行图生图的过程是需要将参考图先逆向推导为潜空间的数据,再和提示词综合考虑绘制成图像。因此相比没有逆向推导过程的文生图,图生图的绘制会占用更多的系统资源,根据这个原理,我们也就能理解使用参考图的尺寸越大,在逆向推导的过程中消耗的资源也会越多。
在 AIBox的图生图 中,我们可以通过蒙版和局部重绘等功能来控制只对图像特定部分的区域进行重绘,并设置各类参数来控制重绘的效果。此外通过选择不同的绘图模型和调整图像尺寸,我们也能甚至还能实现画风转换、图像无损放大等更多玩法。相较于其他 AI 绘画工具,AIBox 中的图生图并非单纯的喂参考图,而是可以在现有图片的基础上通过人工干预来实现更加稳定可控的图像重绘。
在 AIBox 中的图生图模块,我们可以看到它的页面布局和文生图基本类似,同样有提示词输入框、操作按钮和参数设置项,不同的是这里多了局部重绘、提示词AI分析和对应的参数设置项。
1.局部重绘工具
简单的说是不改变整体图片的构图的情况下,利用蒙版进行区分需要处理的区域以及不需要处理的区域,比如我给她换脸,换件衣服等。
效果:
2.蒙版边缘模糊度
当蒙版模糊的数值越低,蒙版外部的像素在蒙版内占比越低,数值越高,外部像素在蒙版内占比越高,简单理解就是模糊度越高,蒙版边缘会更加柔和,重绘时边缘区域与原图衔接会更加自然,但是模糊度过高也会导致边缘区域重绘效果变弱,所以需要根据蒙版区域大小和过渡效果反复调试。
3.蒙版生效区域及重绘区域
蒙版生效区域:
蒙版区域,绘制蒙版内容,也就是绘制被蒙住的内容。
非蒙版区域,也就是绘制没有蒙住的部分。
重绘区域:
重绘蒙版区域,只绘制需要重绘的部分,然后放入蒙版。
重绘全图保留蒙版区域,会先重绘整张图片,最后出图时再替换到原图中。
在上图图中可以清楚的看到,当重绘区域设置为「重绘蒙版区域」时,绘制的部分只有涂抹的蒙版部分区域的元素,相当于把涂抹区域切割下来单独进行重绘,该选项下会打断选区和参考图其他部分的联系,最终画面的融合效果可能会下降。
注意:如果你选择绘制[非蒙版区域]又选择了[重绘蒙版区域],大概率会出错。
4.重绘蒙版边缘预留像素
该参数只在重绘区域选择了「仅蒙版区域」时生效,用于控制切割下来重绘部分向外扩展的范围大小。观察下面重绘过程的进度图可以发现,边缘预留像素的数值越大,则绘制过程中会向四周裁剪更多的内容进行整体重绘。
在默认情况下局部重绘会参考全图进行绘制,并且被涂抹的范围并不代表都会发生变化,所以通常我们会在目标区域基础上对外再涂抹一部分区域,以保证重绘后更好的融合效果,而提高边缘预留像素也是同样的原理。
5.重绘方式
填充:自由发挥,与原图的蒙版内的元素没有任何关系,主打的就是按照提示词天马行空。
原图:受限于蒙版内的元素,会根据提示词和蒙版内的元素共同合作创作。
潜在噪声:自由发挥,不受限于原图元素,但是细节会更加丰富。
在上图我们可以看到,和原图的相似度从大到小进行排序:原图->填充->潜在噪声。
在今天文章里,我为大家介绍了 AIBox 中图生图的作用、各类工具和参数的功能解析。相比于文生图的一步成型,图生图更多是碎片化的使用思路,需要通过不断的修饰和调整局部细节来得到我们想要的图片。
在下篇文章中我会为你详细介绍AIBox 中图生图模块中的AI分析原图片提示词、重绘幅度等功能以及如何通过文字去控制原本的图片进行二次创作,从而减少图片生成的随机性,更好的满足我们的需求,今天文章就到这里结束啦,我们下期再见!
请关注我们的频道:
机器人: AI工具箱AIBox