您需要 登录 才可以下载或查看,没有账号?注册
x
导语
想要入门AI绘画,首先你需要了解它的原理是什么样的的,早几年就有学者对深度学习模型展开了对图像生成的研究。但是那个时候技术还不成熟,生成的图像很模糊,甚至很抽象。直到近两年,AI产出的内容才开始变得高质量且更具稳定性,也开始有一点审美了。这个时候才满足了人类AI绘画的要求。
原理简述
AI绘画并不像人类绘画那样,,打草稿、勾线描边、再去上色、填补细节,这样形成一种固定思维。它采取的是人类不曾设想的方法,就是Diffuion-扩散。换句话来说就是把眼睛眯起来,看到的图像就是AI初步处理的结果,再通过AI学习的模型将模糊的画面变成想要的风格。每学一张图,它就会通过一些方式提取图像里的信息特征,并和原图建立关联。
当提出二次元这个话题的时候,相信你的脑海里也会跳出某个符合特征的画面,因你看过并且记得。AI绘画同样如此,将基础的图像扩散(增加噪点)然后再根据想要的风格(去除噪点)。这样一来,画面就被重新绘制了。
这就是AI绘画基础的理论和思想。在后续的学习里,你所能接触的提升词、各种模型和ControlNet等,都只是控制Ai的学习、转化、去噪过程,而不是一笔一画的动作。因此,与其叫做AI绘画,不如说这个是“AI图像生成”。
当然,以上都是简单的比喻,在真实的绘制中,这个过程会复杂的多。比如图片需要先经过潜在空间进行压缩,经过对比式的语言-文字预训练来实现内容匹配,然后借助对抗神经网络提高学习精确度。
工具和配置需求
SD简介市面上大部分的主流AI绘画产品,基本都是在使用这种原理来生成图片。那作为一名AI绘画的初学者,学习什么软件好呢。市面上有很多可以应用AI绘画的软件,例如DALL.E、Midjourney、NOVEIAI等,但它们中大部分都依托云端服务器来运行,效率不高且一部分还需要支付会员费用来购买出图次数。
在2022年的8月,一款叫做Stable Diffuion的应用横空出世,通过算法迭代将AI绘画的精细度提高了一个新的台阶。并且能够在数秒内完成产出,还可以在任何一台有着“民用级”显卡上运行。你可以在它的帮助下,轻松绘制出各种风格的作品。比如动漫风、插画立绘、国风水墨、3D建模甚至是照片级的拟真图像。
而借助LoRa、ControlNet等衍生功能,AI还可以做到精准控制美术风格、角色细节、姿势、动作、构图等。最重要的一点,它是全面开源的,这意味着你可以在自己的电脑上部署整个程序。使用它出图、作画完全免费而且不限制数量的。市面上大多数商业级的AI绘画应用,都是基于SD去开发的,只要你掌握了SD,就能得心应手地使用任何一款门槛比它低的工具。
配置要求
尽管SD非常亲民,但它还是有一定的配置要求,它只能在Windows或者Mac的系统上运行。其次它需要一张强大算力的独立显卡来支撑算力进行绘制,这里推荐Nvidia英伟达的显卡。或者你有一台能打大型3A游戏的电脑,基本上就可以用来跑AI了。但是这里提一嘴,跑得动和玩得爽是两个概念,不同的显卡对AI绘画出图的效率影响是非常大的。以下是不同显卡绘制同一张图的时间,大家可以做个参考。
我自己用的显卡是才换的4090,出一张512x512的图差不多两秒左右。如果你的显卡性能不够,其实不建议在这个阶段进行学习,硬件上的东西是没办法靠自己学就能解决的。而且通过AI绘画生成自己满意的图需要反复尝试和调节参数,如果出图效率低,你会把许多时间浪费在漫长的等待中,还有可能面临时不时宕机的情况。
另外,影响AI绘画的另外一个比较重要的因素是显存,显存影响的是你可以绘制的图像最大分辨率大小。简单来说,如果你的显存不够大,想生成过于清晰的图像是比较困难的。这里推荐显存最好超过8GB
WebUI及前置软件安装
那么,去哪里下载Stable Diffuion这个软件呢?和大部分软件不一样的是,Stable Diffuion并不是一个真正意义上的软件。最早他被开源出来的只是一团外行人看不懂的源代码而已,这里就不得不提一下GitHud上的一位叫做Automtic1111的开发者,他将这些代码做成了一个基于浏览器网页运行的小程序,就是我们常说的Stable Diffuion WebUI了,因此SD的操作性变得更通俗易懂了一点,目前开源社区90%以上的拓展插件都是基于这个来研发的。
接下来涉及到一些软件安装的步骤,这里推荐直接下载国内大佬(我用的是秋叶大佬的)的安装包。文章底部链接我会放安装包的链接,大家自行下载就行了。下载好安装包之后,第一步,解压sd-webui-aki-v4.2.7z文件。
运行启动器运行依赖库
点击A启动器运行文件会弹出一个SD-WebUI启动器窗口,点击一键启动,然后会有一个控制台窗口,等控制台窗口运行好就会在默认浏览器中自动打开一个网页版AI。浏览器中打开的网页,只是一个操作界面,而命令行里的这些东西才是你的程序本体,进行绘画的全程你都需要保持它的开启,结束后再关闭。
运行Stable Diffuion需要占用你系统一定的GPU性能与显存,所以在使用时尽量关闭无关的软件。
SD WebUI基础操作指南
接下来进入实操环节,当你在浏览器里打开这个WebUI以后,就可以利用它开始作画了。
我们作图一般是用前两个,文生图与图生图,它代表两种进行绘制的基本方式。这个在下一期会详细给大家讲,而第三个Tab的更多主要用于对图片进行AI放大处理,它可以让你生成更清晰的大图。这个在之后的篇幅里也会细说,点击设置,你可以设定与绘画相关的选项。例如:图像的保存路径、采样参数等等。在刚上手的阶段,保持默认就可以满足绘画需求了。而旁边的扩展菜单主要是用来安装和管理一些额外插件的,接下来我们动手生一张图吧,生完就知道它大概是怎么一回事了。
首先,查看你的界面左上角,这里有一个选择Stable Diffuion模型的选项,我们需要去到模型网站下载自己需要的模型(一般在C站上下载),不同的模型生成的图风格差异会很大。
一般模型会放在这里
安装好模型之后,刷新一下页面,点击加载你下载好的模型。接下来我们点击文生图(输入一段文字,根据你的文字生成一幅图片)。
输入正向提示词(Prompts)例如(masterpiece,(masterpiece, top quality, best quality),Chinese clothing,outdoors,),提示词分为两种,一种是正向提示词,你想要画面呈现什么样子。另一种是反向提示词,想要避免画面出现的。
反向提示词例如(Dark skin,((nsfw:1.3)),(EasyNegative:1.3),(badhandsv5-neg:1.5),(ng_deepnegative_v1_75t:1.2),(worst quality:1.5),(low quality:1.2),watermark,username,text,(cameltoe:1.3),((realistic:1.3)),((long pointy ears:1.3)),((forehead:1.3)),((watermark:1.3)),(((animal ears:1.3))),jacket,)
将提示词都输入好以后,还需要调整下面区域的一系列参数来定义图片的尺寸、规格和生成方式。
设定好以后,点击右上角的生成,等待程序加载,这样就是你用AI画出来的第一幅作品了。如果效果不是你想要的,这个时候你就需要像无情的甲方一样,向AI提出自己的需求,也就是修改提示词。这样就可以得到你想要的画面了。尝试修改了正向TAG::masterpiece,(masterpiece, top quality, best quality), woman, Chinese clothing, red hair, red clothing, outdoors, 得到下面两张不一样的图。
在生成完所需要的AI图后,不需要自己去单独保存,在这里有一个无边图像浏览,你可以按照类目查看自己生成的所有图像,想要导出来只需要右键保存就可以了。
总结
接下来的文章中我会持续更新更多的AI小干货,让大家能够学习到AI的精髓。精确控制人物的发色、服饰、画面构图、风景等,今天我们就到这里了。
SD的下载安装包链接:https://pan.baidu.com/s/1-5FrJo71y8yC4_2p129xcw?pwd=yyds 提取码:yyds
|