Created
Jul 21, 2023 07:22 AM
Tags

前言:

关于图片的处理,目前就我所知主要分为两大功能,第一是根据文字描述生成相关图片也就是AI绘画功能,第二是根据现有图片实现变换也就是AI编辑功能。

Example 1:

有下面一段描述 ,AI根据下面的描述生成右边图片:
notion image

Example 2:

上传给AI左图,AI改写将其成右图:
notion image
notion image
tips:这几个举例均由open ai的图片生成模型DALL·E提供的api所生成(在使用这些模型时描述的话语最好使用英文,这样可以避免AI对描述有误解)。
 
AI绘画功能目前比较主流的方案个人感觉有三个:
  1. midjourney:https://www.midjourney.com/
  1. stable diffusion:
    stable-diffusion-webui
    AUTOMATIC1111Updated Oct 30, 2023
  1. DALL·E:https://labs.openai.com/
这里简单分析一下三者的优缺点:
midjourney生成的图片质量不错,但价格有点贵,支持AI编辑功能。目前只有在线版本,付款方式是月度、年度的会员制。stable diffusion是一个集成工具,既支持AI绘画功能,也支持AI编辑功能。它可以集成一些网上的AI生成模型。缺点是,若在本地搭建,对硬件有一定要求(内存最低16G,显存最低4G),但可以考虑使用云服务器代替本地部署。stable diffusion已有在线网站,有一定的免费额度。DALL·E可以使用官方的在线网站生成,也可以调用openai提供的API生成。在线网站并不提供AI编辑功能,但调用的API提供了这两个功能。缺点还是一样,价格有点贵,按生成的图片数量收费。

方案的具体实现:

Midjourney:

访问上面的官网链接:
notion image
可以看到如上图界面点击登录按钮,这里需要有一个Discord账号,没有的话可以先注册一个,注册的邮箱没有什么要求可以直接使用qq或者网易邮箱。
下面是Midjourney的付费情况,按月收费的话是基础款是10美元一个月,标准款是30美元一个月。具体细节可以去官方查看。
notion image
根据自己的需要选择好支付方案后,如下图进入discord界面:
notion image
进入discord界面后,可以找到mj的公共社区,其中有一些红色方框框住的频道里展示了一些mj社区中其他成员实时生成的图片:
notion image
这里介绍一下生成图片的流程,在mj的公共频道中的几个展示区里会有一个叫Midjourney Bot 的机器人,成员可以在展示区中给这个机器人提供提示词,机器人就会根据提示词生成出相应图片。
notion image
这样的话有一个问题,像这种公共频道人一般有许多成员,我们生成的图片很容易被其他成员新的生成图片指令所淹没。所以我们需要一个单独空间来生成图片。具体操作为点击下方的加号按钮新建一个服务器。
notion image
按照提示根据自己需要选择新服务器的名称与头像。然后回到mj的公共频道随便在一个展示区找到Midjourney Bot机器人,选择添加至服务器,选择刚刚新建的服务器即可。
notion image
notion image
回到新建的个人服务器,在输入框中输入/imagine 后面跟提示词。回车mj的机器人就会开始生成图片了。
notion image
notion image
我上面的提示词是中国山水画,mj在接收到提示词后总共生成了四张图片,这四张山水画每张画会有一点风格上的不同,然后下面会出现U1、U2、U3、U4以及V1、V2、V3、V4。解释一下这是什么意思,数字很明显是图片从左至右的序号,U表示选定某张图片进行展示,而V则是告诉机器人根据某张图片的风格再生成四张新的图片,比如我这里选择了V2,mj就会根据前面生成出来的第二张图片的风格再生成四张新的图片:
notion image
到这里mj的应用就介绍完了,我自己平时很少在discord中使用mj而是自己搭建了一个服务器来对mj机器人进行请求,有时间把这部分的操作过程发出来。

DALL·E:

DALL·E是OpenAI开发出的图片生成模型:根据官方描述可以实现以下三种功能:
  1. 根据文本提示创建图像
  1. 根据新的文本提示对现有图像进行编辑
  1. 创建现有图像的变体
具体的使用方案有两种第一种是使用官方搭建的网站:https://labs.openai.com/,第二种是通过openai提供的接口,使用api key进行访问。
方案一:
和midjourney一样需要花钱,不过收费情况和midjourney不一样,midjourney是按月收费的会员制,DALL·E是按生成数量收费,目前价格如右图:15美金可生成115张图。
方案二:
调用OpenAI的api其实也需要花钱,不过刚注册的用户在前三个月用每个月5美金的试用额度,可以用它来尝试一下。目前的收费标准为:
notion image
notion image
关于如何使用OpenAI提供的API,官方提供了三个方案分别是使用python,nodejs,命令行来调用api。这里简单介绍一下如何使用命令行来调用api。首先看下面这段命令:
上面这段命令就是用来访问接口的命令,curl后面跟上的是要访问的网址,第二行将引号中的内容添加到http包头,用于验证请求者的身份,第三行需要注意的是sk开头的这一串字符串就是从openai那申请的密钥,-d后面跟了三个参数,分别是:
  • prompt(提示词):告诉ai你对图片的描述
  • n(数量):生成多少张图片
  • size(大小):生成出来的图片像素比是多少,只有三个档可选(1024x1024、512x512、256x256)像素比越大收费越贵。
tips:我自己租了一台硅谷的云服务器,所以可以直接使用云服务器发送命令访问目标网址,如果是用自己的电脑需要使用代理。
在终端发送完这个请求后,目标网址会返回下面的数据,注意data中的值有一个url,这就是DALL·E生成的图片,可以直接使用网站访问就可以看到这个图片了。
notion image
这里需要注意的是生成出来的图片链接三小时之后就会失效。

Stable Diffusion:

这个工具的利用大概有三种解决方案,第一是使用在线网站:https://beta.dreamstudio.ai/generate 网上许多AI绘画的网站本质上是通过Stable Diffusion工具来进行开发,第二个方案是本地部署,第三个方案是通过云服务器部署。个人建议显存低于8G的还是直接考虑云服务器部署,我自己的显存是4GB生成一张图片大概需要一分钟左右,个人觉得效率太低了。下面分别介绍一下本地部署和云服务部署的操作步骤。
  1. 本地部署办法的两种选择:
    1. B站有个UP主写了一个整合包,如果不想去一个个去安装git、python、cuda等项目所需的运行环境可以直接下载B站秋叶大佬的整合包:
      1. 【AI绘画】Stable Diffusion整合包v4.2发布!全新加速 解压即用 防爆显存 三分钟入门AI绘画 ☆可更新 ☆训练 ☆汉化_哔哩哔哩_bilibili
        最好用的整合包!持续更新中~百度盘:https://pan.baidu.com/s/1MnyQH_gWgVdxU1S_Hjc5JQ夸克盘:https://pan.quark.cn/s/3a32257a7323求个关注加一键三连!不要直接在b站点开网盘链接!复制出去在浏览器里打开!否则会提取码错误!!不要用第三方网盘下载器,否则容易出现压缩包损坏【sd-webui-aki-v4.2.7z】SHA25, 视频播放量 1946899、弹幕量 2120、点赞数 173112、投硬币枚数 219612、收藏人数 182410、转发人数 32884, 视频作者 秋葉aaaki, 作者简介 喂饭区UP主 / 爱发电:akibanzu / 纯个人,相关视频:【AI绘画】Stable Diffusion 最终版 无需额外下载安装!可更新✓ 训练✓ 汉化✓ 提供7G模型 NovelAI,你真的会用SD吗?超全面Stable Diffusion基础操作,半小时上手webui!!!,【AI绘画】最佳人物模型训练!保姆式LoRA模型训练教程 一键包发布,【AI绘画】AI又进化了,革命性突破,【AIGC】耗时两个月!最好用的AI工具合集!!!,stable diffusion轻松快速解决低显存面部崩坏的情况,低显存也能画好脸(超强插件),4090逆天的ai画图速度,【AI绘画】模型训练器发布!简单又不失专业的LoRA模型训练一键包,实拍RTX 4090进行AI绘图的速度,AI绘画模型新手包!“画风”自由切换,有哪些你不知道的模型使用技巧? | 零基础入门Stable Diffusion的保姆级新手教程 | SD模型下载方式与推荐
        【AI绘画】Stable Diffusion整合包v4.2发布!全新加速 解压即用 防爆显存 三分钟入门AI绘画 ☆可更新 ☆训练 ☆汉化_哔哩哔哩_bilibili
    2. 如果想自己去搭建本地运行环境可以按照下面文档的步骤安装:
      1. Stable Diffusion本地安装
  1. 云服务器部署办法的具体操作文档:
    1. 云服务部署Stable Diffusion
工具安装好后,这里再提供一个可以下SD模型的网址:
如果下载后的模型不知道放哪里,可以去这个网站查看https://spell.novelai.dev/