从零开始掌握 Krita AI Diffusion:Krita 中集成 AI 绘画的完整指南
第一章 引言:认识 Krita AI Diffusion 插件
1.1 什么是 Krita AI Diffusion
Krita AI Diffusion 是一款革命性的 Krita 绘画软件插件,它将强大的人工智能扩散模型无缝集成到 Krita 的工作流程中。这款插件的出现彻底改变了数字艺术家的创作方式,让艺术家们能够在保持对创作过程完全控制的同时,充分利用 AI 生成技术的强大能力。
对于许多数字艺术家而言,传统的 AI 图像生成工具往往需要切换到独立的应用程序或网页界面,这种中断会严重影响创作的流畅性和灵感的一致性。Krita AI Diffusion 插件完美地解决了这一问题,它将 AI 生成能力直接嵌入到 Krita 这个专业绘画环境中,使得艺术家可以在不离开熟悉工作界面的情况下,充分利用 AI 辅助创作的各项功能。
这款插件支持多种主流的 AI 扩散模型,包括 Stable Diffusion WebUI、ComfyUI 以及其他兼容的推理后端。用户可以根据自己的硬件配置和特定需求,选择最适合的模型后端。插件的设计理念是让 AI 成为艺术家的得力助手,而非替代者,因此它特别强调对生成过程的精细控制,以及与艺术家工作流程的自然融合。
1.2 为什么选择 Krita AI Diffusion
在众多 AI 绘画工具中,Krita AI Diffusion 有着独特的优势。首先,它完美继承了 Krita 作为专业绘画软件的各项特性,包括图层管理、笔刷系统、选区工具和色彩管理等功能。这意味着艺术家在使用 AI 生成功能时,仍然可以像往常一样利用这些强大的工具来细化和完善作品。
其次,该插件的界面设计充分考虑了艺术家的使用习惯。它没有采用复杂的参数面板,而是将常用的 AI 生成功能以直观的方式呈现,让用户能够快速上手。对于初次接触 AI 绘画的用户来说,这种设计大大降低了学习门槛;而对于经验丰富的用户,插件也提供了足够的高级选项来满足深度定制的需求。
第三,Krita AI Diffusion 强调本地化部署的重要性。所有的图像生成过程都在用户的本地计算机上完成,这意味着用户的创作数据和隐私信息不会上传到任何外部服务器。对于商业艺术家或处理敏感项目的创作者来说,这一特性提供了额外的安全保障。
1.3 插件的主要应用场景
Krita AI Diffusion 插件的应用范围非常广泛,几乎涵盖了数字艺术创作的各个领域。在概念设计阶段,艺术家可以使用文字描述快速生成多个创意方案,从中获取灵感并选择最佳方向进行深入。这种方式比传统的素描草图更能激发创造性思维,因为它能够以直观的方式呈现各种可能性。
对于需要大量素材的概念艺术家和游戏设计师来说,这款插件能够显著提高工作效率。背景纹理、环境元素、角色服装细节等都可以通过 AI 快速生成,然后根据需要进行手动调整和整合。插件支持批量处理功能,用户可以一次性生成多张变体图像,从中挑选最满意的作品进行后续加工。
插画师和漫画家可以利用插件的局部重绘功能来修复作品中的瑕疵或调整不满意的部分。与传统的重绘方法相比,AI 辅助的局部重绘能够更好地保持整体风格的一致性,同时大大缩短了修改时间。对于需要保持连载更新节奏的漫画作者来说,这一功能尤为重要。
在艺术风格探索方面,插件提供了丰富的风格迁移和图像转换功能。用户可以尝试不同的艺术风格,将写实照片转换为油画、水彩或卡通风格,探索各种创意可能性。这种功能不仅可以帮助艺术家拓展创作边界,也可以作为教育工具,帮助学生理解不同艺术风格的特点。
第二章 环境搭建与安装详解
2.1 系统要求与准备工作
在开始安装 Krita AI Diffusion 插件之前,需要确保计算机满足基本的系统要求。该插件主要面向 Windows 10/11 用户开发,同时也提供了部分 Linux 发行版的支持。对于 Mac 用户,由于 Metal GPU 加速的支持仍在开发中,建议耐心等待官方发布相应版本。
硬件配置方面,插件对 GPU 有较高要求。虽然理论上 CPU 也可以运行部分功能,但为了获得流畅的使用体验,建议使用具有足够显存的独立显卡。NVIDIA 显卡用户需要至少 6GB 显存,建议 8GB 或以上;AMD 显卡用户需要至少 8GB 显存。集成显卡或显存不足的显卡可能导致运行缓慢或无法使用某些高级功能。
在软件依赖方面,用户需要安装 Python 环境(推荐 3.10 或 3.11 版本)以及 pip 包管理器。如果选择使用 Stable Diffusion WebUI 作为后端,还需要安装 Git 版本控制工具。这些软件都可以从各自的官方网站免费下载,建议在继续安装之前确认它们已经正确安装并添加到系统环境变量中。
存储空间也是需要考虑的因素。AI 模型文件通常较大,单个模型可能占用数 GB 的存储空间。除了模型本身,还需要预留足够的空间来存储生成的图像作品。建议系统盘至少保留 50GB 的可用空间,如果计划使用多个模型,则需要相应增加存储容量。
2.2 安装 Krita 主程序
如果您的计算机上还没有安装 Krita,首先需要下载并安装 Krita 主程序。建议从 Krita 官方网站下载最新稳定版本,以确保与 AI Diffusion 插件的兼容性。Krita 是一款免费开源的数字绘画软件,官方提供 64 位 Windows 安装包下载。
安装过程相对简单,下载完成后双击安装包,按照安装向导的指引完成安装即可。建议选择默认安装路径,如果需要更改安装位置,应避免使用包含中文字符或特殊符号的路径,因为这可能在某些情况下导致插件加载问题。
安装完成后,首次启动 Krita 时会显示欢迎界面,用户可以在此设置默认工作区布局和初始画布大小。建议熟悉一下 Krita 的基本界面布局,特别是图层面板、工具栏和-docker 面板的位置,这些将在后续使用插件时频繁使用。
为了确保插件能够正常工作,建议在安装完 Krita 后进行一次基本的配置调整。打开编辑菜单下的偏好设置,将 GPU 加速选项启用(如果系统支持),这将显著提升画布操作的流畅度。同时,建议将撤销步骤数设置为一个较大的值(如 100 或更多),因为在使用 AI 生成功能时,可能需要频繁撤销不满意的生成结果。
2.3 安装 Python 依赖与环境配置
Krita AI Diffusion 插件的正常运行依赖于特定的 Python 环境。Krita 自带了 Python 解释器,但插件可能需要额外的 Python 包来支持 AI 模型的后端通信。
首先需要确定 Krita 使用的 Python 版本。打开 Krita,进入脚本菜单下的 Python 控制台,输入以下命令来查看 Python 版本:
import sys
print(f"Python版本: {sys.version}")
记录下显示的 Python 版本号,因为这将决定后续安装依赖包时需要使用的 pip 命令。在大多数情况下,Krita 5.x 版本使用 Python 3.9 或 3.10,而 Krita 6.x 版本可能使用更新的 Python 版本。
接下来需要为 Krita 安装必要的 Python 包。打开系统的命令提示符或 PowerShell(注意:不是 Krita 内部的 Python 控制台,而是系统自带的终端),然后导航到 Krita 的 Python Scripts 目录。这个目录的路径通常类似于:C:\Program Files\Krita (x64)\share\krita\pykrita。
不过更推荐的方式是通过 Krita 的插件管理器来安装依赖。首先找到 Krita AI Diffusion 插件的安装位置,然后使用 pip 为 Krita 的 Python 环境安装所需包。常用的依赖包括用于 HTTP 通信的 requests 库、用于处理图像的 pillow 库等。如果插件包中包含 requirements.txt 文件,可以直接运行 pip install -r requirements.txt 来安装所有依赖。
在某些情况下,可能需要手动指定 pip 的路径和目标 Python 环境。例如,如果使用 conda 创建了专门的 Python 环境,可以在激活该环境后使用 conda 的 pip 来安装依赖:
# 激活conda环境后执行
pip install requests pillow numpy
# 或者直接指定pip路径安装到特定环境
conda activate krita_env
pip install requests pillow numpy
安装完成后,建议在 Krita 的 Python 控制台中测试导入是否成功:
import requests
import PIL
print("依赖包导入成功")
如果没有任何错误输出,说明依赖环境配置正确。
2.4 安装 AI 后端服务
Krita AI Diffusion 插件本身只是一个界面桥梁,它需要连接到 AI 模型的后端服务来进行实际的图像生成。最常用的后端是 Stable Diffusion WebUI(也被称为 AUTOMATIC1111 WebUI),这个开源项目提供了完整的 Stable Diffusion 模型运行环境和丰富的功能接口。
安装 Stable Diffusion WebUI 的第一步是克隆其 Git 仓库。打开 Git Bash 或命令提示符,选择一个合适的目录(例如 D:\AI\stable-diffusion-webui),然后执行以下命令:
git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git
克隆完成后,进入项目目录,阅读并编辑 webui-user.bat 文件。这个批处理文件包含了启动 WebUI 的配置选项。对于大多数用户来说,需要关注的主要配置项包括:
# webui-user.bat 配置文件示例
# 设置 Python 路径(如果系统有多个 Python 版本)
set PYTHON=D:\Python\python-3.10.11\python.exe
# 设置 Git 仓库路径
set GIT=D:\Program Files\Git\cmd\git.exe
# 设置 venv 路径,设为空使用系统 Python
set VENV_DIR=
# 额外的启动参数
# --xformers 可以启用内存优化
# --medvram 可以进一步节省显存
set COMMANDLINE_ARGS=--xformers --medvram
# 指定运行端口(避免与其他服务冲突)
set PORT=7860
对于显存较小的显卡(6GB 或以下),强烈建议添加 --medvram 参数,这会将模型的部分数据卸载到内存中,虽然会略微降低速度,但能够避免显存溢出错误。如果显卡显存充足(12GB 或以上),可以考虑使用 --lowvram 参数来获得更好的性能。
首次启动 WebUI 时,它会自动下载一些必要的模型文件。由于这些文件通常较大(数 GB),下载过程可能需要较长时间。建议使用网络代理或 VPN 来加速下载过程。如果下载中断,可以重新运行启动脚本,程序会自动从断点处继续下载。
除了 Stable Diffusion WebUI,Krita AI Diffusion 插件还支持 ComfyUI 作为替代后端。ComfyUI 采用节点式的工作流程设计,适合需要更精细控制生成过程的高级用户。安装 ComfyUI 的步骤类似,也是从其 GitHub 仓库克隆并按照说明配置。
2.5 安装与配置 Krita AI Diffusion 插件
现在来到了最关键的步骤:将 Krita AI Diffusion 插件安装到 Krita 中。首先从插件的 GitHub 仓库下载最新版本的插件代码。可以选择直接下载 ZIP 压缩包,或者使用 Git 克隆仓库。
# 克隆插件仓库
git clone https://github.com/Acly/krita-ai-diffusion.git
下载完成后,需要将插件文件复制到 Krita 的插件目录。Krita 的插件目录位置取决于操作系统和安装方式。在 Windows 上,插件目录通常位于用户文件夹下的隐藏目录中:
# Windows 上的插件目录路径
C:\Users\你的用户名\AppData\Local\krita\pykrita\
如果该目录不存在,可以手动创建。将插件仓库中的所有文件和文件夹复制到这个目录中。复制完成后,插件的目录结构应该类似于:
pykrita/
└── krita_ai_diffusion/
├── __init__.py
├── ui/
├── backend/
├── utils/
└── resources/
接下来需要安装插件的其他依赖包。打开系统终端,进入插件目录,运行安装命令:
cd C:\Users\你的用户名\AppData\Local\krita\pykrita\krita_ai_diffusion
pip install -r requirements.txt
如果插件目录中没有 requirements.txt 文件,可能需要查看插件的 README 文档来了解需要哪些依赖。在某些情况下,插件的依赖会在其 init.py 或 setup.py 文件中声明。
完成文件复制和依赖安装后,启动 Krita。如果插件安装成功,应该能在 Krita 的窗口菜单或工具菜单中看到 AI Diffusion 相关的选项。第一次启动时,插件可能会提示配置后端服务地址。
打开插件设置界面,将 WebUI 的地址配置为本地地址,通常是 http://127.0.0.1:7860。如果 WebUI 正在同一台计算机上运行且使用默认端口,这个地址就是正确的。如果 WebUI 运行在其他计算机上,需要输入那台计算机的 IP 地址和端口。
配置完成后,建议进行连接测试。点击插件界面中的连接按钮或测试按钮,插件应该能够成功连接到后端服务并获取模型列表。如果连接失败,检查以下几点:WebUI 是否正在运行、防火墙是否阻止了连接、后端地址和端口是否正确配置。
第三章 核心功能详解
3.1 文生图功能
文生图(Text to Image)是 AI 图像生成最基础也是最核心的功能。Krita AI Diffusion 插件将这一功能完美集成到 Krita 的界面中,让用户可以通过文字描述来生成图像。
在插件的文生图面板中,主要包含以下几个区域:提示词输入区、参数控制区、生成预览区和历史记录区。提示词输入区支持中英文混合输入,但对于大多数 AI 模型来说,使用英文描述通常能获得更准确的结果。插件通常会提供提示词助手或快捷模板功能,帮助用户构建有效的提示词。
提示词的撰写质量直接影响生成结果的质量。有效的提示词应该包含以下几个要素:主体描述、场景环境、艺术风格、光照条件和情绪氛围。例如,一个详细的提示词可能是这样的:
masterpiece, best quality, 1girl, sitting in a cafe, window,
sunlight, warm lighting, coffee cup, blonde hair, blue eyes,
looking at viewer, smile, detailed face, illustration style,
soft colors, pastel tones, high detail
除了正面提示词,负面提示词同样重要。负面提示词用于告诉 AI 模型应该避免生成什么内容。常用的负面提示词包括低质量相关的词汇(如 low quality, blurry, bad anatomy)和不想要的内容元素:
lowres, bad anatomy, bad hands, text, error, missing fingers,
extra digit, fewer digits, cropped, worst quality, low quality,
normal quality, jpeg artifacts, signature, watermark, username
在参数控制区,用户可以调节以下关键参数:
采样器(Sampler)决定了生成图像所使用的算法。不同的采样器有各自的特点:DDIM 通常生成速度较快且适合细节调整;DPM++ 2M Karras 在质量和速度之间取得了较好平衡;Euler a 能够生成富有艺术感的图像;LMS 和 LMS Karras 则更加稳定可靠。初学者建议从 DPM++ 2M Karras 或 Euler a 开始尝试。
步数(Steps)控制生成过程中迭代的次数。步数越多,图像细节越丰富,但增加到一定程度后收益递减。通常 20-35 步是一个比较合适的范围。步数过低(如少于 15 步)可能导致图像模糊或出现Artifacts;步数过高(如超过 50 步)则可能浪费计算资源。
CFG 尺度(Classifier Free Guidance Scale)控制模型对提示词的遵循程度。较低的 CFG 值(如 5-7)会给予模型更多创作自由,生成的图像可能更加多样化但也可能偏离提示词;较高的 CFG 值(如 12-15)会使图像更严格地遵循提示词描述,但也可能产生过度锐化或饱和的效果。建议根据具体需求在 7-12 之间调整。
分辨率设置允许用户指定生成图像的宽高。Krita AI Diffusion 通常使用像素作为单位,分辨率设置会直接影响生成图像的尺寸。需要注意的是,更高的分辨率意味着更多的计算量和显存占用。对于 8GB 显存的显卡,建议将总像素数控制在 200 万以内(约 1600×1200 或 1024×1024);如果显存充足,可以尝试更高的分辨率。
3.2 图生图功能
图生图(Image to Image,简称 img2img)是在已有图像的基础上进行 AI 生成的功能。这项功能特别适合将草图转化为完整作品、改变图像风格、或对照片进行艺术化处理。
使用图生图功能时,首先需要将一张图像加载到插件中。这可以是手绘的草图、素描、照片或其他任何图像。加载图像后,插件会显示原图和生成结果预览,以及一个“降噪强度”或“重绘幅度”滑块。
降噪强度(Strength 或 Denoising Strength)是图生图的核心参数,它控制 AI 在生成过程中对原图的保留程度。当降噪强度设置为 0 时,AI 几乎完全保留原图,结果与输入几乎相同;设置为 1 时,AI 几乎完全忽略原图,生成结果与文字提示词高度相关但可能与原图差异很大。
实际使用中,通常需要找到一个平衡点。对于将粗略草图转化为精细作品的应用,建议将降噪强度设置在 0.6-0.8 之间,这样既能保留草图的基本结构和构图,又能给予 AI 足够的自由度来补充细节。对于轻微的风格调整或色调改变,降噪强度可以设置在 0.2-0.4 之间,这样生成结果会与原图保持高度相似。
以下是一些常用的图生图场景及其参数建议:
将手绘线稿上色的场景中,首先需要确保线稿足够清晰,最好将线稿图层放在白色背景上或转换为纯黑白图像。提示词应该包含所需的颜色方案和艺术风格描述。降噪强度建议设置在 0.5-0.7 之间,这样既能让 AI 添加色彩和光影,又能保持线条的清晰度。
照片艺术化处理的场景中,可以将普通照片转化为油画、水彩或卡通风格。提示词需要明确描述目标风格,例如“oil painting style, impressionist, visible brushstrokes”。降噪强度通常设置在 0.3-0.6 之间,具体取决于希望保留多少照片的写实细节。
图像扩展或补全的场景中,可以使用图生图功能来扩展图像的边界或填充缺失的部分。首先将需要补全的部分涂黑或标记为蒙版区域,然后在提示词中描述希望填充的内容。降噪强度可以设置得较高(0.7-0.9),因为这时候更希望 AI 自由创作。
3.3 局部重绘与智能蒙版
局部重绘(Inpainting)是 AI 图像编辑中最重要的功能之一,它允许用户只对图像的特定区域进行重新生成,而不影响其他部分。这项功能在修复瑕疵、替换元素、添加细节等场景中非常有用。
Krita AI Diffusion 插件的局部重绘功能与 Krita 的选区工具和蒙版系统紧密集成。用户可以使用 Krita 的任意选区工具(如矩形选区、套索工具、魔法棒等)来选择需要重绘的区域,然后调用插件的局部重绘功能。被选中的区域将成为重绘的目标,其余部分保持不变。
在局部重绘时,提示词的编写需要更加精确。由于 AI 只会在选区范围内生成内容,提示词应该专注于描述选区内部应该呈现的内容。同时,建议在负面提示词中明确指出不应该出现的内容元素,以避免不想要的元素意外出现在重绘区域。
降噪强度在局部重绘中同样重要。对于需要精细控制的局部调整,建议使用较低的降噪强度(如 0.3-0.5),这样 AI 会在更大程度上参考周围未修改区域的风格和细节。对于需要大胆改变的区域,可以提高降噪强度到 0.6-0.8。
插件还提供了智能蒙版功能,这是局部重绘的高级扩展。智能蒙版可以根据图像内容自动识别需要修改的区域,而不需要手动绘制选区。常见的智能蒙版类型包括:
主体蒙版能够自动识别并选中图像中的主要主体,适用于需要对主体进行整体修改的场景。使用时,AI 会分析图像内容,找出最可能是主体的区域。
背景蒙版与主体蒙版相反,它会自动选中背景区域,适用于对背景进行替换或风格调整的场景。
边缘蒙版会选中图像中物体边缘的区域,适用于需要对边缘进行增强或修改的场景。
细节蒙版会选中图像中纹理和细节丰富的区域,适用于需要对细节进行强化的场景。
这些智能蒙版可以单独使用,也可以组合使用以创建更复杂的选区。在实际创作中,可以先用智能蒙版创建基础选区,然后结合手动选区工具进行精确调整,以达到最佳效果。
3.4 ControlNet 控制功能
ControlNet 是 Stability AI 开发的一个神经网络结构,它允许用户使用额外的条件控制来指导 AI 图像生成。Krita AI Diffusion 插件集成了 ControlNet 功能,这大大增强了创作者对生成结果的控制能力。
ControlNet 的核心思想是提供额外的输入条件,这些条件可以是姿态骨骼图、深度图、边缘线图、法线图等多种形式。AI 模型在生成图像时会同时参考文字提示词和这些额外条件,从而生成既符合文本描述又满足结构约束的图像。
在插件中使用 ControlNet,首先需要在 ControlNet 设置区域启用该功能,并选择合适的预处理器。预处理器负责从输入图像中提取特定类型的信息,生成所谓的“引导图”。不同的预处理器适用于不同的应用场景:
Canny 边缘检测预处理器会提取图像中的边缘信息,生成一幅仅包含边缘线条的图像。使用这个预处理器时,AI 会生成一幅边缘结构与输入图像高度相似的图像。这对于保持建筑轮廓、机械结构等需要精确边缘的场景特别有用。
HED(Holistically-Nested Edge Detection)边缘检测与 Canny 类似,但对边缘的连续性有更好的感知,生成的边缘更加自然流畅。适合需要保持整体轮廓但边缘细节可以有所变化的场景。
姿态检测预处理器(如 OpenPose)会从图像或视频中识别人体姿态,生成一幅包含关键点和骨骼结构的图像。使用这个预处理器,AI 可以生成与指定姿态一致的人物图像。这对于角色设计和姿势参考特别有价值。
深度图预处理器会估计图像中各部分相对于观察者的距离,生成一幅灰度深度图。较近的区域显示为较亮的颜色,较远的区域显示为较暗的颜色。AI 会根据这个深度信息来保持生成图像的空间结构。
法线图预处理器会生成一幅表示表面法线方向的颜色图。这种信息对于保持物体表面的凹凸细节和光影关系非常有用。
在使用 ControlNet 时,控制权重(Control Weight)是一个重要参数。它决定了 ControlNet 条件相对于文字提示词的影响力。较高的控制权重(如 1.0 或更高)会使生成结果更严格地遵循 ControlNet 的引导;较低的控制权重(如 0.5 或更低)会给予 AI 更多自由空间,允许在遵循引导的同时进行创意发挥。
引导启动步数(Start Control Step)和引导结束步数(End Control Step)参数控制 ControlNet 在生成过程中的作用范围。当开始步数设为 0、结束步数设为 1 时,ControlNet 在整个生成过程中都起作用。如果只希望在生成的后期阶段引入 ControlNet 影响,可以将开始步数设置为一个较高的值(如 0.5)。
3.5 多模型切换与管理工作流
Krita AI Diffusion 插件支持同时配置多个 AI 模型后端,用户可以根据不同的创作需求快速切换使用不同的模型。这种灵活性对于需要处理多种风格或主题的创作者来说非常有用。
插件的模型管理界面通常会显示所有已配置的后端服务,包括它们的连接状态、可用模型列表和资源占用情况。用户可以通过简单的点击操作在不同的后端之间切换,而不需要重新启动 Krita 或修改设置。
对于 Stable Diffusion WebUI 后端,用户可以在 WebUI 的模型标签页中管理下载的模型。新的模型文件(通常为 .safetensors 或 .ckpt 格式)需要放置在 WebUI 目录下的 models/Stable-diffusion 文件夹中。放置新模型后,需要在 WebUI 界面中点击刷新按钮,或者重启 WebUI 服务以使新模型出现在模型选择列表中。
模型的选择直接影响生成结果的风格和特点。不同的训练数据和方法会造就不同专长的模型。例如:
SD 1.5 基础模型是最常用的通用模型,有最多的社区资源和支持。它的特点是泛化能力强,风格多样,适合大多数应用场景。
SD 2.1 模型在 1.5 的基础上进行了升级,生成的照片级真实感有所提升,但某些 1.5 时代的提示词和模型可能不完全兼容。
专精风格模型针对特定艺术风格进行优化,如动漫风格、写实风格、奇幻风格等。这些模型在对应风格上有更好的表现,但泛用性相对较弱。
LoRA(Low-Rank Adaptation)是一种模型微调技术,用户可以在基础模型上叠加 LoRA 来获得特定的风格或特征。LoRA 文件通常较小(几十到几百 MB),便于分享和下载。一个基础模型可以同时加载多个 LoRA。
Krita AI Diffusion 插件通常提供专门的 LoRA 管理功能,用户可以在插件界面中直接加载、卸载和调整 LoRA 的强度,而不需要每次都回到 WebUI 进行配置。
ControlNet 模型也需要单独下载和配置。不同的 ControlNet 功能需要不同的模型文件。这些文件应该放置在 WebUI 的 models/ControlNet 目录下,并确保文件名与插件预期的模型名称匹配。
第四章 实战教程:一步步使用指南
4.1 实战一:从文字描述生成概念设计
让我们通过一个完整的实战案例来学习如何使用 Krita AI Diffusion 插件生成概念设计作品。本案例将创建一个奇幻风格的建筑概念图。
首先,打开 Krita 并创建一个新文档。考虑到概念设计作品通常需要较大的展示空间,建议将画布大小设置为 1920×1080 或更大的分辨率。设置完成后,确认文档创建成功。
接下来,打开 AI Diffusion 插件面板。通常可以在窗口菜单或工具栏中找到插件的入口。插件面板打开后,默认显示的是文生图界面,这是我们将要使用的功能。
在提示词输入区域,输入以下描述:
masterpiece, best quality, fantasy castle, floating islands,
waterfall, ancient stone architecture, magical atmosphere,
lush greenery, golden hour lighting, mist, clouds, detailed
buildings, intricate carvings, epic scale, dramatic composition
这个提示词描述了一个浮空城堡的概念,包含了主体(浮空城堡)、环境(瀑布、岛屿、云雾)、光照(黄金时段)和风格要求(精细雕刻、史诗规模)。
现在设置生成参数。将采样器选择为 DPM++ 2M Karras,这个采样器在细节表现和生成速度上有较好的平衡。将步数设置为 30,这是一个能够生成足够细节但不会过度消耗时间的值。CFG 尺度设置为 8,这是一个比较平衡的值,既能让 AI 遵循提示词,又给予一定的创作自由。
在分辨率设置中,将宽度设置为 1024,高度设置为 768。这个分辨率能够生成足够清晰的概念细节,同时不会给显卡带来过大的负担。如果显卡性能足够好,后续可以将图像放大以获得更高分辨率的版本。
负面提示词使用插件预设的通用负面提示词,或者输入:
lowres, bad anatomy, bad proportions, extra limbs,
floating limbs, deformed, blurry, low quality,
ugly, amateur, sketch, drawing
这些负面提示词帮助避免常见的生成问题,如解剖错误、模糊和低质量。
参数设置完成后,点击生成按钮开始生成图像。根据显卡性能和网络状态,生成过程可能需要几秒到几十秒不等。在生成过程中,插件会显示进度条和预估剩余时间。
生成完成后,插件会显示结果预览。如果对结果满意,可以点击接受按钮将图像导入到 Krita 画布中。如果不满意,可以调整参数重新生成。插件通常会保留之前的生成参数,方便用户进行微调。
将生成的图像导入 Krita 后,可以进行进一步的手动调整。例如,添加一些手绘的细节元素,调整整体色调,添加文字标注等。在实际工作中,这种人机协作的方式能够结合 AI 的效率和我们艺术家的审美判断。
如果想要尝试不同的变体,可以调整随机种子(Seed)来生成完全不同的构图,或者只微调提示词中的某些关键词来探索不同的可能性。插件通常提供“一键变体”功能,可以快速生成多个不同版本供选择。
4.2 实战二:将草图转换为精细线稿
在这个实战案例中,我们将学习如何将粗糙的手绘草图转换为精美的线稿作品。这个工作流程对于概念设计的前期探索阶段特别有用。
首先,我们需要准备一张草图。可以使用 Krita 的铅笔工具随意绘制一个角色的轮廓。草图不需要很精细,只需要表达出基本的人体结构和姿势即可。将这个草图图层放在最上层,并确保背景是纯白色或透明。
绘制完成后,将草图图层命名为”草图”,并降低其不透明度到 30%左右,这样我们可以看到后面的工作层。在草图图层下方创建一个新图层,命名为”线稿”,我们将在这上面生成新的线稿。
打开 AI Diffusion 插件,切换到图生图模式。点击加载图像按钮,将刚刚绘制的草图加载到插件中。加载后,插件会显示原图预览。
现在需要设置提示词。这次我们的目标是生成一个干净的线稿,所以提示词应该强调线条的清晰度和结构的准确性:
clean lineart, black lines on white background,
detailed line drawing, crisp edges, full body,
standing pose, no shading, no color, monochrome,
professional illustration, clean linework
负面提示词应该排除任何色彩和阴影信息:
color, shading, grayscale, halftone, textured
background, noisy, blurry, messy lines,
incomplete lines
在参数设置中,降噪强度是一个关键参数。由于我们希望尽可能保留原草图的结构,同时获得更干净的线条,建议将降噪强度设置为 0.4-0.5。这个范围既能清理线条,又能保持原有的构图意图。
采样器可以选择 Euler 或 DPM++ 2M,这两者在线条清晰度方面都有不错的表现。步数设置为 20-25 即可,过高的步数可能导致线条过于复杂。CFG 尺度设置为 7-9,确保生成结果遵循提示词的描述。
分辨率设置应该与原草图保持一致或接近,这样能够更好地保持结构比例。如果原草图较小,可以在保持宽高比的前提下适当放大。
完成参数设置后,点击生成按钮。生成完成后,仔细查看结果。如果线条过于复杂,可以适当降低降噪强度;如果结构偏离太多,可以适当提高降噪强度以更紧密地参考原草图。
满意的线稿生成后,点击接受按钮将结果输出到”线稿”图层。然后可以将线稿图层的颜色模式更改为 RGB,叠加在原草图上进行对比。根据需要,可以使用橡皮擦工具删除不满意的部分,并使用画笔工具手动修复。
这个工作流程的优势在于,AI 能够快速将我们粗糙的想法转化为可看的线稿,而我们只需要在 AI 输出的基础上进行必要的修正和完善,大大节省了从零开始绘制精细线稿的时间。
4.3 实战三:使用 ControlNet 保持构图一致性
在这个实战案例中,我们将学习如何使用 ControlNet 功能来保持多张图像之间的构图一致性。这在创建系列作品或需要角色在不同场景中出现时特别有用。
首先,准备一张参考图像。这张图像应该包含我们希望保持的构图结构。假设我们想要创建一个角色站在不同场景中的系列图像,我们可以使用一张姿态参考图作为 ControlNet 的引导。
打开 Krita 并创建新文档,大小设置为 1024×1024。导入参考图像作为底层参考。打开 AI Diffusion 插件,切换到包含 ControlNet 的工作模式。
在 ControlNet 设置区域,启用 ControlNet 功能。选择姿态检测预处理器(如 OpenPose)。这个预处理器会从参考图像中提取人体姿态信息。
加载参考图像后,预览区域会显示提取的骨骼姿态图。确认姿态信息正确提取后,继续进行提示词的设置。
这次我们的提示词应该描述角色在第一个场景中的样子:
1girl, solo, standing pose, red dress, long black hair,
braid, confident expression, front view, detailed face,
high quality, masterpiece
负面提示词使用常规设置:
lowres, bad anatomy, bad hands, text, error,
missing fingers, extra digit, blurry, ugly
在 ControlNet 参数区域,将控制权重设置为 1.0,这意味着我们希望尽可能严格地遵循参考姿态。引导启动步数设置为 0,引导结束步数设置为 1,确保 ControlNet 在整个生成过程中都起作用。
采样器选择 DPM++ 2M Karras,步数设置为 25,CFG 尺度设置为 7-9。生成参数设置完成后,点击生成按钮。
生成完成后,查看结果。图像中的角色应该展现出与参考图像相似的姿态,但面孔、服装和背景会根据提示词有所变化。这正是我们想要的效果——保持姿态一致性,同时改变其他元素。
为了创建系列图像中的第二张,我们可以保持相同的 ControlNet 设置,但修改提示词中的场景描述:
1girl, solo, standing pose, red dress, long black hair,
braid, confident expression, front view, detailed face,
standing on beach, sunset, ocean waves, dramatic sky,
high quality, masterpiece
保持所有其他参数不变,包括相同的随机种子或使用相同的种子值。重新生成,这次应该得到一个姿态相同但场景不同的角色图像。
通过这种方法,我们可以创建大量保持构图一致性的系列图像,非常适合角色设定集、多视角参考图或漫画分镜中的同角色不同场景。这种技术大大提高了创作效率,同时确保了系列作品之间的视觉连贯性。
需要注意的是,ControlNet 的效果也取决于基础模型的能力。某些模型对人体的理解更好,能够更准确地复现姿态。如果发现生成的姿态有扭曲或变形,可以尝试更换不同的基础模型,或者在提示词中强调姿态相关的描述。
4.4 实战四:局部重绘修复瑕疵
在数字绘画创作中,即使使用 AI 辅助,也经常需要对生成结果进行局部调整和修复。局部重绘功能允许我们精确定位并修改图像的特定区域,而不影响其他部分。
假设我们已经生成了一张角色图像,但发现角色的右手比例不太正确,手指的数量也不对。我们可以使用局部重绘功能来修复这个问题,而不需要重新生成整张图像。
首先,在 Krita 中打开需要修改的图像。将图像缩放到能够清晰看到需要修改区域的比例。使用套索工具(Lasso Selection Tool)沿着角色的右手轮廓仔细绘制选区。选区应该紧贴需要修改的区域边缘,但不需要过于精确,因为 AI 会在选区内重新生成内容。
选区绘制完成后,切换到 AI Diffusion 插件。如果插件当前不在局部重绘模式,需要切换到该模式。确认插件识别到了当前的选区,蒙版预览应该显示选区内的区域将被修改。
现在需要编写针对这个特定区域的提示词。这次提示词应该专注于描述手部:
correct hand anatomy, 5 fingers, natural hand pose,
realistic hand details, proper proportions,
fingers spread naturally, skin tone matching
负面提示词应该排除之前的问题:
extra fingers, missing fingers, fused fingers,
deformed hand, bad anatomy, extra limbs,
blurry, low quality
在参数设置方面,降噪强度建议设置为 0.4-0.6。由于我们只是修改一个小区域,保持相对较低的降噪强度可以帮助 AI 更好地匹配周围未修改区域的风格和色调。采样器选择与之前生成时相同的采样器,这有助于保持视觉一致性。步数可以稍微增加到 25-30,因为局部重绘通常需要更好的细节。
完成设置后,点击生成按钮。AI 会在选区范围内重新生成手部内容。生成完成后,点击接受按钮应用修改。
如果对修改结果不满意,可以撤销后重新生成。可能需要尝试不同的提示词或参数设置来获得理想的结果。有时候,降低降噪强度可以获得更自然的结果;有时候,微调提示词中的描述词能够引导 AI 生成更正确的解剖结构。
在修复完成后,可能需要对修改区域进行一些手动的色调调整,以使其与周围区域更好地融合。使用 Krita 的颜色匹配工具或手动调整色相/饱和度/亮度都是有效的方法。
局部重绘的另一个常见应用是更换图像中的特定元素。例如,可以选中角色的发型区域,通过
评论区