AI 文摘

1步高清出图,字节开源StableDiffusion加速模型Hyper-SD





作者: 萤火遛AI 来源: 萤火遛AI

当前AI推理速度是考验模型的重要指标!Hyper-SD 使用了当前最先进的 Stable Diffusion 模型加速,可以在1、2、4、8个采样步骤下生成高质量的大尺寸图片,它通过Lora模型的方式发布,兼容 SDXL 和 SD1.5 的各类模型。

先看官方发布的这个效果对比:Hyper-SDXL出图的质量确实很优秀!

Hyper-SD 介绍

Hyper-SD 由字节跳动开源,使用了神经网络的模型蒸馏技术从 SDXL Base 1.0 和 Stable-Diffusion v1-5 模型中提取出了高质量的图像特征信息。

具体来说,字节团队提出了一种新颖的框架,协同整合了ODE轨迹保持和ODE轨迹重构的优势,既保证了新模型的性能,又提升提升了新模型的效率。首先,它引入了轨迹分段一致性蒸馏,在预先定义的时间步长段内逐步进行一致性蒸馏,从而从更高层次上促进了原始ODE轨迹的保留。其次,它将人类反馈学习融入模型,以提升低步长条件下的性能,并减轻蒸馏过程中产生的性能损失。第三,它将评分提炼技术融入其中,进一步提升模型在低步骤生成方面的能力,并首次尝试利用统一的LoRA支持所有步骤的推理过程。

ODE轨迹指的是扩散模型在训练时添加噪声和去噪的过程。ODE轨迹保持指的是训练时尽量复现原模型的ODE轨迹,这样可以尽量保持原模型的性能。ODE轨迹重构指的是训练时在保障新模型输出与原模型相近的前提下,优化ODE轨迹。

Hyper-SD 在 SDXL 和 SD1.5 的1至8步推理过程中均实现了良好性能。例如,在1步推理中,Hyper-SDXL 在CLIP评分上比 SDXL-Lightning 高出0.68,在Aes评分上高出0.51。

安装 Hyper-SD

手动安装

Hyper-SD的安装比较简单,我们只需要在ComfyUI的基础能力上增加一个新的采样调度器,然后再下载相关的模型,就可以了。

TCD采样调度器:你可以手动安装,也可以通过安装工作流缺失节点来完成。插件地址:https://github.com/JettHu/ComfyUI-TCD

Hyper-SD模型:Hyper-SD模型都是Lora模型,目前官方只发布了ComfyUI的使用方法,下载后放到 ComfyUI 的LoRA模型目录既可以了。模型下载地址见文末。

全都安装完了,不要忘了重启。

使用镜像

我在 AutoDL 上发布了一个 ComfyUI 的镜像,已经内置了 Hyper-SD 的模型和工作流,填了很多坑,可以一键开启使用,无需自己费力部署。

AutoDL是一个云计算平台,提供显卡服务器租用服务,可按小时付(1-2元左右),显卡价格相比阿里云、腾讯云有明显的优势,我一直在用,推荐本地硬件性能不足的同学试试。

镜像地址:https://www.codewithgpu.com/i/comfyanonymous/ComfyUI/yinghuoai-ComfyUI

在镜像地址页面,点击右下角的“AutoDL创建实例”:

也可以在实例创建页面选择社区镜像:yinghuoai-ComfyUI

GPU型号建议选择RTX 3090、4090等,性能比较强。

镜像实例创建后,里边有一个启动器,按照提示即可一键启动。

使用Hyper-SD

Hyper-SD 的推理加速是通过 LoRA 模型实现的,官方发布了多个 LoRA 模型供我们使用。这里我介绍其中最新的两种 LoRA 模型:Unified LoRA 和 CFG LoRA。

Unified LoRA

先来看 Unified LoRA(统一LoRA),所谓 统一LoRA 就是我们可以只使用一个模型,就能执行 1-8步的推理,在最低的1步推理下图片质量也是有所保证的,而且随着推理步数的增加,图像中的元素越来越丰富,事物的个性特征也会更加明显。

这个工作流中的节点不多,我这里做了一个简单的标注,如下图所示。文末提供工作流的下载方式。

这里有几点注意下:

  • TCD采样调度:TCD采样调度器是搭配 Hyper-SD 统一LoRA 模型必备的,它的时间调度是专门调整过的;

  • 负向提示词不需要填写;

  • CFG引导设置为1;

  • 图片尺寸根据所选择的SD模型进行设置,SDXL的图片像素不要低于 1024*1024。

这个模型有什么用?一个字快,比如根据涂鸦实时或准实时生成图片:

CFG LoRA

CFG LoRA 可以让我们使用更强的提示词引导,包括负向提示词。官方训练的模型可以支持5-8的CFG系数。

工作流标注如下:

这里有几点注意下:

1、LoRA模型:选择的是Hyper-SD CFG LoRA,这里使用的是8步模型,采样步数也要设置为8。最新的有12步模型,图片质量更高一些,但是生成时间也更长。

2、支持反向提示词:比如我们这里的 black hair,就是不要黑色的毛发。

3、采样低矮度还是使用 TCD采样调度器。

4、CFG需要设置为 5-8,具体值需要自己测试,选择适合自己模型和提示词的。

5、图片尺寸根据所选择的SD模型进行设置,SDXL的图片像素不要低于 1024*1024。

资源下载

模型

模型官方下载地址:https://huggingface.co/ByteDance/Hyper-SD/tree/main

如果你访问 Huggingface 不太方便,可以给公众号“萤火遛AI”发消息:Hyper-SD,即可获取。

工作流

工作流也发布在“萤火遛AI”公众号,发消息:Hyper-SD,可以同时获取工作流和模型。

以上就是本文的主要内容,如有问题,欢迎留言交流。

另外我创建了一个AI绘画专栏,可以零门槛,全面系统的学习 Stable Diffusion 创作,让创作灵感轻松落地!如有需要请点击链接或下方扫码进入:https://xiaobot.net/post/03340243-9df6-4ea0-bad6-9911a5034bd6

更多AI工具,参考Github-AiBard123国内AiBard123

可关注我们的公众号:每天AI新工具