随着23年AIGC大火,AI绘画,通过AI生图、扩图、修图的大模型越来越成熟。今天就AI绘画这个领域,给大家简单普及一下行业术语,也就是俗称的黑话。听到最高频的一个词就是SD,SD就是:Stable Diffusion,稳定扩散,这是AI生图的术语,也是大模型名称,是Stability团队出品的大模型,通过这个大模型可以完成上述功能,生成的图片主要二次元动漫为主,以下图片就是使用SD生成。
Flux也是一种大模型,由SD核心人员,独自创业,创立的黑森林实验室出品
WebUI 是一款UI工具,用于调用大模型,通过参数输入,完成图像处理和输出。
ComfyUI也是一款UI工具,更加流程化一点,完成的功能与WebUI一致。
LoRa是一种大模型调整技术,通过调整图像生成过程参数,帮助输出更加准确、高质量的图片,比如肌肤纹理、肌肉量、肌肤滑度等
ControlNet也是一种大模型调整技术,利用现有图片,勾勒出基本线条,帮助最终图片的生成。
text2img 文生图
img2img 图生图
Hidiffusion 是字节跳动和旷视推出的一个调整框架,由分辨率感知 U-Net (RAU-Net) 和改进的移位窗口多头自注意力 (MSW-MSA) 组成,Hidiff使预训练的t2i扩散模型能够有效地生成超过训练图像分辨率的高分辨率图像。
C站,Civitai,24年被墙,需要梯子,国内镜像站是hf
综合社区HuggingFace
咒语:指代提示词prompt
魔法师:指代写出提示词prompt的人
炼丹:指代训练练AI模型
炼丹炉:指代训练AI模型的地方
炼丹术士:指代训练AI模型的人
炸炉:指炼丹炼炸了,包括但不限于:CUDA OUT OF MEMORY、loss=nan、过拟合等
附:SD模型推理过程
Stable AI官网:Stability AI
FluxAI官网:Black Forest Labs – Frontier AI Lab
WebUI:GitHub – AUTOMATIC1111/stable-diffusion-webui: Stable Diffusion web UI