以下是Stable Diffusion常用的模型及其特点、用途和获取途径的整理:
一、官方基础模型
- Stable Diffusion 1.4/1.5
- 特点:最早的公开版本,支持512×512分辨率,生成写实、插画等多种风格。
- 用途:通用文本到图像生成,兼容多数第三方插件和微调模型。
- 注意:1.5是1.4的优化版,修复了部分生成问题。
- Stable Diffusion 2.0/2.1
- 特点:支持更高分辨率(768×768),改进文本编码器(OpenCLIP),但部分用户认为风格较1.5更“保守”。
- 用途:适合生成细节更丰富的图像,需搭配适配的提示词。
- 分支:2.1版本优化了人像生成效果。
二、热门社区微调模型
- DreamShaper
- 风格:艺术感强,融合写实与插画风格,适合人物、场景设计。
- 适用场景:概念艺术、游戏角色、电影风格渲染。
- 版本:常见v6、v7等迭代版本,逐步优化细节。
- Deliberate
- 风格:高细节、高写实,光影表现优秀。
- 适用场景:摄影级图像、商业海报、产品设计。
- 提示词:需详细描述(如“8k, ultra-detailed, cinematic lighting”)。
- Realistic Vision
- 风格:极致写实,接近真实照片。
- 适用场景:人像摄影、服装展示、建筑渲染。
- 依赖项:常需搭配面部修复插件(如GFPGAN)。
- Waifu Diffusion
- 风格:日系二次元/动漫风格。
- 适用场景:动漫角色、插画、轻小说配图。
- 数据源:基于Danbooru数据集训练。
- Protogen
- 风格:混合多种风格(科幻、奇幻、写实)。
- 特点:模型融合技术,适应复杂提示词。
- 分支:Protogen X3.4、X5.8等版本侧重不同领域。
- OpenJourney
- 风格:模仿MidJourney的鲜艳色彩和艺术感。
- 适用场景:抽象艺术、插画、创意设计。
- 提示词:使用“mdjrny-v4 style”等关键词触发风格。
三、特殊用途模型
- Anything V3/V4/V5
- 风格:专为二次元/动漫优化,支持NSFW内容。
- 适用场景:同人创作、角色设计。
- 注意:部分平台限制使用,需遵守内容政策。
- ChilloutMix
- 风格:亚洲风格人像,侧重真实肤质和五官。
- 适用场景:写真、时尚摄影、广告。
- 依赖项:推荐搭配LoRA(如KoreanDollLikeness)。
- Inkpunk Diffusion
- 风格:蒸汽朋克、机械科幻风。
- 适用场景:概念设计、游戏场景、赛博朋克主题。
- Robo Diffusion
- 风格:未来科技、机器人、机甲。
- 适用场景:科幻插画、影视概念设计。
四、模型获取与使用
- 下载平台
- Hugging Face Hub:官方模型和部分社区模型(需注册)。
- Civitai(https://civitai.com):最大的Stable Diffusion模型社区,提供模型、LoRA、Embedding等资源。
- GitHub:开发者发布的实验性模型。
- 文件格式
- .ckpt:完整模型权重(较大,需注意安全风险)。
- .safetensors:安全格式,避免恶意代码。
- 安装方法
- 将模型文件放入WebUI的
models/Stable-diffusion
文件夹,重启后选择使用。
- 将模型文件放入WebUI的
五、使用建议
- 根据需求选模型:写实选Realistic Vision,动漫选Waifu Diffusion,艺术选DreamShaper。
- 提示词适配:不同模型需调整关键词(如添加风格触发词)。
- 参数调整:部分模型需降低
CFG Scale
或调整采样步数(如Euler a vs DPM++ 2M)。 - 合规性:避免生成侵权或违规内容,遵守模型许可协议。
六、总结
Stable Diffusion的模型生态丰富,选择适合场景的模型能大幅提升生成效果。初学者可从官方1.5或DreamShaper入手,逐步尝试社区微调模型。使用前务必了解模型特性,并合理配置提示词与参数。
本文来自投稿,不代表首晒立场,如若转载,请注明出处:https://www.shoushai.com/p/1101