发布 SDXL 1.0 - Stable Diffusion

Stability AI 团队自豪地发布开源模型 SDXL 1.0，这是文生图生成模型演进的下一个迭代版本。继有限的、仅用于研究的 SDXL 0.9 发布之后，完整版 SDXL 已得到改进，成为世界上最好的开源图像生成模型。

SDXL 1.0 发布图，使用 Stability AI 即将推出的图像控制功能制作。

#### Stability AI 最好的图像模型

SDXL 1.0 是 Stability AI 的旗舰图像模型，也是最好的开源图像生成模型。我们将其与其他各种模型进行了对比测试，结果是确凿的——人们更喜欢 SDXL 1.0 生成的图像，而不是其他开源模型。这一研究结果来自数周来在我们 Discord 上从实验模型生成中收集的偏好数据，以及外部测试。

#### 针对挑战性概念和风格的更好艺术作品

SDXL 几乎可以生成任何艺术风格的高质量图像，是最好的开源照片级真实感模型。可以生成具有独特风格的图像，而不会被模型赋予任何特定的"感觉"，确保绝对的风格自由。SDXL 1.0 特别针对鲜艳准确的色彩进行了优化，与前代产品相比具有更好的对比度、光照和阴影，所有这些都在原生 1024x1024 分辨率下实现。

此外，SDXL 可以生成那些图像模型众所周知难以渲染的概念，例如手部和文字，或者空间排列的构图（例如，背景中的女人追逐前景中的狗）。

更好的空间配置和风格控制，包括照片级真实感。

#### 更智能，语言更简单

SDXL 只需要几个词就能创建复杂、详细且美观的图像。用户不再需要使用"杰作"之类的限定词来获得高质量图像。此外，SDXL 能够理解"红场"（一个著名地点）与"红色正方形"（一个形状）等概念之间的区别。

简单的提示词，高质量的输出。

#### 最大的开源图像模型

SDXL 1.0 是所有开放访问图像模型中参数数量最大的之一，拥有 35 亿参数的基础模型和 66 亿参数的模型集成管线（最终输出通过在两个模型上运行并聚合结果来创建）。

完整模型由一个用于潜空间扩散的混合专家管线组成：在第一步中，基础模型生成（带噪声的）潜变量，然后使用专门用于最终去噪步骤的精炼模型进行进一步处理。请注意，基础模型也可以作为独立模块使用。

这种两阶段架构确保了图像生成的稳健性，同时不会牺牲速度或需要过多的计算资源。SDXL 1.0 应该可以在具有 8GB VRAM 的消费级 GPU 或现成的云实例上有效运行。

#### 微调和高级控制

借助 SDXL 1.0，根据自定义数据微调模型比以往更容易。可以生成自定义 LoRA 或检查点，而无需太多数据整理工作。Stability AI 团队正在构建下一代特定任务的结构、风格和构图控制，以及专为 SDXL 设计的 T2I / ControlNet。这些功能目前处于测试预览阶段，请继续关注微调方面的更新。

SDXL 的图像控制功能即将推出。