发布 SDXL 1.0

Stability AI 团队自豪地发布开源模型 SDXL 1.0,这是文生图生成模型演进的下一个迭代版本。继有限的、仅用于研究的 SDXL 0.9 发布之后,完整版 SDXL 已得到改进,成为世界上最好的开源图像生成模型。

SDXL 1.0 发布图,使用 Stability AI 即将推出的图像控制功能制作。

#### Stability AI 最好的图像模型

SDXL 1.0 是 Stability AI 的旗舰图像模型,也是最好的开源图像生成模型。我们将其与其他各种模型进行了对比测试,结果是确凿的——人们更喜欢 SDXL 1.0 生成的图像,而不是其他开源模型。这一研究结果来自数周来在我们 Discord 上从实验模型生成中收集的偏好数据,以及外部测试。

#### 针对挑战性概念和风格的更好艺术作品

SDXL 几乎可以生成任何艺术风格的高质量图像,是最好的开源照片级真实感模型。可以生成具有独特风格的图像,而不会被模型赋予任何特定的"感觉",确保绝对的风格自由。SDXL 1.0 特别针对鲜艳准确的色彩进行了优化,与前代产品相比具有更好的对比度、光照和阴影,所有这些都在原生 1024x1024 分辨率下实现。

此外,SDXL 可以生成那些图像模型众所周知难以渲染的概念,例如手部和文字,或者空间排列的构图(例如,背景中的女人追逐前景中的狗)。

更好的空间配置和风格控制,包括照片级真实感。

#### 更智能,语言更简单

SDXL 只需要几个词就能创建复杂、详细且美观的图像。用户不再需要使用"杰作"之类的限定词来获得高质量图像。此外,SDXL 能够理解"红场"(一个著名地点)与"红色正方形"(一个形状)等概念之间的区别。

简单的提示词,高质量的输出。

#### 最大的开源图像模型

SDXL 1.0 是所有开放访问图像模型中参数数量最大的之一,拥有 35 亿参数的基础模型和 66 亿参数的模型集成管线(最终输出通过在两个模型上运行并聚合结果来创建)。

完整模型由一个用于潜空间扩散的混合专家管线组成:在第一步中,基础模型生成(带噪声的)潜变量,然后使用专门用于最终去噪步骤的精炼模型进行进一步处理。请注意,基础模型也可以作为独立模块使用。

这种两阶段架构确保了图像生成的稳健性,同时不会牺牲速度或需要过多的计算资源。SDXL 1.0 应该可以在具有 8GB VRAM 的消费级 GPU 或现成的云实例上有效运行。

#### 微调和高级控制

借助 SDXL 1.0,根据自定义数据微调模型比以往更容易。可以生成自定义 LoRA 或检查点,而无需太多数据整理工作。Stability AI 团队正在构建下一代特定任务的结构、风格和构图控制,以及专为 SDXL 设计的 T2I / ControlNet。这些功能目前处于测试预览阶段,请继续关注微调方面的更新。

SDXL 的图像控制功能即将推出。

#### 开始使用 SDXL

有多种方式可以开始使用 SDXL 1.0:

  • SDXL 1.0 已在 Clipdrop 上线。点击 此链接

  • SDXL 1.0 的权重及相关源代码已在 Stability AI GitHub 页面 上发布。

在各种平台上生成高质量图像。

#### 许可证

SDXL 1.0 根据 CreativeML OpenRAIL++-M 许可证发布。有关此许可证的详细信息可以在 这里 找到。

#### 联系我们

如需更多信息或提供反馈:

请联系 research@stability.ai 与研究团队联系,

如需媒体采访,请联系 press@stability.ai

加入我们的 Discord 社区,及时了解最新动态并体验我们的最新模型。

ESC

输入关键词开始搜索

支持搜索标题、内容、标签