Stability AI 团队自豪地发布开源模型 SDXL 1.0,这是文生图生成模型演进的下一个迭代版本。继有限的、仅用于研究的 SDXL 0.9 发布之后,完整版 SDXL 已得到改进,成为世界上最好的开源图像生成模型。
SDXL 1.0 发布图,使用 Stability AI 即将推出的图像控制功能制作。
#### Stability AI 最好的图像模型
SDXL 1.0 是 Stability AI 的旗舰图像模型,也是最好的开源图像生成模型。我们将其与其他各种模型进行了对比测试,结果是确凿的——人们更喜欢 SDXL 1.0 生成的图像,而不是其他开源模型。这一研究结果来自数周来在我们 Discord 上从实验模型生成中收集的偏好数据,以及外部测试。
#### 针对挑战性概念和风格的更好艺术作品
SDXL 几乎可以生成任何艺术风格的高质量图像,是最好的开源照片级真实感模型。可以生成具有独特风格的图像,而不会被模型赋予任何特定的"感觉",确保绝对的风格自由。SDXL 1.0 特别针对鲜艳准确的色彩进行了优化,与前代产品相比具有更好的对比度、光照和阴影,所有这些都在原生 1024x1024 分辨率下实现。
此外,SDXL 可以生成那些图像模型众所周知难以渲染的概念,例如手部和文字,或者空间排列的构图(例如,背景中的女人追逐前景中的狗)。
更好的空间配置和风格控制,包括照片级真实感。
#### 更智能,语言更简单
SDXL 只需要几个词就能创建复杂、详细且美观的图像。用户不再需要使用"杰作"之类的限定词来获得高质量图像。此外,SDXL 能够理解"红场"(一个著名地点)与"红色正方形"(一个形状)等概念之间的区别。
简单的提示词,高质量的输出。
#### 最大的开源图像模型
SDXL 1.0 是所有开放访问图像模型中参数数量最大的之一,拥有 35 亿参数的基础模型和 66 亿参数的模型集成管线(最终输出通过在两个模型上运行并聚合结果来创建)。
完整模型由一个用于潜空间扩散的混合专家管线组成:在第一步中,基础模型生成(带噪声的)潜变量,然后使用专门用于最终去噪步骤的精炼模型进行进一步处理。请注意,基础模型也可以作为独立模块使用。
这种两阶段架构确保了图像生成的稳健性,同时不会牺牲速度或需要过多的计算资源。SDXL 1.0 应该可以在具有 8GB VRAM 的消费级 GPU 或现成的云实例上有效运行。
#### 微调和高级控制
借助 SDXL 1.0,根据自定义数据微调模型比以往更容易。可以生成自定义 LoRA 或检查点,而无需太多数据整理工作。Stability AI 团队正在构建下一代特定任务的结构、风格和构图控制,以及专为 SDXL 设计的 T2I / ControlNet。这些功能目前处于测试预览阶段,请继续关注微调方面的更新。
SDXL 的图像控制功能即将推出。
#### 开始使用 SDXL
有多种方式可以开始使用 SDXL 1.0:
- SDXL 1.0 已在 Clipdrop 上线。点击 此链接。
- SDXL 1.0 的权重及相关源代码已在 Stability AI GitHub 页面 上发布。
- SDXL 1.0 也已在 Stability AI 平台 上作为 API 发布。
- SDXL 1.0 可在 AWS Sagemaker 和 AWS Bedrock 上使用。
- Stable Foundation Discord 开放用于 SDXL 模型的实时测试。
- DreamStudio 也提供 SDXL 1.0 用于图像生成。
在各种平台上生成高质量图像。
#### 许可证
SDXL 1.0 根据 CreativeML OpenRAIL++-M 许可证发布。有关此许可证的详细信息可以在 这里 找到。
#### 联系我们
如需更多信息或提供反馈:
请联系 research@stability.ai 与研究团队联系,
如需媒体采访,请联系 press@stability.ai。
加入我们的 Discord 社区,及时了解最新动态并体验我们的最新模型。