我们开发了一套安全缓解体系,为 DALL·E 3 的更广泛发布做好准备,并分享我们在来源研究方面的最新进展。
插图:Valerie Ranum × DALL·E
收听本文
4:17
目录
ChatGPT 中的 DALL·E 3
ChatGPT 现在可以通过简单的对话创建独特的图像——这项新功能即日起向 Plus 和 Enterprise 用户开放。描述你的构想,ChatGPT 将提供一系列视觉效果供你细化和迭代,将其变为现实。你可以直接在聊天中要求修改。这由我们最强大的图像模型 DALL·E 3 提供支持。
- 科学项目
- 网站设计
- 企业标志
我正在为高中科学课做一份关于卷云的报告。我需要能展示它们纤细飘逸特质的照片级真实图像。我打算把它们和我昨天在家拍的蓬松积雨云照片做对比。
OAI
以下是卷云的照片级真实图像,展现了它们纤细、精致的特质。你可以将这些与你拍摄的积雨云照片进行对比,以突出它们在结构和外观上的差异。如果你需要更多信息或帮助,请告诉我!
研究
DALL·E 3 是多项研究进展的结晶,这些进展既来自 OpenAI 内部,也来自外部。与其前身 DALL·E 2 相比,DALL·E 3 生成的图像不仅更具视觉冲击力,细节也更加清晰。DALL·E 3 能够可靠地渲染复杂细节,包括文本、手部和面部。此外,它特别擅长响应广泛、详细的提示词,并且支持横向和纵向两种宽高比。这些能力是通过训练一个最先进的图像字幕生成器来实现的,该生成器为我们训练模型所用的图像生成更好的文本描述。然后,DALL·E 3 在这些改进后的字幕上进行训练,从而使模型更加关注用户提供的字幕。你可以在我们的研究论文中阅读更多关于这个过程的信息。
负责任的开发与部署
我们使用多层安全系统来限制 DALL·E 3 生成潜在有害图像的能力,包括暴力、成人或仇恨内容。安全检查会在用户提示词和生成的图像呈现给用户之前对其进行运行。我们还与早期用户和专家红队测试人员合作,以识别并解决随着新模型能力出现而在我们安全系统覆盖范围中出现的缺口。例如,这些反馈帮助我们识别了图形内容生成的边缘案例(如色情图像),并对模型生成极具误导性图像的能力进行了压力测试。
作为为 DALL·E 3 部署做准备的工作的一部分,我们还采取措施限制模型生成在世艺术家风格内容、公众人物图像的可能性,并改善生成图像中的人口统计代表性。要了解更多关于为 DALL·E 3 广泛部署所做工作的信息,请参阅 DALL·E 3 系统卡。
用户反馈将帮助我们持续改进。ChatGPT 用户可以通过使用标记图标与我们的研究团队分享反馈,告知我们不安全的输出或不能准确反映你向 ChatGPT 提供的提示词的输出。倾听多元化、广泛的用户社区的声音并拥有真实世界的理解,对于负责任地开发和部署人工智能至关重要,也是我们使命的核心。
我们正在研究和评估来源分类器的初始版本——这是一种新的内部工具,可以帮助我们识别图像是否由 DALL·E 3 生成。在早期的内部评估中,当图像未被修改时,它识别图像是否由 DALL·E 生成的准确率超过 99%。当图像经过常见类型的修改(如裁剪、调整大小、JPEG 压缩,或者当真实图像的文本或裁剪片段叠加到生成图像的小部分上)时,其准确率仍保持在 95% 以上。尽管在内部测试中取得了这些强劲的结果,但该分类器只能告诉我们图像很可能是由 DALL·E 生成的,还不能让我们得出明确的结论。这种来源分类器可能会成为帮助人们判断音频或视觉内容是否由人工智能生成的一系列技术之一。这是一个需要在整个人工智能价值链中开展协作的挑战,包括与向用户分发内容的平台协作。我们期待深入了解这个工具的工作原理以及它可能在哪些方面最有用,并随着时间的推移改进我们的方法。
创作控制
DALL·E 3 被设计为拒绝请求以在世艺术家的风格生成图像的要求。我们还为创作者提供了选择,让他们可以选择退出其图像被用于我们未来图像生成模型的训练。