今天,我们正式推出全新的 ChatGPT 图像,由最新旗舰级图像生成模型驱动。无论你是从零开始创作,还是对照片进行编辑,都能更轻松地获得心仪效果。它能在保持人物等细节不变的前提下进行精确修改,生成速度最高提升 4 倍。同时,我们还在 ChatGPT 中加入了全新的图像功能,让图像创作变得更愉悦、更直观,帮助你激发灵感,让创意探索变得毫不费力。
全新的图像模型和相关功能将从今天起在 ChatGPT 中向所有用户陆续开放,并会在 API 中以 gpt-image-1.5 的形式提供。
精准编辑,保留重要细节
现在,当你对上传的图片提出修改需求时,模型会更准确地理解你的意向,细致到每一个小变化。它只会调整你指定的部分,同时保持光线、构图以及人物外观等元素在输入、输出和后续编辑中始终一致。
这让结果更贴近你的构思:更实用的照片编辑、更逼真的服装与发型试穿,以及兼具创意的风格滤镜和概念化变换,同时保留原始图像的核心神韵。这些升级让 ChatGPT 仿佛变成了随身携带的创意工作室,既能处理实用的编辑任务,也能支持更具表现力的全新想象。
编辑
模型在多种编辑方式上都表现出色。无论是添加、移除、组合、融合,还是位置调整,都能准确实现你想要的变化,同时不丢失让图片独特的那些细节。
创意变换
模型的创造力在各种转化中展现得淋漓尽致。它能改变或添加元素,例如文字和版式,让你的想法真正成形,同时保留关键细节。无论是简单的点子还是更复杂的概念,这些转化都能轻松实现。你可以直接在全新的 ChatGPT 图像功能中尝试预设的风格和创意,无需输入文字提示。
遵守指令
模型对指令的遵循比最初版本更加稳定可靠。这让它不仅能进行更精细的编辑,也能创作更复杂的原创构图,并在其中准确保留各元素之间应有的关系。
文本渲染
模型在文字呈现方面再次进化,能够更稳定地处理更密集、更小号的文字。
更多品质提升
模型在其他维度上也进行了优化,让生成结果更易直接使用,例如更稳定地呈现大量小面孔,以及让整体画面看起来更加自然。
全新的创作空间
除了在对话中描述你想看到的内容来生成图像外,我们还在 ChatGPT 中推出了专属的图像区域。你可以在移动端应用的侧边栏或 chatgpt.com 上轻松进入,让图像体验变得更快捷、更直观。这里提供数十种预设滤镜与提示,并会定期更新,紧跟最新趋势,迅速激发创意。
这些升级让你能够创作出更贴近心中愿景的图像。从细微的编辑到完整的再创作,都能轻松实现。图像现在渲染速度最高提升四倍,你还可以在其他图像仍在生成时继续创建新图像——因此你可以探索更多想法而无需等待。
ChatGPT 图像的商用场景
这款模型让业务流程更高效:图像生成更快、编辑更精准、视觉细节在多次迭代中保持一致。团队可以更轻松地探索创意、进行针对性修改,并将复杂或枯燥的概念可视化,适用于营销、设计、电商和内部沟通等多种场景。
改进与不足
我们重新测试了初次发布图像生成功能时的大量示例来评估表现。模型在多种场景中都有明显提升,但结果仍不完美。尽管这一版本代表了实质性的进步,未来的迭代仍有很大的提升空间。
API 中的 GPT Image 1.5
API 提供的 gpt-image-1.5 带来了与 ChatGPT 图像相同的全面升级:在图像保真与编辑能力上都比 GPT Image 1 更强大。
在多次编辑中,你会看到品牌徽标和关键视觉元素得到更稳定的保留。这让模型非常适合用于营销与品牌相关的创意工作,如图形设计和徽标制作;也能帮助电商团队从一张源图生成完整的产品图集,包括不同款式、场景与角度。
在 GPT Image 1.5 中,图像输入与输出的费用相比 GPT Image 1 降低了 20%,让你在相同预算下能够生成并迭代更多图像。
你可以在 OpenAI Playground 中体验新模型,或者阅读提示指南获取灵感。
各类企业与初创团队 — 从创意工具、电商到营销软件等行业 — 已经在使用 GPT Image 1.5。
> "GPT Image 1.5 能生成高保真图像,并严格遵循提示要求,能够很好地保留构图、光线和细节。其输出干净、逼真且高度可靠,能在 Wix 等平台上加速从概念到成品的工作流程。根据我们的测试以及 Wix 的主要使用场景,它的稳定性和质量足以让它成为当下最出色的图像生成模型之一。" > > — Hila Gat,Wix 人工智能研究与数据科学负责人
适用地区
全新的 ChatGPT 图像功能正在面向全球所有 ChatGPT 用户与 API 用户陆续推出,覆盖各类使用界面。它可在不同模型间通用,无需额外选择即可直接使用。
我们相信,图像生成的潜力才刚刚开始释放。今天的更新是向前迈出的重要一步,未来能力还会大幅提升,包括更精准的编辑,以及在多语言环境下生成更丰富、更细致的内容。