Version 6

V6 于 2023 年 12 月 20 日发布,并于 2024 年 2 月 14 日至 7 月 30 日期间作为默认版本。

「这个模型可以生成比我们之前发布的任何版本都更真实的图像,」Midjourney 创始人 David Holz 在 Discord 服务器的公告中写道。Holz 表示,V6 实际上是「在我们的 AI 超级集群上从零开始训练的第三个模型」,历时九个月开发完成。

V6 基础模型的新功能

更准确的提示词遵循,支持更长的提示词

V6 对提示词的理解更加准确,能够处理更长、更详细的自然语言描述。模型会更认真地对待你写的每一个词,生成的结果更接近你的描述。

改进的连贯性和模型知识

V6 具有更高的图像连贯性,模型知识也更加丰富。它对世界的理解更深入,能够更准确地生成各种生物、地点、物体等。

改进的图像提示和混合(Remix)

图像提示功能得到了增强,Remix 模式的效果也更好。你可以更精确地控制图像的变化和修改。

次要的文本绘制能力

V6 首次支持在图像中生成文本。你必须将文本写在「引号」中,使用 --style raw 或更低的 --stylize 值可能会有帮助。

示例: /imagine a photo of the text "Hello World!" written with a marker on a sticky note --ar 16:9 --v 6

改进的放大器

V6 拥有改进的放大器,包括「Subtle」(微妙)和「Creative」(创意)两种模式,可以将分辨率提高 2 倍。点击 U1/U2/U3/U4 后,你可以在图像下方找到这些按钮。

发布时支持的功能

  • --ar 宽高比
  • --chaos 混乱度
  • --weird 怪异度
  • --tile 无缝平铺
  • --stylize 风格化
  • --style raw 原始模式
  • Vary (subtle) 微妙变化
  • Vary (strong) 强烈变化
  • Remix 混合模式
  • /blend 混合
  • /describe 描述(V5 版本)

即将推出的功能

  • Pan 平移
  • Zoom 缩放
  • Vary (region) 区域变化
  • /tune 风格调谐器
  • /describe 描述(新 V6 版本)

提示词建议

V6 的提示词方式与以往版本有很大不同,你需要重新学习如何写提示词。

  • 明确表达你想要的内容:避免使用「award winning」、「photorealistic」、「4k」、「8k」等无关紧要的词
  • 使用 --style raw:如果你想要更具摄影感、更中立、更直接的效果,可以默认使用 --style raw
  • 调整 --stylize:较低的 --stylize 值(默认 100)可能会有更好的提示理解,而较高的值(最高 1000)可能会有更好的美学效果

其他说明

V6 目前处于 alpha 测试阶段,会随时变化。在接下来的几周内,速度、图像质量、连贯性、提示遵循和文本准确性应该会有所提高。

V6 的速度比 V5 略慢,成本也更高,但团队希望随着时间的推移能够加快模型速度。

ESC

输入关键词开始搜索

支持搜索标题、内容、标签