V4 于 2022 年 11 月发布,并于 2022 年 12 月 20 日至 2023 年 3 月 30 日期间作为默认模型。
「V4 是一个完全新的代码库和全新的 AI 架构,」Midjourney 创始人 David Holz 在 Discord 公告中写道。「这是我们在新的 Midjourney AI 超级集群上训练的第一个模型,已经酝酿了 9 个多月。」
V4 基础模型的新功能
更多的知识(关于生物、地点等)
V4 对生物、地点、物体等有更多的了解。它对世界的理解比之前的版本丰富得多,你可以描述更具体的事物,它更有可能准确地生成出来。
更好地处理小细节(在所有情况下)
V4 在处理小细节方面做得更好。无论是纹理、光影还是微小的物体,它都能更准确地呈现。
处理更复杂的提示(具有多个详细级别)
V4 可以处理更复杂的提示,支持多个级别的细节描述。你可以写更长、更详细的提示词,模型能够更好地理解和执行。
多物体/多角色场景效果更好
V4 在处理多物体和多角色场景方面表现更好。多人、多物体的场景处理得更准确,不会出现之前版本中常见的结构混乱问题。
支持图像提示和多提示等高级功能
V4 支持图像提示(Image Prompting)和多提示(Multi-prompts)等高级功能。你可以上传一张图片作为参考,然后用文字描述来修改它;也可以使用 :: 语法将提示词分成多个独立的概念部分。
支持 --chaos 参数(将其从 0 设置为 100)
V4 支持 --chaos 参数,你可以将其设置为 0 到 100,以控制图像网格的多样性。较高的混乱值会产生更多意想不到的创意结果,而较低的值则会产生更可预测和精致的图像。
V4 上采样器的新功能
- 新的上采样器会在原始图像中添加/更改/纠正细节(更像 V3 上采样器)
- 新的上采样器是正在进行的早期工作(它会发生重大变化)
三种风格变体
V4 有三个稍微不同的「口味」,对模型的风格调优进行了微调。你可以通过在 V4 提示末尾添加 --style 4a、--style 4b 或 --style 4c 来试验这些版本。
4c是默认版本,支持高达 1:2 或 2:1 的宽高比4a和4b仅支持 1:1、2:3 和 3:2 的宽高比
其他说明
V4 目前仍处于 Alpha 阶段,因此团队将继续修复新模型的怪癖。公司计划提高 V4 放大图像的分辨率和质量,添加自定义宽高比(如 V3),提高图像清晰度,并减少文本伪影。