
1. Midjourney提示词:基础知识
什么是Midjourney
- Midjourney是一种先进的生成式AI模型,可以把提示词变成图像
- Midjourney使用文字描述(文本提示词)和图像(图像提示词)来生成高质量图像
- Midjourney目前是图像生成领域的最先进模型,其次是DALL-E、Grok、Flux、Adobe Firefly和Stable Diffusion等
- Midjourney由一个独立研究实验室(Midjourney公司)的研究团队开发,由David Holz领导
Midjourney是如何工作的?
- Midjourney使用扩散模型来生成图像
- 这个过程是通过多个步骤,逐渐将随机噪声转变为图像
- 模型是在大量配对的图像和文字描述数据集上训练的
- 由于Midjourney是一家独立的、自筹资金的公司,具体技术细节并未公开
Midjourney提示词的组成部分
- 文本、图像和参数是提示Midjourney的主要元素
- 不必使用所有元素,但它们可以帮助完善提示词,从Midjourney获得最佳输出
- 这些元素及其子类别将在课程中进行探讨
Midjourney的图像提示
- 图像可以用三种方式使用:图像参考、角色参考和风格参考
- 可以同时使用多张图片
- 同一张图片可以用于多种参考类型
- 用户可以使用"探索"和"创建"工作区的图像,或上传JPG、GIF或PNG格式的图像
2. Midjourney提示词指南:基本结构
模型选择
-
默认模型(6.1版本)- 2024年7月30日发布
-
动漫风格模型"Niji"(6版本)
默认模型可以处理多种风格和主题。相比之下,Niji模型用于动漫和插图风格,特别适合动态动作镜头和以角色为中心的构图。
模型选择建议
- 对于大多数任务,建议使用最新版本的模型,这是最佳选择
- 对于动漫或插图风格的图像,使用最新的Niji模型
- 对于非动漫/插图需求,使用最新的默认模型
文本提示的一般技巧
- 初学时保持提示词简短简单,注重简洁描述
- 使用四个要素构建提示词:主体、动作、媒介和风格
- 未指定的细节将由默认风格填充
- 添加更多细节可以更好地控制,但会增加复杂性
Prompt
A cat, lying on a sofa, pencil drawing, in the style of minimalism
Midjourney提示词格式
- 将主体放在提示词的开头,然后是风格或构图细节
- 用逗号分隔不同的元素
- 避免多余的短语,如"给我展示一张..."或"生成一张..."
- 保持提示词的重点,删除不必要的词
Prompt:
Three brightly glowing red orbs, in a dark forest with thick mist, dynamic lighting, and an eerie atmosphere
提示词长度限制
- 系统可能会忽略超过约40个词的内容
- 超过60个词的内容很可能被忽略
- 超过80个词的内容几乎肯定会被截断
- 为了最大效果,让提示词简洁,集中在重要元素上
Midjourney提示词的词语选择
- 选择特定词语很重要,因为它们会对生成的结果产生重大影响(例如,使用"big"和"massive"的区别)
- 使用清晰、具体的描述,而不是像"cool"或"nice"这样的泛泛之词
- 艺术相关术语如"cinematic"或"photorealistic"是生成特定风格图像的有效关键词
Prompt
A smiling woman holding a big apple
Prompt
A smiling woman holding a massive apple
使用ChatGPT增强Midjourney提示词
通过使用ChatGPT帮助制作Midjourney提示词,发挥多种AI工具的力量。这种方法可以显著提高生成图像的质量和创造性。这个过程包括:
- 向ChatGPT描述你的初始概念
- 请ChatGPT用适当的细节和术语扩展和完善你的描述
- 将增强后的描述作为Midjourney提示词
- 根据结果进行迭代
3. 有效提示词的关键元素
背景和细节
- 主体: 人物、动物、角色、地点、物体
- 媒介: 照片、绘画、插图、雕塑、涂鸦、挂毯
- 环境: 室内、户外、月球上、水下、城市中
- 光线: 柔和、环境光、阴天、霓虹灯、摄影棚灯光、黄金时段
- 颜色: 柔和、明亮、多彩、黑白、粉彩
- 情绪: 平静、热闹、充满活力、不祥
Prompt:
A mystical cat (Subject) sitting on a mossy rock by a forest stream, digital painting (Medium), in a and magical forest environment (Environment), soft ambient lighting (Lighting), colorful and pastel palette (Color), calm and enchanting mood (Mood)
镜头和构图类型
-
使用特定的镜头类型有助于模型生成更好的图像,如果你已经有构图想法
-
使用这些术语帮助模型进行图像构图:
○ Portrait(肖像)
○ Headshot(头像)
○ Close-up(特写)
○ Medium shot(中景)
○ Wide shot(广角)
○ Bird's eye view(鸟瞰图)
○ Over-the-shoulder(肩膀视角)
○ Low-angle shot(低角度拍摄)
○ High-angle view(高角度视图)
○ POV(第一人称视角)
○ Establishing shot(建立镜头)
○ Macro shot(微距拍摄)
Prompt
A cat the air, in a field of wheat, bird's eye view
Prompt
A cat the air, in a field of wheat, portrait shot
在图像中生成文字
- 在图像中生成文字可能具有挑战性
- 在引号中包含所需文字:"文字"
- 使用特定的提示短语,如:
- "insert text" written on a sign(写在标志上的"插入文字")
- The text "insert text" glowing on a neon sign(霓虹灯标志上发光的"插入文字")
- Hot coals in a fire pit forming the words "insert text"(火坑中的炭火形成的"插入文字")
- 保持文字简短,因为完整句子通常无法正确生成
- 如果需要,指定文字的风格或上下文
Prompt
A rustic wooden sign in a lush green meadow, with the text "Welcome" written in bold, hand-painted letters, soft sunlight, and a naturalistic style
摄影风格提示
要生成摄影风格的图像,请指定:
- 相机类型:Sony A7, Nikon Z, Fujifilm X-T5, Canon EOS, dash cam, security camera, GoPro, DSLR, Polaroid, analog, digital
- 胶片类型:Daguerreotype, Washi film, Cyanotype, Ilford XP2 film, Cinestill 800T, redscale, Kodak portra 160, 35mm film
- 镜头类型:tilt shift lens, fisheye lens, macro lens
- 光学效果:lens, light, chromatic aberrations, double exposure, long exposure, motion blur, zoom blur
在提示词末尾添加"--style raw"参数
Prompt
Photo of a street name sign, "Photographic Styles" written on the sign, DSLR, 35mm film, tilt shift lens
4. 高级参数控制
参数介绍
- 参数是用来自定义提示词和指导图像生成的工具
- 它们添加在Imagine栏中文本提示词之后
- 参数以两个破折号"--"开头,后跟参数名称/缩写,有时还有数值
- 多个参数可以一起使用,用空格分隔
宽高比 —ar
- 可以在提示词中使用参数"--ar x:x"定义宽高比
- 它会覆盖设置中应用于生成任务的任何当前设置
- 提供的示例提示词:"A portrait of a woman in a red dress --ar 9:16"
- 比例限制为高/宽1:14 / 14:1
模型版本
- 对应设置中的"Version",定义使用哪个模型版本
- 使用"--v x"参数,其中x表示模型编号
- 接受的值:1, 2, 3, 4, 5, 5.0, 5.1, 5.2, 6, 和6.1
- 对于Niji模型,使用"--niji"获取最新版本,或"--niji"后跟4或5获取旧版本
风格化 —s
- 对应"Stylization"设置,控制Midjourney美学的应用强度
- 使用"--s x",其中x是0到1000之间的值
- 默认级别是100
- 低值产生与提示词紧密匹配但艺术性较低的图像
- 高值创建更具艺术性的图像,但可能与原始提示词有更大偏差
怪异 —w
- 对应设置中的""
- 使用"--w x",其中x范围从0到3000
- 默认值是0
- 更高的值会创建越来越奇怪和不可预测的生成
混沌 —c
- 对应设置中的"Variety",影响每个提示词生成的4张图像批次的多样性
- 使用"--c x",x表示0-100范围内的值
- 默认值是0
- 高值产生更不寻常和意外的结果和构图
- 低值有更可靠和可重复的结果
图像权重 —iw
- 只能与图像提示一起使用
- 定义图像提示对生成结果的影响强度
- 使用"--iw x"参数,其中x范围从0到3
- 默认值是1
角色权重 —cw
- 只能与角色参考图像一起使用
- 定义角色参考提示对生成结果的影响强度
- 使用"--cw x"参数,值范围从0-100
- 默认值是100
风格权重 —sw
- 只能与提示词中的风格参考代码或图像一起使用
- 定义风格参考图像或代码对生成结果的影响强度
- 使用"--sw x"参数,值范围从0到1000
- 默认值是100
负面提示 —no
- "--no x"参数告诉Midjourney在生成的图像中排除什么
- 负面提示中可以包含多个词,用逗号分隔
- 示例提示:"A hand holding a baseball --no red, green, stadium"
- 如果想避免特定元素,不应将它们包含在提示词的中心文本部分
重复 —r
- 该参数允许多次生成相同的提示词,无需重新启动生成任务
- 根据订阅级别,值范围不同:
- 基础订阅用户:2-4
- 标准订阅用户:2-10
- 专业和超级订阅用户:2-40
- 只能在Fast和Turbo模式下使用
质量 —q
- "--q"参数影响图像生成速度和GPU积分
- 较低的值生成细节较少的图像,有助于尝试新的提示词
- 较高的值消耗更多积分,可以改善图像纹理和细节,但可能降低连贯性
- 接受的值:
- 模型版本6.1:0.5 - 2
- 模型版本6:0.25 - 1
- 默认值是1
风格
- 与风格化不同
- 对应设置中的"Mode",允许在标准和原始风格之间切换
- 使用"--style raw"最小化Midjourney默认风格的影响,创建更逼真和自然的图像
停止
- "--stop x"参数在过程中途完成图像生成
- x值应在10-100之间(百分比)
- 较低的值创建更模糊、细节更少的结果
- 默认值是100
- 提供的示例提示:"A hand holding a baseball --stop 50"
速度模式(放松、快速、涡轮)
- 放松模式(--relax):较慢但有无限制的生成能力。仅标准计划或更高级别可用
- 快速模式(--fast):这是默认设置。如果在设置中选择了其他模式,可以在提示词中包含"--fast"激活它
- 涡轮模式(--turbo):最快的选项(最多快4倍),但使用两倍的积分
瓷砖
- "--tile"参数生成可用作无缝重复图案或纹理的图像
- 对创建以下内容有帮助:
- 壁纸
- 游戏纹理
- 包装纸设计
- 重要限制:此功能不适用于Niji模型
个性化
- 在个性化工作区中通过对图像进行排名训练个性化模型后,"--p"参数变得可用
- Midjourney为你偏好的风格生成一个唯一代码,可以与他人分享
- 需要对至少40张图像进行排名才能使用个性化功能,排名的图像越多,效果越好
5. Midjourney艺术风格提示:使用参考图像
Midjourney风格提示
- 风格参考图像用于影响生成图像的整体风格和美学
- 你可以使用"--sw"参数控制风格参考效果强度(下一章详述)
- 使用你选择的准备材料图像作为提示
角色参考
- 角色参考允许你在多种不同情况下使用相同的角色
- 建议使用只有一个角色的图像以获得最佳效果
- 角色参考与Midjourney生成的图像效果最佳
- 虽然不完美,模型可能会错过徽标或雀斑等细微细节
- 可以使用"--cw"参数调整角色参考的强度
多重参考
- 使用多种不同的参考图像可以让你"混合"图像
- 你可以合并来自多个图像的不同美学、角色和构图,创建独特的输出
- 可以使用你生成的图像或探索工作区中的图像,分配不同角色:
- 一个作为图像提示
- 另一个作为风格参考
- 第三个作为角色参考
6. 结论:掌握Midjourney提示词技巧
创建有效的Midjourney提示词既是一门艺术,也是一门科学。正如本指南所探讨的,提示词的质量直接影响你生成的图像。通过理解基本结构、参数和参考技术,你可以显著改善结果,释放AI图像生成的全部创意潜力。
从灵感到实现
无论你是数字艺术家、设计师、营销人员还是创意爱好者,能够精确地将你的愿景传达给像Midjourney这样的AI工具,都能打开无限可能。记住这些关键要点:
- 从清晰、具体的主体描述开始
- 在适当时加入艺术风格参考
- 战略性地使用参数来微调结果
- 尝试使用参考图像引导AI
- 根据结果不断完善你的方法
简化你的AI艺术工作流程
如果你想进一步提升Midjourney提示词技能,ImagesArt.ai提供了能显著改善工作流程的补充工具:
- 图像转提示转换器:找到了一张鼓舞人心的图像,但不知道如何为Midjourney描述它?我们的图像转提示工具可以分析任何参考图像,并生成捕捉其基本元素的详细提示描述。当你想重现特定风格或构图,但难以用语言表达时,这特别有价值。
通过将本指南中学到的技巧与这些专业工具结合,你可以开发出更高效、更有效的AI图像生成方法。掌握的关键在于持续练习、深思熟虑的实验,以及从成功和不成功的尝试中学习的意愿。
参考文献
- Midjourney, Inc. (2025). Prompt Basics. Midjourney Documentation.https://docs.midjourney.com/hc/en-us/articles/32023408776205-Prompt-Basics
- Midjourney, Inc. (2025). Parameter List. Midjourney Documentation.https://docs.midjourney.com/hc/en-us/articles/32859204029709-Parameter-List
- Midjourney, Inc. (2025). Multi-Prompts & Weights. Midjourney Documentation.https://docs.midjourney.com/hc/en-us/articles/32658968492557-Multi-Prompts-Weights
- Midjourney, Inc. (2025). Documentation – Midjourney. Midjourney Documentation.https://docs.midjourney.com/hc/en-us/categories/32013335627533-Documentation