如何写好Midjourney提示词

1. Midjourney提示词：基础知识

什么是Midjourney

Midjourney是一种先进的生成式AI模型，可以把提示词变成图像
Midjourney使用文字描述（文本提示词）和图像（图像提示词）来生成高质量图像
Midjourney目前是图像生成领域的最先进模型，其次是DALL-E、Grok、Flux、Adobe Firefly和Stable Diffusion等
Midjourney由一个独立研究实验室（Midjourney公司）的研究团队开发，由David Holz领导

Midjourney是如何工作的？

Midjourney中的扩散过程示意图

Midjourney使用扩散模型来生成图像
这个过程是通过多个步骤，逐渐将随机噪声转变为图像
模型是在大量配对的图像和文字描述数据集上训练的
由于Midjourney是一家独立的、自筹资金的公司，具体技术细节并未公开

Midjourney提示词的组成部分

Midjourney提示词元素的可视化分解

文本、图像和参数是提示Midjourney的主要元素
不必使用所有元素，但它们可以帮助完善提示词，从Midjourney获得最佳输出
这些元素及其子类别将在课程中进行探讨

Midjourney的图像提示

Midjourney中不同图像提示类型的插图

图像可以用三种方式使用：图像参考、角色参考和风格参考
可以同时使用多张图片
同一张图片可以用于多种参考类型
用户可以使用"探索"和"创建"工作区的图像，或上传JPG、GIF或PNG格式的图像

2. Midjourney提示词指南：基本结构

模型选择

Midjourney模型选择用户界面

默认模型（6.1版本）- 2024年7月30日发布
动漫风格模型"Niji"（6版本）

默认模型可以处理多种风格和主题。相比之下，Niji模型用于动漫和插图风格，特别适合动态动作镜头和以角色为中心的构图。

模型选择建议

对于大多数任务，建议使用最新版本的模型，这是最佳选择
对于动漫或插图风格的图像，使用最新的Niji模型
对于非动漫/插图需求，使用最新的默认模型

文本提示的一般技巧

初学时保持提示词简短简单，注重简洁描述
使用四个要素构建提示词：主体、动作、媒介和风格
未指定的细节将由默认风格填充
添加更多细节可以更好地控制，但会增加复杂性

沙发上猫咪的极简铅笔画

Prompt

A cat, lying on a sofa, pencil drawing, in the style of minimalism

Midjourney提示词格式

将主体放在提示词的开头，然后是风格或构图细节
用逗号分隔不同的元素
避免多余的短语，如"给我展示一张..."或"生成一张..."
保持提示词的重点，删除不必要的词

雾蒙蒙的黑暗森林中发光的红色球体

Prompt:

Three brightly glowing red orbs, in a dark forest with thick mist, dynamic lighting, and an eerie atmosphere

提示词长度限制

系统可能会忽略超过约40个词的内容
超过60个词的内容很可能被忽略
超过80个词的内容几乎肯定会被截断
为了最大效果，让提示词简洁，集中在重要元素上

Midjourney提示词的词语选择

选择特定词语很重要，因为它们会对生成的结果产生重大影响（例如，使用"big"和"massive"的区别）
使用清晰、具体的描述，而不是像"cool"或"nice"这样的泛泛之词
艺术相关术语如"cinematic"或"photorealistic"是生成特定风格图像的有效关键词

一个女人拿着大苹果，展示词语选择效果

Prompt

A smiling woman holding a big apple

一个女人拿着超大苹果，展示词语选择的影响

Prompt

A smiling woman holding a massive apple

使用ChatGPT增强Midjourney提示词

通过使用ChatGPT帮助制作Midjourney提示词，发挥多种AI工具的力量。这种方法可以显著提高生成图像的质量和创造性。这个过程包括：

向ChatGPT描述你的初始概念
请ChatGPT用适当的细节和术语扩展和完善你的描述
将增强后的描述作为Midjourney提示词
根据结果进行迭代

3. 有效提示词的关键元素

背景和细节

主体： 人物、动物、角色、地点、物体
媒介： 照片、绘画、插图、雕塑、涂鸦、挂毯
环境： 室内、户外、月球上、水下、城市中
光线： 柔和、环境光、阴天、霓虹灯、摄影棚灯光、黄金时段
颜色： 柔和、明亮、多彩、黑白、粉彩
情绪： 平静、热闹、充满活力、不祥

森林小溪旁的神秘猫咪，带有详细提示元素

Prompt:

A mystical cat (Subject) sitting on a mossy rock by a forest stream, digital painting (Medium), in a and magical forest environment (Environment), soft ambient lighting (Lighting), colorful and pastel palette (Color), calm and enchanting mood (Mood)

镜头和构图类型

使用特定的镜头类型有助于模型生成更好的图像，如果你已经有构图想法
使用这些术语帮助模型进行图像构图：

○ Portrait（肖像）

○ Headshot（头像）

○ Close-up（特写）

○ Medium shot（中景）

○ Wide shot（广角）

○ Bird's eye view（鸟瞰图）

○ Over-the-shoulder（肩膀视角）

○ Low-angle shot（低角度拍摄）

○ High-angle view（高角度视图）

○ POV（第一人称视角）

○ Establishing shot（建立镜头）

○ Macro shot（微距拍摄）

Prompt

A cat the air, in a field of wheat, bird's eye view

肖像方向的麦田中的猫

Prompt

A cat the air, in a field of wheat, portrait shot

在图像中生成文字

在图像中生成文字可能具有挑战性
在引号中包含所需文字："文字"
使用特定的提示短语，如：
- "insert text" written on a sign（写在标志上的"插入文字"）
- The text "insert text" glowing on a neon sign（霓虹灯标志上发光的"插入文字"）
- Hot coals in a fire pit forming the words "insert text"（火坑中的炭火形成的"插入文字"）
保持文字简短，因为完整句子通常无法正确生成
如果需要，指定文字的风格或上下文

草地中的欢迎标志，展示图像中的文字生成

Prompt

A rustic wooden sign in a lush green meadow, with the text "Welcome" written in bold, hand-painted letters, soft sunlight, and a naturalistic style

摄影风格提示

要生成摄影风格的图像，请指定：

相机类型：Sony A7, Nikon Z, Fujifilm X-T5, Canon EOS, dash cam, security camera, GoPro, DSLR, Polaroid, analog, digital
胶片类型：Daguerreotype, Washi film, Cyanotype, Ilford XP2 film, Cinestill 800T, redscale, Kodak portra 160, 35mm film
镜头类型：tilt shift lens, fisheye lens, macro lens
光学效果：lens, light, chromatic aberrations, double exposure, long exposure, motion blur, zoom blur

在提示词末尾添加"--style raw"参数

街道标志，展示摄影风格提示技巧