
1. Midjourney提示詞:基礎知識
什麼是Midjourney
- Midjourney是一種先進的生成式AI模型,可以把提示詞變成圖像
- Midjourney使用文字描述(文本提示詞)和圖像(圖像提示詞)來生成高品質圖像
- Midjourney目前是圖像生成領域的最先進模型,其次是DALL-E、Grok、Flux、Adobe Firefly和Stable Diffusion等
- Midjourney由一個獨立研究實驗室(Midjourney公司)的研究團隊開發,由David Holz領導
Midjourney是如何工作的?
- Midjourney使用擴散模型來生成圖像
- 這個過程是通過多個步驟,逐漸將隨機噪聲轉變為圖像
- 模型是在大量配對的圖像和文字描述數據集上訓練的
- 由於Midjourney是一家獨立的、自籌資金的公司,具體技術細節並未公開
Midjourney提示詞的組成部分
- 文本、圖像和參數是提示Midjourney的主要元素
- 不必使用所有元素,但它們可以幫助完善提示詞,從Midjourney獲得最佳輸出
- 這些元素及其子類別將在課程中進行探討
Midjourney的圖像提示
- 圖像可以用三種方式使用:圖像參考、角色參考和風格參考
- 可以同時使用多張圖片
- 同一張圖片可以用於多種參考類型
- 用戶可以使用「探索」和「創建」工作區的圖像,或上傳JPG、GIF或PNG格式的圖像
2. Midjourney提示詞指南:基本結構
模型選擇
-
預設模型(6.1版本)- 2024年7月30日發布
-
動漫風格模型「Niji」(6版本)
預設模型可以處理多種風格和主題。相比之下,Niji模型用於動漫和插圖風格,特別適合動態動作鏡頭和以角色為中心的構圖。
模型選擇建議
- 對於大多數任務,建議使用最新版本的模型,這是最佳選擇
- 對於動漫或插圖風格的圖像,使用最新的Niji模型
- 對於非動漫/插圖需求,使用最新的預設模型
文本提示的一般技巧
- 初學時保持提示詞簡短簡單,注重簡潔描述
- 使用四個要素構建提示詞:主體、動作、媒介和風格
- 未指定的細節將由預設風格填充
- 添加更多細節可以更好地控制,但會增加複雜性
提示詞
A cat, lying on a sofa, pencil drawing, in the style of minimalism
Midjourney提示詞格式
- 將主體放在提示詞的開頭,然後是風格或構圖細節
- 用逗號分隔不同的元素
- 避免多餘的短語,如「給我展示一張...」或「生成一張...」
- 保持提示詞的重點,刪除不必要的詞
提示詞:
Three brightly glowing red orbs, in a dark forest with thick mist, dynamic lighting, and an eerie atmosphere
提示詞長度限制
- 系統可能會忽略超過約40個詞的內容
- 超過60個詞的內容很可能被忽略
- 超過80個詞的內容幾乎肯定會被截斷
- 為了最大效果,讓提示詞簡潔,集中在重要元素上
Midjourney提示詞的詞語選擇
- 選擇特定詞語很重要,因為它們會對生成的結果產生重大影響(例如,使用「big」和「massive」的區別)
- 使用清晰、具體的描述,而不是像「cool」或「nice」這樣的泛泛之詞
- 藝術相關術語如「cinematic」或「photorealistic」是生成特定風格圖像的有效關鍵詞
提示詞
A smiling woman holding a big apple
提示詞
A smiling woman holding a massive apple
使用ChatGPT增強Midjourney提示詞
通過使用ChatGPT幫助製作Midjourney提示詞,發揮多種AI工具的力量。這種方法可以顯著提高生成圖像的品質和創造性。這個過程包括:
- 向ChatGPT描述你的初始概念
- 請ChatGPT用適當的細節和術語擴展和完善你的描述
- 將增強後的描述作為Midjourney提示詞
- 根據結果進行迭代
3. 有效提示詞的關鍵元素
背景和細節
- 主體: 人物、動物、角色、地點、物體
- 媒介: 照片、繪畫、插圖、雕塑、塗鴉、掛毯
- 環境: 室內、戶外、月球上、水下、城市中
- 光線: 柔和、環境光、陰天、霓虹燈、攝影棚燈光、黃金時段
- 顏色: 柔和、明亮、多彩、黑白、粉彩
- 情緒: 平靜、熱鬧、充滿活力、不祥
提示詞:
A mystical cat (Subject) sitting on a mossy rock by a forest stream, digital painting (Medium), in a lush and magical forest environment (Environment), soft ambient lighting (Lighting), colorful and pastel palette (Color), calm and enchanting mood (Mood)
鏡頭和構圖類型
-
使用特定的鏡頭類型有助於模型生成更好的圖像,如果你已經有構圖想法
-
使用這些術語幫助模型進行圖像構圖:
○ Portrait(肖像)
○ Headshot(頭像)
○ Close-up(特寫)
○ Medium shot(中景)
○ Wide shot(廣角)
○ Bird's eye view(鳥瞰圖)
○ Over-the-shoulder(肩膀視角)
○ Low-angle shot(低角度拍攝)
○ High-angle view(高角度視圖)
○ POV(第一人稱視角)
○ Establishing shot(建立鏡頭)
○ Macro shot(微距拍攝)
提示詞
A cat jumping in the air, in a field of wheat, bird's eye view
提示詞
A cat jumping in the air, in a field of wheat, portrait shot
在圖像中生成文字
- 在圖像中生成文字可能具有挑戰性
- 在引號中包含所需文字:「文字」
- 使用特定的提示短語,如:
- "insert text" written on a sign(寫在標誌上的「插入文字」)
- The text "insert text" glowing on a neon sign(霓虹燈標誌上發光的「插入文字」)
- Hot coals in a fire pit forming the words "insert text"(火坑中的炭火形成的「插入文字」)
- 保持文字簡短,因為完整句子通常無法正確生成
- 如果需要,指定文字的風格或上下文
提示詞
A rustic wooden sign in a lush green meadow, with the text "Welcome" written in bold, hand-painted letters, soft sunlight, and a naturalistic style
攝影風格提示
要生成攝影風格的圖像,請指定:
- 相機類型:Sony A7, Nikon Z, Fujifilm X-T5, Canon EOS, dash cam, security camera, GoPro, DSLR, Polaroid, analog, digital
- 膠片類型:Daguerreotype, Washi film, Cyanotype, Ilford XP2 film, Cinestill 800T, redscale, Kodak portra 160, 35mm film
- 鏡頭類型:tilt shift lens, fisheye lens, macro lens
- 光學效果:lens flare, soft light, chromatic aberrations, double exposure, long exposure, motion blur, zoom blur
在提示詞末尾添加「--style raw」參數
提示詞
Photo of a street name sign, "Photographic Styles" written on the sign, DSLR, 35mm film, tilt shift lens
4. 高級參數控制
參數介紹
- 參數是用來自定義提示詞和指導圖像生成的工具
- 它們添加在Imagine欄中文本提示詞之後
- 參數以兩個破折號「--」開頭,後跟參數名稱/縮寫,有時還有數值
- 多個參數可以一起使用,用空格分隔
寬高比 —ar
- 可以在提示詞中使用參數「--ar x:x」定義寬高比
- 它會覆蓋設定中應用於生成任務的任何當前設定
- 提供的示例提示詞:「A portrait of a woman in a red dress --ar 9:16」
- 比例限制為高/寬1:14 / 14:1
模型版本
- 對應設定中的「Version」,定義使用哪個模型版本
- 使用「--v x」參數,其中x表示模型編號
- 接受的值:1, 2, 3, 4, 5, 5.0, 5.1, 5.2, 6, 和6.1
- 對於Niji模型,使用「--niji」獲取最新版本,或「--niji」後跟4或5獲取舊版本
風格化 —s
- 對應「Stylization」設定,控制Midjourney美學的應用強度
- 使用「--s x」,其中x是0到1000之間的值
- 預設級別是100
- 低值產生與提示詞緊密匹配但藝術性較低的圖像
- 高值創建更具藝術性的圖像,但可能與原始提示詞有更大偏差
怪異 —w
- 對應設定中的「Weird」
- 使用「--w x」,其中x範圍從0到3000
- 預設值是0
- 更高的值會創建越來越奇怪和不可預測的生成
混沌 —c
- 對應設定中的「Variety」,影響每個提示詞生成的4張圖像批次的多樣性
- 使用「--c x」,x表示0-100範圍內的值
- 預設值是0
- 高值產生更不尋常和意外的結果和構圖
- 低值有更可靠和可重複的結果
圖像權重 —iw
- 只能與圖像提示一起使用
- 定義圖像提示對生成結果的影響強度
- 使用「--iw x」參數,其中x範圍從0到3
- 預設值是1
角色權重 —cw
- 只能與角色參考圖像一起使用
- 定義角色參考提示對生成結果的影響強度
- 使用「--cw x」參數,值範圍從0-100
- 預設值是100
風格權重 —sw
- 只能與提示詞中的風格參考代碼或圖像一起使用
- 定義風格參考圖像或代碼對生成結果的影響強度
- 使用「--sw x」參數,值範圍從0到1000
- 預設值是100
負面提示 —no
- 「--no x」參數告訴Midjourney在生成的圖像中排除什麼
- 負面提示中可以包含多個詞,用逗號分隔
- 示例提示:「A hand holding a baseball --no red, green, stadium」
- 如果想避免特定元素,不應將它們包含在提示詞的中心文本部分
重複 —r
- 該參數允許多次生成相同的提示詞,無需重新啟動生成任務
- 根據訂閱級別,值範圍不同:
- 基礎訂閱用戶:2-4
- 標準訂閱用戶:2-10
- 專業和超級訂閱用戶:2-40
- 只能在Fast和Turbo模式下使用
品質 —q
- 「--q」參數影響圖像生成速度和GPU積分
- 較低的值生成細節較少的圖像,有助於嘗試新的提示詞
- 較高的值消耗更多積分,可以改善圖像紋理和細節,但可能降低連貫性
- 接受的值:
- 模型版本6.1:0.5 - 2
- 模型版本6:0.25 - 1
- 預設值是1
風格
- 與風格化不同
- 對應設定中的「Mode」,允許在標準和原始風格之間切換
- 使用「--style raw」最小化Midjourney預設風格的影響,創建更逼真和自然的圖像
停止
- 「--stop x」參數在過程中途完成圖像生成
- x值應在10-100之間(百分比)
- 較低的值創建更模糊、細節更少的結果
- 預設值是100
- 提供的示例提示:「A hand holding a baseball --stop 50」
速度模式(放鬆、快速、渦輪)
- 放鬆模式(--relax):較慢但有無限制的生成能力。僅標準計劃或更高級別可用
- 快速模式(--fast):這是預設設定。如果在設定中選擇了其他模式,可以在提示詞中包含「--fast」激活它
- 渦輪模式(--turbo):最快的選項(最多快4倍),但使用兩倍的積分
瓷磚
- 「--tile」參數生成可用作無縫重複圖案或紋理的圖像
- 對創建以下內容有幫助:
- 壁紙
- 遊戲紋理
- 包裝紙設計
- 重要限制:此功能不適用於Niji模型
個性化
- 在個性化工作區中通過對圖像進行排名訓練個性化模型後,「--p」參數變得可用
- Midjourney為你偏好的風格生成一個唯一代碼,可以與他人分享
- 需要對至少40張圖像進行排名才能使用個性化功能,排名的圖像越多,效果越好
5. Midjourney藝術風格提示:使用參考圖像
Midjourney風格提示
- 風格參考圖像用於影響生成圖像的整體風格和美學
- 你可以使用「--sw」參數控制風格參考效果強度(下一章詳述)
- 使用你選擇的準備材料圖像作為提示
角色參考
- 角色參考允許你在多種不同情況下使用相同的角色
- 建議使用只有一個角色的圖像以獲得最佳效果
- 角色參考與Midjourney生成的圖像效果最佳
- 雖然不完美,模型可能會錯過徽標或雀斑等細微細節
- 可以使用「--cw」參數調整角色參考的強度
多重參考
- 使用多種不同的參考圖像可以讓你「混合」圖像
- 你可以合併來自多個圖像的不同美學、角色和構圖,創建獨特的輸出
- 可以使用你生成的圖像或探索工作區中的圖像,分配不同角色:
- 一個作為圖像提示
- 另一個作為風格參考
- 第三個作為角色參考
6. 結論:掌握Midjourney提示詞技巧
創建有效的Midjourney提示詞既是一門藝術,也是一門科學。正如本指南所探討的,提示詞的品質直接影響你生成的圖像。通過理解基本結構、參數和參考技術,你可以顯著改善結果,釋放AI圖像生成的全部創意潛力。
從靈感到實現
無論你是數字藝術家、設計師、營銷人員還是創意愛好者,能夠精確地將你的願景傳達給像Midjourney這樣的AI工具,都能打開無限可能。記住這些關鍵要點:
- 從清晰、具體的主體描述開始
- 在適當時加入藝術風格參考
- 戰略性地使用參數來微調結果
- 嘗試使用參考圖像引導AI
- 根據結果不斷完善你的方法
簡化你的AI藝術工作流程
如果你想進一步提升Midjourney提示詞技能,ImagesArt.ai提供了能顯著改善工作流程的補充工具:
- 圖像轉提示轉換器:找到了一張鼓舞人心的圖像,但不知道如何為Midjourney描述它?我們的圖像轉提示工具可以分析任何參考圖像,並生成捕捉其基本元素的詳細提示描述。當你想重現特定風格或構圖,但難以用語言表達時,這特別有價值。
通過將本指南中學到的技巧與這些專業工具結合,你可以開發出更高效、更有效的AI圖像生成方法。掌握的關鍵在於持續練習、深思熟慮的實驗,以及從成功和不成功的嘗試中學習的意願。
參考文獻
- Midjourney, Inc. (2025). Prompt Basics. Midjourney Documentation.https://docs.midjourney.com/hc/en-us/articles/32023408776205-Prompt-Basics
- Midjourney, Inc. (2025). Parameter List. Midjourney Documentation.https://docs.midjourney.com/hc/en-us/articles/32859204029709-Parameter-List
- Midjourney, Inc. (2025). Multi-Prompts & Weights. Midjourney Documentation.https://docs.midjourney.com/hc/en-us/articles/32658968492557-Multi-Prompts-Weights
- Midjourney, Inc. (2025). Documentation – Midjourney. Midjourney Documentation.https://docs.midjourney.com/hc/en-us/categories/32013335627533-Documentation