V8 為什麼徹底改變你的 Midjourney 提示寫法
大多數人使用 Midjourney 仍然沿用 V5 時代的習慣:堆疊三十至五十個關鍵字,加入風格修飾詞,附上參數標誌,然後祈禱結果理想。在 V8 上,這種做法現在反而會拖累你的輸出。
Midjourney V8 於 2026 年 3 月 17 日以 Alpha 版本推出。它最大的升級並非原生 2K 解析度,也不是新增的 --hd 標誌,而是它如何理解語言。新模型閱讀提示的方式,更像一位創意總監看簡報,視整段文字為一條連貫指令,而不是一堆零散標籤。
本文將拆解一套五層提示心法,用以取代「堆關鍵字」的舊習慣。你可以直接複製、按需求修改,並在接下來 15 分鐘內運行。完整模板會在文章後段呈現。
什麼是五層提示心法?
五層提示心法是一套結構化的提示模式,將每一條 Midjourney V8 提示組織為五個依序排列的層次:主體、環境、風格、光線、技術。每一層以簡短的自然語言句子書寫,並按此順序排列。V8 閱讀這種結構的方式,類似攝製組閱讀分鏡腳本。結果是更可預測的構圖、更乾淨的色調,以及大幅減少的重新生成次數。
這套分層做法之所以有效,是因為 V8 是用比之前版本長得多、描述也豐富得多的圖像說明訓練出來的。它對完整句子的理解優於碎片化關鍵字,而且會按位置給予詞語不同權重:越早出現的概念,對最終影像的影響越大。
位置權重正是大多數人忽略的關鍵。在 V7 上,把 cinematic lighting 放在提示末尾,仍能左右影像方向。在 V8 上,位置決定優先級。如果光線重要,它就應該寫在光線層,而不是被丟到結尾。
五個層次實際上如何運作?
每一層回答一條關於畫面的具體問題。最後將所有層次以逗號相連,組成一條完整提示,參數標誌則接在最末段。
第一層 主體:畫面中是誰或是什麼。具體描述身份、年齡、姿勢、表情,必要時還有衣著。
第二層 環境:主體身處何方。描述地點、時間、天氣,以及任何能定錨畫面的物件。
第三層 風格:視覺呈現方式。攝影、插畫、繪畫,或某一個明確的藝術風格。引用一種媒介,而不是某位藝術家的名字。
第四層 光線:光源、方向、質感與氛圍。單是這一層,就足以把一張平淡的圖片變成電影感畫面。
第五層 技術:長寬比、stylize 值、chaos、hd 模式以及其他參數標誌。永遠放在最後。
順序非常重要。V8 把較早的層次視為核心意圖,較後的層次視為輔助條件。順序顛倒,影像就完全不同,而且通常更差。
一條完整的 V8 提示長什麼樣?
以下是一條可以立即貼進 Midjourney 提示欄的完整範例。你只需要把方括號內的描述換成你自己的場景,這套結構在大多數情境下都能穩定運作。
試試這條提示:
A confident Hong Kong creative director in her late 30s, holding a paper storyboard, standing in a quiet modern advertising agency office at sunset, editorial photography style, warm golden hour light from a tall window on the right, soft shadows falling diagonally across the desk, --ar 16:9 --s 250 --hd --v 8
這條提示只有 47 個英文字。在 V5 上,同樣的畫面通常需要 90 個字以上,並充斥著 masterpiece、8k、hyperdetailed、professional photography 等觸發詞。這些詞對 V8 完全沒有作用。新模型本身就會輸出高細節影像,再用畫質形容詞填塞反而會浪費提示預算,並擾亂構圖。
留意每一層只回答一個問題。主體層交代身份、年齡、姿勢與手持物件;環境層交代地點、時間與氛圍;風格層指明媒介;光線層說明光源、方向與陰影行為;技術層承載所有參數。
V8 上 --s 與 --hd 應該怎樣設定?
在 V8 上對結果影響最明顯的兩個參數,是 stylize 與 hd 模式。Stylize 控制模型發揮創意的程度;hd 標誌決定影像是否以 2048 × 2048 原生方式渲染,而不是事後放大。大多數實戰者會把這兩個參數視為不可分割的組合。
商業與編輯類別的拍攝,把 --s 200 至 --s 300 設為預設值。這能讓模型貼近你的字面描述,又不會讓畫面過於平淡。低於 100,影像會變得像庫存照片;高於 500,模型開始發明描述以外的細節,與簡報期望偏離。
對於概念藝術、插畫、產品主視覺等需要強烈個性的影像,把參數推高到 --s 500 至 --s 750。在這個區間,V8 會輸出像資深設計師手繪的作品。
任何打算放進簡報、社交貼文或印刷品的影像,都應該配上 --hd。原生 2K 輸出之所以更銳利,是因為每一個像素都是從零生成,而不是後期放大。Hd 模式目前每張圖會慢約 30%,但畫質提升在簡報尺寸下肉眼可見。
V8 上最常見的錯誤是什麼?
第一個常見錯誤是堆砌畫質關鍵字。4k、masterpiece、ultra-detailed、professional 等詞語在 V5 時代是身份標誌,但在 V8 上毫無意義。刪掉它們,畫質往往反而更好。
第二個錯誤是在提示正文使用否定句。寫 no people, no text, no clutter 會混淆 V8。應該改用 --no 標誌:--no people, text, clutter。這個標誌會繞過自然語言解析器,直接告訴模型要排除什麼。
第三個錯誤是在一條提示中疊加三、四種藝術風格。V8 會逐字混合風格,所以同時點名 Wes Anderson、film noir 和 cyberpunk,結果只會是模糊的妥協。每張圖片只挑一個風格錨點。
第四個錯誤是忘記指定長寬比。若沒有 --ar,V8 預設輸出 1:1 方形。社交、簡報、網站主視覺請明確設定:--ar 16:9 用於橫向,--ar 9:16 用於直向 Reels,--ar 4:5 用於 Instagram feed。
如何在一批影像中保持視覺一致性?
用 AI 生成品牌或活動素材時,最難的部分就是讓所有影像看起來像是同一系列。V8 有兩種專門解決這個問題的工具:--oref 萬用參考標誌,以及實戰者口中的基礎場景技術。
萬用參考的用法是把一張參考圖片連結附在提示後面:--oref [圖片網址] --ow 200。V8 會擷取參考圖的色調、光線風格與整體氛圍,套用到新提示生成的圖上。--ow 控制參考強度,100 為輕度,300 為重度。
基礎場景技術,是我們在製作系列縮圖時內部使用的做法。先把主體、環境、風格、光線四層寫好,凍結成一條固定字串,然後每張新影像只更換主體層。其餘四層字字相同,V8 會輸出像同一場拍攝的構圖。
這正是雜誌美術總監保持整本刊物視覺統一的做法:相同的燈光佈置、相同的鏡頭、相同的色調貫穿每一個跨頁。把你的提示當作那份簡報文件來寫。
10 分鐘內試一次這條 V8 提示
挑一個你近期真正需要的視覺:LinkedIn 標題圖、簡報封面、社交媒體貼文。打開 Midjourney,按下面這個模板執行,把方括號內容換成你的場景。
模板:
[1 至 2 句具體描述主體], [環境,包含地點與時間], [風格,單一媒介], [光線,包含光源與方向], --ar [你需要的比例] --s [200 至 500] --hd --v 8
生成四張變體,挑出最理想的一張,再用 --oref 把它設為第二條提示的參考。三次迭代後,你會擁有一組看起來像同一個創作團隊出品的視覺素材。
這套做法之所以有效,原因和任何創意流程一樣:清晰簡報永遠贏過模糊指示。你不是在與 Midjourney 角力,而是在給它必要資訊,讓它做出正確判斷。懂 AI,更懂你 UD相伴,AI 不冷。
把 Midjourney V8 從一次性試圖變成可重複的視覺工作流程
掌握五層心法只是第一步。把它寫進團隊每週可重複執行的流程,才是讓 AI 創作真正落地的關鍵。UD 的 AI 顧問團隊與香港多個行銷與創意團隊合作,協助設計提示資料庫、品牌風格參考圖、審稿核對清單,讓視覺製作可擴展。UD 同行 28 年,手把手帶你完成每一步,從工具設定、品牌鎖定的提示模板,到與現有設計流程的整合。