我如何訓練 ChatGPT 撰寫 Midjourney 提示語?AI 繪圖 4 個階段

我如何訓練 ChatGPT 撰寫 Midjourney 提示語?AI 繪圖 4 個階段

最近我開始嘗試讓 Midjourney 設計部落格文章的主圖,製作課程簡報當中的某些情境圖、封面圖,熟練操作與提示語之後,比找圖庫更節省時間,而且也更能直接產生相對適合自己需要的特殊圖片。

也在這樣的使用過程中,雖然一開始沒有想要認真研究 Midjourney 的提示語,但也不知不覺累積了一份屬於我自己慣用的 AI 繪圖工具咒語筆記,包含可以下什麼樣的參數、用什麼樣的關鍵字結構,以獲得更符合自己需要的結果。

不過當每一天都會用到 Midjourney 生成圖片的時候(文章圖、簡報圖),我就希望「設計提示語」的流程可以更快一點,也就想到透過 ChatGPT 來快速生成。

嘗試了一段時間,發現真的可以訓練 ChatGPT 來自動撰寫我需要的 Midjourney 提示語 ,而且:

  • 很多時候訓練好的 ChatGPT 比我更會描述圖片場景、藝術風格。
  • 訓練好的 ChatGPT 也比我更會使用專業攝影、3D 技術的參數。
  • 訓練好的 ChatGPT 也會自己下好 Midjourney 可能需要的參數。
  • 訓練好的 ChatGPT 可以讓我有時候只要發想一個「概念」,就能生成上述圖片主題、場景,自動選擇適合的藝術風格,自動下好需要的技術參數或 Midjourney 參數。

今天這篇文章,就來跟大家分享我自己搭配 ChatGPT 輔助,加速學習與應用 Midjourney 提示語的流程。

階段一:讓 ChatGPT 翻譯 Midjourney 提示語:從簡單開始就好

首先,我的大前提是:

如果可以簡單解決,就盡量不要把事情複雜化。

在這裡的意思是, Midjourney 雖然有些很厲害的圖片是利用很厲害的提示語來完成(看起來複雜,有各種關鍵字,有各種技術參數)。不過,也有不少時候,簡單的提示語就能產生不錯的效果。

例如我單純下這樣的指令:「Sunrise at Alishan, Taiwan. --ar 16:9 --v 5」,即使我沒有使用任何的攝影專業術語,其實也能產生可用的(阿里山)日出照片。

所以,第一階段,我們可以先不用想得太複雜,就用 ChatGPT 來「翻譯」我們的提示語構想即可。

我會先建立一個專門的 ChatGPT 對話頻道,之後所有跟 Midjourney 提示語有關的問題都在這個頻道詢問,慢慢建立起我需要的 ChatGPT 繪圖提示語助理。

這裡的「翻譯」,就是把我們中文的概念構想,翻譯成英文的繪圖提示語。

如果這樣就能產生自己滿意、需要的照片,那麼其實不需要把 Midjourney 的提示語寫得太複雜。

階段二:讓 ChatGPT 改寫 Midjourney 提示語:從概念想法,轉譯成圖片語言

但是有些時候,更專業的提示語確實更能產生自己需要的特殊圖片,或是讓圖片的效果更好。例如我提供這樣的提示語:「Sunrise at Alishan, Taiwan, captured in a stunning photograph, featuring majestic mountains and lush forests, birds-eye view perspective, inspired by professional travel photography, breathtaking beauty, vivid colors of morning sky, peaceful atmosphere, realistic style, high dynamic range (HDR), long exposure, optimal camera settings for perfect sunrise capture, golden hour lighting, --ar 16:9 --v 5」

在這樣的 Midjourney 提示語中,除了台灣阿里山日出外,我還強調了照片的風格(專業旅行攝影、讓人屏息的美景)、拍攝的角度(鳥瞰、遠景)、想要的顏色、攝影照片術語(HDR效果)等等。這時候產出的照片效果,確實又提升了一個層級。

但是問題來了,如果我不是專業攝影師、不是專業繪圖者,我怎麼知道如何有效地描述一張圖片的各種場景、細節、技術呢?這時候,可以利用 ChatGPT 來「轉譯」。

請 ChatGPT 把我的想法「轉譯」成更好的 AI 繪圖提示語。

例如我會這樣問:「我要用 AI 繪圖工具製造一張個人照片的宮崎駿卡通風格版本,請建議我可以在提示語上加上哪些英文關鍵字?」

這樣一來,我可以獲得許多原本想不到、不知道的專業術語,都可以用在 Midjourney 提示語中。

或者另外一種「轉譯」,是幫我把單純的概念,轉換成一張圖片需要的場景、構圖、細節,我可以這樣問:

  • 「請根據所有你知道的 AI 繪圖提示語結構與邏輯,設計一張「現代港口,真實攝影照片」的英文提示語,要設定適合的攝影技術參數。」
  • 「請根據所有你知道的 AI 繪圖提示語結構與邏輯,設計一張「安靜」的英文提示語。」

很多時候,我其實是卡在沒有什麼繪製圖片的構想,只有一個想要的主題(例如:現代港口、真實攝影照片),或者想要的概念(例如:安靜),這時候,可以利用 ChatGPT 幫我轉譯成一個完整的繪圖提示語。

雖然 ChatGPT 在其 2021 年前的資料庫中其實並不認識 Midjourney,但是只要我問他「請根據所有你知道的 AI 繪圖提示語結構與邏輯」,那麼他就真的會認真地用各種角度描繪一張圖片的元素,例如下面的港口照片中, ChatGPT 轉譯了:

  • 港口的景觀細節。
  • 拍攝真實照片的關鍵(例如 during golden hour)。
  • 也幫我提供了攝影需要的光圈、 ISO 等細節。

我只是說了「現代港口,真實攝影照片,攝影技術參數」,而 ChatGPT 透過轉譯,提供給我 Midjourney 需要的更完整細節描述。

階段三:讓 ChatGPT 模仿 Midjourney 提示語:把專家語法換上我的需求

前面的「轉譯」,比較像是 ChatGPT 自己天馬行空的想像,他可以把我們的概念描述成圖片語言,但是到底適不適合 Midjourney 呢?其實 ChatGPT 並不知道,所以有時候階段二產出的提示語,用在 Midjourney 上會產不出好結果。

在 Midjourney 中確實有些語法、結構、邏輯更能產出有效的圖片,如果要讓不認識 Midjourney 的 ChatGPT 學習,最好的方式就是讓他「模仿」。

例如有一次,我在 Midjourney 的探索圖庫中看到一張很棒的奇幻風格圖片,於是我先把該張圖片的提示語複製下來。(我建議可以常常到 Midjourney 的探索圖庫中去找自己需要的優質圖片並收集其提示語來用)

接著,我就請 ChatGPT 「模仿」該張圖片的提示語,設計一個我自己想要主題的 Midjourney 指令,我是這樣下指令的:「請幫我根據下面的 AI 繪圖提示語邏輯,撰寫一份關於 XXXXX 的 AI 繪圖工具英文提示語:」

這裡關鍵之處在於要提示 ChatGPT 「根據範例的邏輯來思考」:

「根據範例的邏輯來思考」、「根據範例的邏輯來思考」、「根據範例的邏輯來思考」!很重要,所以說三次,如果是其他提示語,可能會變成只是在替換關鍵字而已。

這樣 ChatGPT 就會開始去理解範例背後的設計流程,並用同樣流程設計不同內容。(類似我在這篇教學:「ChatGPT 提示語說明書:通用三層結構與 9 個技巧提高 AI 生產力」提到的思維鏈提示法)

可以看到 ChatGPT 確實會根據範例提示語的「邏輯」,重新修正成我需要的內容,而且「不只是替換關鍵字而已」,像是原本的範例場景是海洋, ChatGPT 根據我的主題自動把場景換成城市與天空(我並沒有下這樣的指令),並重新設計了整個描述。

於是就產出下面這張圖。

我們可以收集很多自己需要的類型提示語的「目前最佳範例」,例如我收集了海報用的、照片用的、抽象概念用的、人物用的、食物用的等等提示語。需要哪一種類型,就請 ChatGPT 根據最佳範例模仿,然後生成出我需要的新主題的提示。

階段四:讓 ChatGPT 理解後創作 Midjourney 提示語:拆解指令邏輯

前面第三階段,其實對於一開始不太會設計 Midjourney 提示語的我來說,或是對沒有藝術、繪圖、攝影專業的我來說,已經可以有模有樣的請 ChatGPT 設計出專業的 Midjourney 提示語,並且產出我需要的圖片效果。

不過我還想要更節省時間,也想更有效學習 Midjourney 提示語,所以我進一步這樣做:

我開始「餵給」 ChatGPT 一些自己很喜歡的 Midjourney 照片的提示語,但是這次請他「拆解出裡面的結構與邏輯」。

我會這樣問:「請幫我分析下面這段 AI 繪圖提示語有哪些結構,用表格呈現:  貼上 Midjourney 提示語範例」

這樣做可以帶來兩大好處:

  • 對我自己來說,我開始看懂原來 Midjourney 的高手是用這樣的結構、邏輯來設計提示語啊!我也開始更懂提示語的一些關鍵技巧、重要參數了。
  • 對 ChatGPT 來說,這個 AI 繪圖專用頻道裡的 ChatGPT ,開始懂得用這些結構與邏輯來設計 Midjourney 提示語了!

不一定要一次性餵給 ChatGPT 很多提示語範例,我都是偶爾看到很棒的 Midjourney 圖片與提示語時,就把他餵給 ChatGPT ,讓他產生一些片段的學習。

更重要的反而是:偶爾就更新一下最近覺得不錯的提示語,畢竟 ChatGPT 的記憶不是永久。只要持續更新,就能讓自己下次使用的時候有更好的設計邏輯。

接著,當我要生出一張圖片的 Midjourney 提示語時,我會這樣請 ChatGPT 幫忙:

請根據前面所有你記得的提示語結構邏輯,設計一張「XXXXX」的 AI 繪圖工具提示語。

這時候,我不用說太多,甚至都不用說要使用英文, ChatGPT 根據前面片段記住的各種提示語結構、邏輯,就會自動產出有用的 Midjourney 提示語。我們可以看到:

  • 我只給出「安靜」兩個字,但是 ChatGPT 自動描繪出了一個安靜的場景細節。不過,這是前面所說的「階段二」就有機會做到的!但下面就是經過階段三、四學習,才能做到的提示。
  • 而且 ChatGPT 會主動加上圖片藝術風格、技術技巧的描述(這些對 Midjourney 來說很重要),例如這張圖給的是插畫風格。
  • 並且 ChatGPT 對圖片的描述會有更多細節,例如更會加上鏡頭焦點、顏色描述等等細節。
  • 甚至,還會加上 Midjourney 專屬的參數,例如要用 v5 引擎、圖片比例、品質強化、風格強化等等。

如果在這樣學習後,再請 ChatGPT 設計一張「現代港口,真實攝影照片」的Midjourney 提示語呢?

這時候,整個提示會變得更專業,有更多、更正確描述的攝影技術語言,也有更多光影的專業描述,當然也有加上 Midjourney 的特殊參數,最後就產生了一張我更滿意的港口照片圖。

如果跟前面階段二生成的圖片做比較,其實階段二生成的港口圖也不錯,但重點在於,階段四產出的照片更像是我想要的「真實攝影照片」,這是 ChatGPT 學習後的結果。

最後,再提供幾個階段四的應用案例給大家參考,這時候我可以更直接給一些抽象概念,讓 ChatGPT 幫我設計有用的 Midjourney 提示語。

例如我說我要簡報封面,就自動幫我加上 midjourney 的圖片比例參數 --ar 16:9 。

也別忘了, ChatGPT 是對話機制,如果測試 Midjourney 提示語後發現效果有落差,只要在 ChatGPT 用對話請他修正即可。

小結

我想說的是,前述四個訓練 ChatGPT 幫我撰寫 Midjourney 提示語的階段,並不是說階段四就會比階段三好!

所以有時候簡單一句話, ChatGPT 翻譯成英文的 Midjourney 提示語,就是最好的做法(階段一)!

但是,我們也可以從階段二、階段三、階段四的不同訓練方式,看到利用 ChatGPT 撰寫 Midjourney 提示語還可以有這些彈性作法,從而讓自己更能設計出符合需要的創意圖片。

  • 階段一:讓 ChatGPT 翻譯 Midjourney 提示語:從簡單開始就好
  • 階段二:讓 ChatGPT 改寫 Midjourney 提示語:從概念想法,轉譯成圖片語言
  • 階段三:讓 ChatGPT 模仿 Midjourney 提示語:把專家語法換上我的需求
  • 階段四:讓 ChatGPT 理解後創作 Midjourney 提示語:拆解結構邏輯

而且,在這樣的學習過程中,除了每天更快速生成我需要的圖片,我也漸漸學會 Midjourney 提示語的關鍵結構、邏輯、參數(並且整理成筆記),有些時候,我就利用階段一自己寫出提示語,反而可以達到更想要的效果。

而想要知道在 Midjourney 中可以設定哪些提示語?不同參數有什麼不同意義?最好的方式,就是先參考這份 Midjourney 的官方教學文件,會學到非常多。

基本上 Midjourney 提示語的結構,和 ChatGPT 提示語的結構很像,都是:目的優先、輸入資料、設定輸出三個階段:

  • 目的優先:圖片主題、場景、人物描述。
  • 輸入資料:設定圖片、照片細節,例如構圖方式、使用的攝影技術或繪畫技術、藝術風格、時間年代等等。(尤其藝術風格影響很大)
  • 設定輸出:利用各種參數設定圖片長寬比例、品質高低、藝術化程度等細節。

 

原文轉貼自:電腦玩物原文連結

本站所有文章未經事先書面授權,請勿任意利用、引用、轉載。