Midjourney 應用場景1:Stock Photo

2023-05-08 15:22 更新

Text Prompt 的部分,我刪除重寫了 3 遍,每次寫完都不太滿意。前兩遍,我都希望通過一個或幾個萬能模板教會大家寫 Midjourney 的 Text Prompt,但實際試了很多遍后,我發(fā)現(xiàn):

  1. 圖片信息量非常大,萬能模板的確讓你生成一張及格的圖片,但很難讓你生成一個完全滿意的圖片。
  2. 要想生成一張高分圖片,需要的不僅僅是 prompt engineering,甚至還需要一些美學知識,不同場景參數(shù)的使用都是不一樣的,所以有些時候,用模板反而有點死板。

所以,我不想直接教大家所謂的萬能模板,而是通過一個個實際場景教大家如何寫好 text prompt ,因為不同場景,你告知給模型的信息是不一樣的。

而且我認為,知道為什么,遠比知道怎么做更重要。當你知道為什么后,遇到新的場景,你也能很好地解構出 prompt 里需要什么,而不是盲目套模板。

最后,圖片場景有非常多,我會盡量分享一些大家日常工作中能用上的。希望能讓 AI 提高你的工作效率,而不是用完即棄的玩具。

Text Prompt 開篇介紹一下 Midjourney V5 提升較大的 Stock Photo 場景。

什么是 Stock Photo?

Stock Photo 直譯為圖庫圖片。一般你能在一些圖庫網(wǎng)站上找到,這些圖片通常來自一些攝影師或設計師。部分圖片因為版權的原因,如果你需要使用則需要付費。

大部分使用 Stock Photo 的用戶都是一些設計公司,或者廣告公司。你應該常常能看到這類圖片,比如最經(jīng)典的兩人握手照片:



我認為 AI 生成圖片對圖片庫沖擊非常大,V5 版本基本上滿足了我的 Stock Photo 需求。

技巧一:臨摹

我認為學習圖片類的 prompt,跟學習畫畫是類似的,最好的學習方法不是直接用模板。

而是拿真圖,或者別人生成的圖來臨摹。英文不好,也可以先寫中文,然后讓 ChatGPT 翻譯。當你臨摹了幾張后,你就會慢慢搞懂如何做出類似的圖了。

拿上面的那個握手圖為例,我們仔細觀察上面那張圖,圖中元素有什么:

  1. 第一主體是兩個手,然后握在了一起,并且看起來是兩個亞裔男人。
  2. 第二兩人都穿著西裝。
  3. 第三背景看上去像是在辦公樓的大門,兩人可能是在握手告別。并且背景刻意進行虛化了,或者是使用照相機拍攝的。



再歸納總結下,大概的信息:

  • 主體:兩個穿著西裝的亞裔男人在握手告別
  • 場景:辦公樓大門
  • 圖像風格:stock photo,照相機拍攝,

這時候,我們就能嘗試寫一下 prompt 了(如果你覺得自己英文水平還不太行,也可以嘗試用翻譯軟件翻譯)。

 stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building,taken with Canon

Midjourney 生成的結果如下所示:


Emm ?? 好像跟我們的預期不一樣。不要慌,剛開始用 Midjourney 一定會遇到這種問題,重要的是多嘗試。


我們再來分析下 Midjourney 為何生成了這樣的圖片?復盤一下:

  1. 首先圖片的主體,或者說焦點,我們只需要「握手」,而不是兩個人。
  2. 照相模式好像并不能實現(xiàn)背景虛化?更像是一種圖像風格,圖四就像是一種老照片的風格。

那我們調整下 prompt,增加焦點和背景虛化關鍵詞:

 stock photo of two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh

再來看看生成的結果,結果好很多:


圖 1 和 圖4 基本滿足需求了,圖 2 和圖 3 裁剪一下,也能滿足我們的需求。不過需要注意,Midjourney 在人手的生成上暫時還有點問題,細看圖 2和圖 4,其中有一個人的手有 6 個手指 ??,但我認為未來應該會修復。




那我們來總結一下 prompt ,該 prompt 分成以下幾個部分:


  • 第一部分(紅色線):描述你想要的內容主體。
  • 第二部分(藍色線):描述主體背景/環(huán)境。
  • 第三部分(黃色線):照片的焦點位置。
  • 第四部分(綠色線):照片的風格或者說是特殊要求。

總結下之后,你是不是就總結出了一個模板了???

技巧二:多實驗

上述的案例,我還想教給各位第二個技巧:多試驗。

圖片生成遇到不符合預期的情況,不要慌,分析問題,然后使用控制變量法,一個個調整圖片,不要急,上面我寫的 prompt 還有一個地方,不知道各位有沒有注意,就是開頭的 stock photo,試試將這兩個詞刪掉會怎樣?

 two Asian men in suits shaking hands,say goodbye in front of the main entrance of the office building, focus on two hands, taken with Canon, background bokeh

生成結果也依然滿足需求,而且手指的數(shù)量也準確了,說明這個 Stock Image 對模型的影響不是很大。


技巧三:善用 Image2Image 功能

在 Stock Photo 場景里,還有一個非常厲害的技巧,這個方法我一開始覺得不太適合教,因為這個對 Stock Photo 庫影響太大了 ??

但本著工具中立的原則,并且這個技巧,其實在很多場景都能用(比如生成頭像等),所以還是覺得有必要教給大家。

各位一般用 Stock Photo 庫會遇到以下幾個問題:

  1. 圖有版權,沒法商用,或者說需要付費。
  2. 有些圖,被很多人用過,其他人一眼就看出來這是 Stock Photo。
  3. 圖里的內容大體符合要求,但細節(jié)不符合要求,比如上圖兩個亞洲男性握手,可能換成一男一女,且其中一人是黑人會好一些。

要解決這三個問題,最好的方式就是讓 AI 改一改原來的圖片。讓 AI 改圖,只需要用到 Image2Image(或者叫 Blend) 功能即可。操作步驟如下:

  1. 將你看到的不錯的 stock photo 發(fā)給 Midjourney Bot(我還是以前面的那張握手照為例)
  2. 右鍵復制該圖片的鏈接,然后黏貼到輸入框
  3. 在鏈接后加個空格
  4. 接著輸入你想要的內容,比如將其中一個人的手換成黑人,一個人換成女性:

 one Afican-American hand and one Asian woman hand

生成的結果是這樣的,我在 prompt 里沒有提任何西裝,以及場景背景信息,就說我要一個非裔的手,一個亞裔女性的手:

 

拋開6 根手指的問題,這個技巧是不是很高效?不過需要注意,blend 功能(這個后續(xù)教程會講到)更適合兩張圖融合,圖片+文字不是很穩(wěn)定,各位要有耐心,多測試一下。


以上內容是否對您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號
微信公眾號

編程獅公眾號