Midjourney 應(yīng)用場(chǎng)景5:頭像

2023-05-08 15:26 更新

在 Stock Photo 一章中,介紹了 img2img 的方法,這個(gè)方法除了解決 Stock Photo 的那幾個(gè)問(wèn)題外,還很適合多個(gè)場(chǎng)景。

本章會(huì)著重介紹用這個(gè)方法生成的頭像的 prompt。并且從本章開(kāi)始會(huì)逐步豐富我們的 prompt 結(jié)構(gòu),使其更加完整。

注意事項(xiàng)

在介紹 img2img 的應(yīng)用前,我想強(qiáng)調(diào)一下:

  1. 不要在 Discord Midjourney 公開(kāi)群上傳自己的照片!這樣你的照片會(huì)被公開(kāi)群里的所有人看見(jiàn)。建議使用 Midjourney Bot。
  2. 另外,非 pro 付費(fèi)會(huì)員,生成的圖片都會(huì)被其他會(huì)員看見(jiàn)。但你可以在生成完頭像后,刪掉生成的圖片。如果還不知道如何使用 Bot ,及刪除照片,請(qǐng)看基本操作篇。
  3. img2img 的操作我就不過(guò)多贅述了。如果你還不太清楚,可以看基本操作篇,以及 Stock Photo 那篇。

3D 卡通頭像

第一個(gè)要分享的是卡通頭像。首先跟大家強(qiáng)調(diào)下:

  1. 我基本上把國(guó)內(nèi)國(guó)外的生成頭像教程都看過(guò),并試過(guò)一遍,還跟 Midjourney 社群的人也交流過(guò)。我的理解是,以目前 V5 的能力,不管你如何調(diào)整 prompt ,想用 img2img 方法生成一張非常像原圖的圖片,基本靠運(yùn)氣,即使用了前面介紹的技巧七方法,也只是提高概率。如果你有令頭像非常像的方法,不妨通過(guò) Issue 分享給我,我會(huì)署下你的名字,并分享給大家。
  2. 各位在學(xué)習(xí)的過(guò)程中,如果發(fā)現(xiàn)生成的圖片不像原圖,也不需要?dú)怵H。這是正常的。
  3. 你可以通過(guò)我分享的方法,生成一張有原圖神韻的卡通頭像。注意肯定不會(huì)非常像原圖。

在 prompt 里加上原圖鏈接(建議使用證件照,或者背景比較單一的照片,這樣成功率會(huì)高一些),然后用我前面提到的框架設(shè)計(jì)一個(gè) prompt:

Prompt 解釋
類(lèi)型是什么? Portraits / Avatar 如果你的原圖是證件照,可以在 prompt 里加入「肖像」一詞,或者「Avatar 頭像」。
主體是什么? smiling cute boy, undercut hairstyle 這里可以是選填,你可以先不加這個(gè)描述,只填其余 prompt,然后如果生成的圖片不像你。那你就在這里加點(diǎn)描述下你的頭像的詞,一般就是性別、樣貌、發(fā)型、配飾(比如眼鏡、耳環(huán)等)、表情等。注意,盡量挑特征比較強(qiáng)的部分輸入,特征對(duì)了,生成的圖片基本會(huì)有幾份像。
背景是什么? white background 我這里保留了證件照的白底,你可以加一些實(shí)際場(chǎng)景的背景,比如餐廳之類(lèi)的。
構(gòu)圖是怎樣的? null 因?yàn)槲覀冾A(yù)先傳了圖片,圖片是張證件照,所以不填
用什么鏡頭? soft focus 柔焦是指攝影中,使用柔焦鏡頭,使得拍攝的影像既清晰又柔和的效果。一般多在拍攝人像的時(shí)候使用,我在 prompt 里加上這個(gè),可以使照片更柔和。你也可以不加。
是什么風(fēng)格? 3d render,Pixar style 因?yàn)槟繕?biāo)是生成 3d 照片,所以這里加了 3d render(3d 渲染),以及我喜歡的皮克斯風(fēng)格
參數(shù) —iw 2 iw 是一個(gè)文字和 img 權(quán)重參數(shù)。數(shù)值越大,就越像原圖,關(guān)于這個(gè)值的介紹,可以看高級(jí)參數(shù)篇。

最后,還有三個(gè)技巧:

  1. 如果你生成的照片并不像預(yù)設(shè)的照片,可以在四張圖里,挑一張比較像的,然后點(diǎn) V(Variation),讓模型繼續(xù)生成,再繼續(xù)挑一張像一點(diǎn)的照片,然后繼續(xù)生成新照片,直到出現(xiàn)一張比較像的。
  2. 第二個(gè),我覺(jué)得很神奇,如果前兩個(gè)方法你都試過(guò)了,你生成的圖片還是跟原圖不像,那就在 prompt 里加上「wear glasses(戴眼鏡)」,真的很神奇,我只要加上戴眼鏡就像非常多,如果你原圖戴眼鏡了,你試試在參數(shù)里加個(gè) —no glasses,你會(huì)得到一張更不像你的圖。
  3. 最后,就是多用一個(gè)參數(shù),這個(gè)方法會(huì)在技巧八中展開(kāi)說(shuō)下。

本章最后,有我的證件照的案例。

技巧七:多參數(shù)同時(shí)使用

在使用 img2img 的方法生成頭像時(shí),我發(fā)現(xiàn)問(wèn)題是「文字權(quán)重比圖片權(quán)重高」,導(dǎo)致其生成的圖片不像原圖,iw 參數(shù)在 V5 里最多提升圖片權(quán)重到 2,所以我就在想有沒(méi)有可能進(jìn)一步降低文字的權(quán)重。

然后我就試了下 s 參數(shù),發(fā)現(xiàn)的確好了很多。

如果生成的圖片還是不像,你可以在 —iw 2 基礎(chǔ)上,再加一個(gè)參數(shù) —s 200 ,注意同時(shí)用兩個(gè)參數(shù)時(shí),中間不要有逗號(hào)。我發(fā)現(xiàn)加了 s 參數(shù)之后的確像了很多,我個(gè)人猜測(cè)是 s 和 iw 連用會(huì)進(jìn)步一削弱 text 的權(quán)重。

s 是控制生成圖片的風(fēng)格化程度。簡(jiǎn)單理解,這個(gè)值越低會(huì)更符合 text prompt 的描述,數(shù)值越高藝術(shù)性就會(huì)越強(qiáng),但跟 text prompt 關(guān)聯(lián)性就會(huì)比較弱。所以如果你生成的圖還是不像,就加大這個(gè)值,比如調(diào)到 500。

我想通過(guò)這個(gè)案例告訴大家,多個(gè)參數(shù)一起使用,有可能會(huì)形成合力,進(jìn)一步放大模型的能力。未來(lái)有新的參數(shù)能力,不妨也想想有沒(méi)有可能一起用?

動(dòng)漫風(fēng)頭像

與 3D 卡通頭像一樣,主要的修改是在圖片風(fēng)格上:

Prompt 解釋
類(lèi)型是什么? Portraits / Avatar 繼續(xù)使用相同描述
主體是什么? smiling cute boy, undercut hairstyle 繼續(xù)使用相同描述
背景是什么? white background 繼續(xù)使用相同描述
構(gòu)圖是怎樣的? null 繼續(xù)使用相同描述
用什么鏡頭? null 因?yàn)槭锹?huà)風(fēng),就不加柔光鏡頭了
是什么風(fēng)格? anime, Studio Ghibli 目標(biāo)是制作動(dòng)漫風(fēng)的頭像,所以這里加了 anime(動(dòng)漫),然后加了吉卜力風(fēng)格
參數(shù) —iw 2 —s 500 注意同時(shí)用兩個(gè)參數(shù)時(shí),中間不要有逗號(hào)。

賽博朋克頭像

這是我最喜歡的風(fēng)格之一,也是只需要改一下風(fēng)格和背景即可:

Prompt 解釋
主體是什么? cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing 加了臉的修飾,還有戴上 VR 眼鏡,穿上賽博朋克風(fēng)衣服
背景是什么? neon-lit cityscape background 為了讓圖片更像是賽博朋克,就加了個(gè)霓虹燈城市背景,讓其看起來(lái)更有賽博那味
是什么風(fēng)格? Cyberpunk, by Josan Gonzalez 加了賽博朋克風(fēng)格,以及我非常喜歡的賽博朋克畫(huà)家 Josan Gonzalez


技巧八:使用 Seed 參數(shù)對(duì)圖進(jìn)行二次修改

注意:這個(gè)技巧,我個(gè)人覺(jué)得未來(lái)潛力比較大,但目前 Midjourney 的實(shí)現(xiàn)效果還比較一般,效果得不到保證。官方的社區(qū)的幫助文檔也提到這個(gè)功能在 V5 非常不穩(wěn)定。詳細(xì)可以看看我整理的 Midjourney 官方 FAQ 一章。

你可能遇到類(lèi)似這樣的場(chǎng)景:

  1. 你輸入一段 prompt,機(jī)器生成了 4 張圖片
  2. 你看了下4張照片,發(fā)現(xiàn)其中有一張還行,但其余不是很滿(mǎn)意,然后改了下 prompt,機(jī)器又生成了一些
  3. 但這次生成的照片你都不滿(mǎn)意,你就很煩惱為何會(huì)這樣
  4. 然后你就像為啥不能在第一次生成圖上做修改呢?

基于某一次生成的結(jié)果進(jìn)行二次 prompt 修改,理論上我認(rèn)為是可以的,以賽博朋克頭像為例,我先用上述 prompt 生成了四張圖片,然后在消息的右上角點(diǎn)擊 emoji 按鈕(下圖1),然后再輸入框里(下圖2)輸入 envelope,然后點(diǎn)擊信封 emoji(下圖3),接著 bot 就會(huì)將 seed 號(hào)碼發(fā)給你。


然后我修改上面的賽博朋克頭像的 prompt,將其背景改為 China Town,此時(shí)需要注意:

  1. 新的 prompt 并不是只改 background,你需要將之前的 prompt 都帶上。
  2. prompt 僅修改 background 的部分。
  3. 最后帶上 seed 參數(shù)。

以下是我的案例:

原 prompt:

{img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1

新 prompt(seed 碼只是示例,你要填寫(xiě)自己的 seed):

 {img url}  avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1 --seed 758242567

以下是生成的效果(左圖為原圖,右圖是用了 seed 后生成的圖),可以看到,背景的確換了,但人的外觀也有點(diǎn)變化

效果不是很好,但我覺(jué)得值得探索,這樣能提高漸進(jìn)優(yōu)化的成功率:


技巧九:神秘的 blend 功能

這個(gè)技巧,說(shuō)實(shí)話,我感覺(jué)不能稱(chēng)其為技巧,但這又是一個(gè) Midjourney 非常重要的 feature,所以在這里著重介紹一下。

這個(gè)功能使用起來(lái)非常簡(jiǎn)單,在 Discord 輸入框里 /blend,然后點(diǎn)擊這個(gè)菜單:


之后你的輸入框就會(huì)變成這樣:


然后你就可以點(diǎn)擊這兩個(gè)框,然后選擇你電腦上的照片,添加完成后,點(diǎn)擊回車(chē):


然后 Midjourney 就會(huì)生成這樣牛逼的結(jié)果,左邊是融合鋼鐵俠,右邊是融合巴斯光年:


這個(gè)功能我第一次看到時(shí),我是非常震驚的,以為是小時(shí)候看游戲王里主角們使用「融合卡」的那種效果??上Р⒉皇?,這個(gè)功能非常不穩(wěn)定,僅有在滿(mǎn)足多個(gè)未知條件才能達(dá)到上述的效果。

我本來(lái)打算用這個(gè)方法用于生成頭像,但我發(fā)現(xiàn)只要用自己的照片,融合其他風(fēng)格的照片,效果都不太好,目前實(shí)驗(yàn)下來(lái)效果最好的是名人頭像,我的感覺(jué)是因?yàn)?Midjourney 喂了不少名人的頭像給模型,所以這種融合的效果都很好。

但我覺(jué)得它真的很適合做頭像,將自己的頭像跟另一張圖片融合一下,就能生成一張不錯(cuò)的圖,方便又快捷??上壳斑@個(gè)功能感覺(jué)還不太好用。

當(dāng)然這個(gè)功能還不僅僅止于此,它還有很多使用場(chǎng)景,在后續(xù)會(huì)介紹給大家。


以上內(nèi)容是否對(duì)您有幫助:
在線筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)