閱讀(3.1k) 書(shū)簽贊(1) 我要糾錯(cuò)

Midjourney 應(yīng)用場(chǎng)景5：頭像

2023-05-08 15:26 更新

在 Stock Photo 一章中，介紹了 img2img 的方法，這個(gè)方法除了解決 Stock Photo 的那幾個(gè)問(wèn)題外，還很適合多個(gè)場(chǎng)景。

本章會(huì)著重介紹用這個(gè)方法生成的頭像的 prompt。并且從本章開(kāi)始會(huì)逐步豐富我們的 prompt 結(jié)構(gòu)，使其更加完整。

注意事項(xiàng)

在介紹 img2img 的應(yīng)用前，我想強(qiáng)調(diào)一下：

不要在 Discord Midjourney 公開(kāi)群上傳自己的照片！這樣你的照片會(huì)被公開(kāi)群里的所有人看見(jiàn)。建議使用 Midjourney Bot。
另外，非 pro 付費(fèi)會(huì)員，生成的圖片都會(huì)被其他會(huì)員看見(jiàn)。但你可以在生成完頭像后，刪掉生成的圖片。如果還不知道如何使用 Bot ，及刪除照片，請(qǐng)看基本操作篇。
img2img 的操作我就不過(guò)多贅述了。如果你還不太清楚，可以看基本操作篇，以及 Stock Photo 那篇。

3D 卡通頭像

第一個(gè)要分享的是卡通頭像。首先跟大家強(qiáng)調(diào)下：

我基本上把國(guó)內(nèi)國(guó)外的生成頭像教程都看過(guò)，并試過(guò)一遍，還跟 Midjourney 社群的人也交流過(guò)。我的理解是，以目前 V5 的能力，不管你如何調(diào)整 prompt ，想用 img2img 方法生成一張非常像原圖的圖片，基本靠運(yùn)氣，即使用了前面介紹的技巧七方法，也只是提高概率。如果你有令頭像非常像的方法，不妨通過(guò) Issue 分享給我，我會(huì)署下你的名字，并分享給大家。
各位在學(xué)習(xí)的過(guò)程中，如果發(fā)現(xiàn)生成的圖片不像原圖，也不需要?dú)怵H。這是正常的。
你可以通過(guò)我分享的方法，生成一張有原圖神韻的卡通頭像。注意肯定不會(huì)非常像原圖。

在 prompt 里加上原圖鏈接（建議使用證件照，或者背景比較單一的照片，這樣成功率會(huì)高一些），然后用我前面提到的框架設(shè)計(jì)一個(gè) prompt：

	Prompt	解釋
類(lèi)型是什么？	Portraits / Avatar	如果你的原圖是證件照，可以在 prompt 里加入「肖像」一詞，或者「Avatar 頭像」。
主體是什么？	smiling cute boy, undercut hairstyle	這里可以是選填，你可以先不加這個(gè)描述，只填其余 prompt，然后如果生成的圖片不像你。那你就在這里加點(diǎn)描述下你的頭像的詞，一般就是性別、樣貌、發(fā)型、配飾（比如眼鏡、耳環(huán)等）、表情等。注意，盡量挑特征比較強(qiáng)的部分輸入，特征對(duì)了，生成的圖片基本會(huì)有幾份像。
背景是什么？	white background	我這里保留了證件照的白底，你可以加一些實(shí)際場(chǎng)景的背景，比如餐廳之類(lèi)的。
構(gòu)圖是怎樣的？	null	因?yàn)槲覀冾A(yù)先傳了圖片，圖片是張證件照，所以不填
用什么鏡頭？	soft focus	柔焦是指攝影中，使用柔焦鏡頭，使得拍攝的影像既清晰又柔和的效果。一般多在拍攝人像的時(shí)候使用，我在 prompt 里加上這個(gè)，可以使照片更柔和。你也可以不加。
是什么風(fēng)格？	3d render,Pixar style	因?yàn)槟繕?biāo)是生成 3d 照片，所以這里加了 3d render（3d 渲染），以及我喜歡的皮克斯風(fēng)格
參數(shù)	—iw 2	iw 是一個(gè)文字和 img 權(quán)重參數(shù)。數(shù)值越大，就越像原圖，關(guān)于這個(gè)值的介紹，可以看高級(jí)參數(shù)篇。

最后，還有三個(gè)技巧：

如果你生成的照片并不像預(yù)設(shè)的照片，可以在四張圖里，挑一張比較像的，然后點(diǎn) V（Variation），讓模型繼續(xù)生成，再繼續(xù)挑一張像一點(diǎn)的照片，然后繼續(xù)生成新照片，直到出現(xiàn)一張比較像的。
第二個(gè)，我覺(jué)得很神奇，如果前兩個(gè)方法你都試過(guò)了，你生成的圖片還是跟原圖不像，那就在 prompt 里加上「wear glasses（戴眼鏡）」，真的很神奇，我只要加上戴眼鏡就像非常多，如果你原圖戴眼鏡了，你試試在參數(shù)里加個(gè) —no glasses，你會(huì)得到一張更不像你的圖。
最后，就是多用一個(gè)參數(shù)，這個(gè)方法會(huì)在技巧八中展開(kāi)說(shuō)下。

本章最后，有我的證件照的案例。

技巧七：多參數(shù)同時(shí)使用

在使用 img2img 的方法生成頭像時(shí)，我發(fā)現(xiàn)問(wèn)題是「文字權(quán)重比圖片權(quán)重高」，導(dǎo)致其生成的圖片不像原圖，iw 參數(shù)在 V5 里最多提升圖片權(quán)重到 2，所以我就在想有沒(méi)有可能進(jìn)一步降低文字的權(quán)重。

然后我就試了下 s 參數(shù)，發(fā)現(xiàn)的確好了很多。

如果生成的圖片還是不像，你可以在 —iw 2 基礎(chǔ)上，再加一個(gè)參數(shù) —s 200 ，注意同時(shí)用兩個(gè)參數(shù)時(shí)，中間不要有逗號(hào)。我發(fā)現(xiàn)加了 s 參數(shù)之后的確像了很多，我個(gè)人猜測(cè)是 s 和 iw 連用會(huì)進(jìn)步一削弱 text 的權(quán)重。

s 是控制生成圖片的風(fēng)格化程度。簡(jiǎn)單理解，這個(gè)值越低會(huì)更符合 text prompt 的描述，數(shù)值越高藝術(shù)性就會(huì)越強(qiáng)，但跟 text prompt 關(guān)聯(lián)性就會(huì)比較弱。所以如果你生成的圖還是不像，就加大這個(gè)值，比如調(diào)到 500。

我想通過(guò)這個(gè)案例告訴大家，多個(gè)參數(shù)一起使用，有可能會(huì)形成合力，進(jìn)一步放大模型的能力。未來(lái)有新的參數(shù)能力，不妨也想想有沒(méi)有可能一起用？

動(dòng)漫風(fēng)頭像

與 3D 卡通頭像一樣，主要的修改是在圖片風(fēng)格上：

	Prompt	解釋
類(lèi)型是什么？	Portraits / Avatar	繼續(xù)使用相同描述
主體是什么？	smiling cute boy, undercut hairstyle	繼續(xù)使用相同描述
背景是什么？	white background	繼續(xù)使用相同描述
構(gòu)圖是怎樣的？	null	繼續(xù)使用相同描述
用什么鏡頭？	null	因?yàn)槭锹?huà)風(fēng)，就不加柔光鏡頭了
是什么風(fēng)格？	anime, Studio Ghibli	目標(biāo)是制作動(dòng)漫風(fēng)的頭像，所以這里加了 anime（動(dòng)漫），然后加了吉卜力風(fēng)格
參數(shù)	—iw 2 —s 500	注意同時(shí)用兩個(gè)參數(shù)時(shí)，中間不要有逗號(hào)。

賽博朋克頭像

這是我最喜歡的風(fēng)格之一，也是只需要改一下風(fēng)格和背景即可：

	Prompt	解釋
主體是什么？	cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing	加了臉的修飾，還有戴上 VR 眼鏡，穿上賽博朋克風(fēng)衣服
背景是什么？	neon-lit cityscape background	為了讓圖片更像是賽博朋克，就加了個(gè)霓虹燈城市背景，讓其看起來(lái)更有賽博那味
是什么風(fēng)格？	Cyberpunk, by Josan Gonzalez	加了賽博朋克風(fēng)格，以及我非常喜歡的賽博朋克畫(huà)家 Josan Gonzalez

技巧八：使用 Seed 參數(shù)對(duì)圖進(jìn)行二次修改

注意：這個(gè)技巧，我個(gè)人覺(jué)得未來(lái)潛力比較大，但目前 Midjourney 的實(shí)現(xiàn)效果還比較一般，效果得不到保證。官方的社區(qū)的幫助文檔也提到這個(gè)功能在 V5 非常不穩(wěn)定。詳細(xì)可以看看我整理的 Midjourney 官方 FAQ 一章。

你可能遇到類(lèi)似這樣的場(chǎng)景：

你輸入一段 prompt，機(jī)器生成了 4 張圖片
你看了下4張照片，發(fā)現(xiàn)其中有一張還行，但其余不是很滿(mǎn)意，然后改了下 prompt，機(jī)器又生成了一些
但這次生成的照片你都不滿(mǎn)意，你就很煩惱為何會(huì)這樣
然后你就像為啥不能在第一次生成圖上做修改呢？

基于某一次生成的結(jié)果進(jìn)行二次 prompt 修改，理論上我認(rèn)為是可以的，以賽博朋克頭像為例，我先用上述 prompt 生成了四張圖片，然后在消息的右上角點(diǎn)擊 emoji 按鈕（下圖1），然后再輸入框里（下圖2）輸入 envelope，然后點(diǎn)擊信封 emoji（下圖3），接著 bot 就會(huì)將 seed 號(hào)碼發(fā)給你。

然后我修改上面的賽博朋克頭像的 prompt，將其背景改為 China Town，此時(shí)需要注意：

新的 prompt 并不是只改 background，你需要將之前的 prompt 都帶上。
prompt 僅修改 background 的部分。
最后帶上 seed 參數(shù)。

以下是我的案例：

原 prompt：

{img url} avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1

新 prompt（seed 碼只是示例，你要填寫(xiě)自己的 seed）：

{img url} avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1 --seed 758242567

以下是生成的效果（左圖為原圖，右圖是用了 seed 后生成的圖），可以看到，背景的確換了，但人的外觀也有點(diǎn)變化

效果不是很好，但我覺(jué)得值得探索，這樣能提高漸進(jìn)優(yōu)化的成功率：

技巧九：神秘的 blend 功能

這個(gè)技巧，說(shuō)實(shí)話，我感覺(jué)不能稱(chēng)其為技巧，但這又是一個(gè) Midjourney 非常重要的 feature，所以在這里著重介紹一下。

這個(gè)功能使用起來(lái)非常簡(jiǎn)單，在 Discord 輸入框里 /blend，然后點(diǎn)擊這個(gè)菜單：

之后你的輸入框就會(huì)變成這樣：

然后你就可以點(diǎn)擊這兩個(gè)框，然后選擇你電腦上的照片，添加完成后，點(diǎn)擊回車(chē)：

然后 Midjourney 就會(huì)生成這樣牛逼的結(jié)果，左邊是融合鋼鐵俠，右邊是融合巴斯光年：

這個(gè)功能我第一次看到時(shí)，我是非常震驚的，以為是小時(shí)候看游戲王里主角們使用「融合卡」的那種效果?？上Р⒉皇?，這個(gè)功能非常不穩(wěn)定，僅有在滿(mǎn)足多個(gè)未知條件才能達(dá)到上述的效果。

我本來(lái)打算用這個(gè)方法用于生成頭像，但我發(fā)現(xiàn)只要用自己的照片，融合其他風(fēng)格的照片，效果都不太好，目前實(shí)驗(yàn)下來(lái)效果最好的是名人頭像，我的感覺(jué)是因?yàn)?Midjourney 喂了不少名人的頭像給模型，所以這種融合的效果都很好。

但我覺(jué)得它真的很適合做頭像，將自己的頭像跟另一張圖片融合一下，就能生成一張不錯(cuò)的圖，方便又快捷?？上壳斑@個(gè)功能感覺(jué)還不太好用。

當(dāng)然這個(gè)功能還不僅僅止于此，它還有很多使用場(chǎng)景，在后續(xù)會(huì)介紹給大家。

以上內(nèi)容是否對(duì)您有幫助：

← Midjourney 應(yīng)用場(chǎng)景4：插畫(huà)

Midjourney 應(yīng)用場(chǎng)景6：游戲 →

寫(xiě)筆記

我要補(bǔ)充

Midjourney 應(yīng)用場(chǎng)景5：頭像

注意事項(xiàng)

3D 卡通頭像

技巧七：多參數(shù)同時(shí)使用

動(dòng)漫風(fēng)頭像

賽博朋克頭像

技巧八：使用 Seed 參數(shù)對(duì)圖進(jìn)行二次修改

技巧九：神秘的 blend 功能

推薦文章

推薦教程

推薦課程