在 Stock Photo 一章中,介紹了 img2img 的方法,這個(gè)方法除了解決 Stock Photo 的那幾個(gè)問(wèn)題外,還很適合多個(gè)場(chǎng)景。
本章會(huì)著重介紹用這個(gè)方法生成的頭像的 prompt。并且從本章開(kāi)始會(huì)逐步豐富我們的 prompt 結(jié)構(gòu),使其更加完整。
在介紹 img2img 的應(yīng)用前,我想強(qiáng)調(diào)一下:
第一個(gè)要分享的是卡通頭像。首先跟大家強(qiáng)調(diào)下:
在 prompt 里加上原圖鏈接(建議使用證件照,或者背景比較單一的照片,這樣成功率會(huì)高一些),然后用我前面提到的框架設(shè)計(jì)一個(gè) prompt:
Prompt | 解釋 | |
---|---|---|
類(lèi)型是什么? | Portraits / Avatar | 如果你的原圖是證件照,可以在 prompt 里加入「肖像」一詞,或者「Avatar 頭像」。 |
主體是什么? | smiling cute boy, undercut hairstyle | 這里可以是選填,你可以先不加這個(gè)描述,只填其余 prompt,然后如果生成的圖片不像你。那你就在這里加點(diǎn)描述下你的頭像的詞,一般就是性別、樣貌、發(fā)型、配飾(比如眼鏡、耳環(huán)等)、表情等。注意,盡量挑特征比較強(qiáng)的部分輸入,特征對(duì)了,生成的圖片基本會(huì)有幾份像。 |
背景是什么? | white background | 我這里保留了證件照的白底,你可以加一些實(shí)際場(chǎng)景的背景,比如餐廳之類(lèi)的。 |
構(gòu)圖是怎樣的? | null | 因?yàn)槲覀冾A(yù)先傳了圖片,圖片是張證件照,所以不填 |
用什么鏡頭? | soft focus | 柔焦是指攝影中,使用柔焦鏡頭,使得拍攝的影像既清晰又柔和的效果。一般多在拍攝人像的時(shí)候使用,我在 prompt 里加上這個(gè),可以使照片更柔和。你也可以不加。 |
是什么風(fēng)格? | 3d render,Pixar style | 因?yàn)槟繕?biāo)是生成 3d 照片,所以這里加了 3d render(3d 渲染),以及我喜歡的皮克斯風(fēng)格 |
參數(shù) | —iw 2 | iw 是一個(gè)文字和 img 權(quán)重參數(shù)。數(shù)值越大,就越像原圖,關(guān)于這個(gè)值的介紹,可以看高級(jí)參數(shù)篇。 |
最后,還有三個(gè)技巧:
本章最后,有我的證件照的案例。
在使用 img2img 的方法生成頭像時(shí),我發(fā)現(xiàn)問(wèn)題是「文字權(quán)重比圖片權(quán)重高」,導(dǎo)致其生成的圖片不像原圖,iw 參數(shù)在 V5 里最多提升圖片權(quán)重到 2,所以我就在想有沒(méi)有可能進(jìn)一步降低文字的權(quán)重。
然后我就試了下 s 參數(shù),發(fā)現(xiàn)的確好了很多。
如果生成的圖片還是不像,你可以在 —iw 2 基礎(chǔ)上,再加一個(gè)參數(shù) —s 200 ,注意同時(shí)用兩個(gè)參數(shù)時(shí),中間不要有逗號(hào)。我發(fā)現(xiàn)加了 s 參數(shù)之后的確像了很多,我個(gè)人猜測(cè)是 s 和 iw 連用會(huì)進(jìn)步一削弱 text 的權(quán)重。
s 是控制生成圖片的風(fēng)格化程度。簡(jiǎn)單理解,這個(gè)值越低會(huì)更符合 text prompt 的描述,數(shù)值越高藝術(shù)性就會(huì)越強(qiáng),但跟 text prompt 關(guān)聯(lián)性就會(huì)比較弱。所以如果你生成的圖還是不像,就加大這個(gè)值,比如調(diào)到 500。
我想通過(guò)這個(gè)案例告訴大家,多個(gè)參數(shù)一起使用,有可能會(huì)形成合力,進(jìn)一步放大模型的能力。未來(lái)有新的參數(shù)能力,不妨也想想有沒(méi)有可能一起用?
與 3D 卡通頭像一樣,主要的修改是在圖片風(fēng)格上:
Prompt | 解釋 | |
---|---|---|
類(lèi)型是什么? | Portraits / Avatar | 繼續(xù)使用相同描述 |
主體是什么? | smiling cute boy, undercut hairstyle | 繼續(xù)使用相同描述 |
背景是什么? | white background | 繼續(xù)使用相同描述 |
構(gòu)圖是怎樣的? | null | 繼續(xù)使用相同描述 |
用什么鏡頭? | null | 因?yàn)槭锹?huà)風(fēng),就不加柔光鏡頭了 |
是什么風(fēng)格? | anime, Studio Ghibli | 目標(biāo)是制作動(dòng)漫風(fēng)的頭像,所以這里加了 anime(動(dòng)漫),然后加了吉卜力風(fēng)格 |
參數(shù) | —iw 2 —s 500 | 注意同時(shí)用兩個(gè)參數(shù)時(shí),中間不要有逗號(hào)。 |
這是我最喜歡的風(fēng)格之一,也是只需要改一下風(fēng)格和背景即可:
Prompt | 解釋 | |
---|---|---|
主體是什么? | cyberpunk robot face, holographic VR glasses, holographic cyberpunk clothing | 加了臉的修飾,還有戴上 VR 眼鏡,穿上賽博朋克風(fēng)衣服 |
背景是什么? | neon-lit cityscape background | 為了讓圖片更像是賽博朋克,就加了個(gè)霓虹燈城市背景,讓其看起來(lái)更有賽博那味 |
是什么風(fēng)格? | Cyberpunk, by Josan Gonzalez | 加了賽博朋克風(fēng)格,以及我非常喜歡的賽博朋克畫(huà)家 Josan Gonzalez |
注意:這個(gè)技巧,我個(gè)人覺(jué)得未來(lái)潛力比較大,但目前 Midjourney 的實(shí)現(xiàn)效果還比較一般,效果得不到保證。官方的社區(qū)的幫助文檔也提到這個(gè)功能在 V5 非常不穩(wěn)定。詳細(xì)可以看看我整理的 Midjourney 官方 FAQ 一章。
你可能遇到類(lèi)似這樣的場(chǎng)景:
基于某一次生成的結(jié)果進(jìn)行二次 prompt 修改,理論上我認(rèn)為是可以的,以賽博朋克頭像為例,我先用上述 prompt 生成了四張圖片,然后在消息的右上角點(diǎn)擊 emoji 按鈕(下圖1),然后再輸入框里(下圖2)輸入 envelope,然后點(diǎn)擊信封 emoji(下圖3),接著 bot 就會(huì)將 seed 號(hào)碼發(fā)給你。
然后我修改上面的賽博朋克頭像的 prompt,將其背景改為 China Town,此時(shí)需要注意:
以下是我的案例:
原 prompt:
{img url} avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, neon-lit cityscape background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1
新 prompt(seed 碼只是示例,你要填寫(xiě)自己的 seed):
{img url} avatar, cyberpunk robot face, holographic VR glasses,holographic cyberpunk clothing, China Town background, Cyberpunk, by Josan Gonzalez --s 500 --iw 1 --seed 758242567
以下是生成的效果(左圖為原圖,右圖是用了 seed 后生成的圖),可以看到,背景的確換了,但人的外觀也有點(diǎn)變化
效果不是很好,但我覺(jué)得值得探索,這樣能提高漸進(jìn)優(yōu)化的成功率:
這個(gè)技巧,說(shuō)實(shí)話,我感覺(jué)不能稱(chēng)其為技巧,但這又是一個(gè) Midjourney 非常重要的 feature,所以在這里著重介紹一下。
這個(gè)功能使用起來(lái)非常簡(jiǎn)單,在 Discord 輸入框里 /blend,然后點(diǎn)擊這個(gè)菜單:
之后你的輸入框就會(huì)變成這樣:
然后你就可以點(diǎn)擊這兩個(gè)框,然后選擇你電腦上的照片,添加完成后,點(diǎn)擊回車(chē):
然后 Midjourney 就會(huì)生成這樣牛逼的結(jié)果,左邊是融合鋼鐵俠,右邊是融合巴斯光年:
這個(gè)功能我第一次看到時(shí),我是非常震驚的,以為是小時(shí)候看游戲王里主角們使用「融合卡」的那種效果??上Р⒉皇?,這個(gè)功能非常不穩(wěn)定,僅有在滿(mǎn)足多個(gè)未知條件才能達(dá)到上述的效果。
我本來(lái)打算用這個(gè)方法用于生成頭像,但我發(fā)現(xiàn)只要用自己的照片,融合其他風(fēng)格的照片,效果都不太好,目前實(shí)驗(yàn)下來(lái)效果最好的是名人頭像,我的感覺(jué)是因?yàn)?Midjourney 喂了不少名人的頭像給模型,所以這種融合的效果都很好。
但我覺(jué)得它真的很適合做頭像,將自己的頭像跟另一張圖片融合一下,就能生成一張不錯(cuò)的圖,方便又快捷??上壳斑@個(gè)功能感覺(jué)還不太好用。
當(dāng)然這個(gè)功能還不僅僅止于此,它還有很多使用場(chǎng)景,在后續(xù)會(huì)介紹給大家。
更多建議: