Stable Diffusion Web UI で使用するプロンプト
今回は「重み」について、ちょっと試してみようと思います。
ソフトの仕組的にどうとか、内部のことがどうとか
そういうのは全然分からないんで、実際にやってみてどうだったか
という、素人ユーザー側の視点で書きます。
なので、あくまでも参考程度にご覧くださいませ。
検証で使用するモデル
今回も DreamShaper V5 を使用して検証します。
イラストから結構リアルな画像まで幅広く生成してくれるのでおすすめです。
ダウンロード、インストール方法など、詳細はこちらで紹介しています。
プロンプトの「重み」とはなんぞや
私も理解しているわけではないんですけど、簡単に言うと
プロンプトのワードを強調したりすることですかね。
(high quality:1.3)
こんな感じで使われているプロンプトですね。
カッコで囲って、ワードの後ろにコロン「:」で数値を付ける。
これが書き方のルールになっているようです。
1を基準に大きい程、効果が強くて、小さい程、効果が弱くなる。
そんなイメージだと思ってます。
じゃー、プロンプト内でいろんなワードに強調つけまくったらどうなんねん
とか、そういうややこしいことは、知らん笑
今回はシンプルに1ワードに付けてみて、どうなるかってとこを見たいと思います。
今回のプロンプト
prompt:
incredibly absurdres, insanely detailed, Ultra detailed, best quality, High quality, finerly detailed face, beautiful, masterpiece, hyperrealism, photorealistic detail, HDR:1.3, 1 girl,
BREAK
(ここに入れて検証します)
Negative prompt:
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, monochrome, grayscale, skin spots, acnes, skin blemishes, age spot, manboobs, (backlight:1.2), double navel, mutad arms, hused arms, neck lace, analog, analog effects, nipples, nsfw
Steps: 15, Sampler: DPM++ 2M Karras, CFG scale: 9, Seed: 591941812, Size: 544x680, Model hash: 6d492d946c, Model: dreamshaper_5BakedVae
今回はこれをベースに行きますね。
プロンプトの方はとりあえず、重みはナシにしてあります。
他の記事でも書いたんですけど、低スペックVRAM4GBでやっていて
生成時間長いんでステップ数は15で、画像サイズも微妙なとこついてます笑
黒髪
黒髪 (black hair:1.0) これをとりあえずやってみる。
いや、黒髪は黒髪やろ!って思うんですけどね笑
実際どんな挙動なのか興味あるんで、まぁやってみます。
5枚を1セットにしたいんで
(記事に貼るときのことを考えてです)
0.6~1.0、1.1~1.5 でやりたいと思います。
なんか、あんまり数値増やすと崩壊するようなこと
どっかに書いてたような気がするんで、基本1.5までしかつかってないんですよね。
ネガティブプロンプトに 2 入れてるやんけ!ってのはナシで笑
(black hair:0.6~1.0) / (black hair:1.1~1.5)
どうでしょうかね?
1.0をベースとして見ると、1.0でも正直黒髪に見えますが
1.5と比べたら1.5のが黒髪ですね。
逆に0.6はちょっと茶色かかってますよね。
なんか髪よりも肌の色の変化が気になるけど笑
結果としては、数値が増えるほど、より黒くなったって感じですかね。
化粧
これどうですかね。化粧 (makeup:1.0)
いや、その前に makeup とか今まで使ったことないわ。
効果あるのかどうかが、まず心配。
すっぴん → ナチュラルメイク → 厚化粧 みたいになるんかな?
(makeup:0.6~1.0) / (makeup:1.1~1.5)
うわ、めっちゃ効果ありますやん。
個人的には0.6くらいの方が好みですね笑
なんとなく意味わかってきましたねー。
数値増やすほど、そのワードに対して、より効果がハッキリと出る感じ。
いや、重みやねんから、そりゃそうやろってのはナシで。
笑顔
笑顔 (smile:1.0) このワードはよく使うんじゃないですか?
なんかとりあえず入れとけ、みたいな。
深く考えたことなかったけど、数値多い程、すごい笑顔になるんかな。
そうなってくると smile よりももっと笑顔にしたい、とかで
Laugh, Big laugh 使ってたけど、数値増やすだけでいけたんじゃ・・・
(smile:0.6~1.0) / (smile:1.1~1.5)
うわー、まじかー。笑顔も数値で強弱付けれるんかいなー。
これで今までより、細かい調整できるような気がするわー。
まぁ他のワード混ざってきたら、わからんようになるんやろけど。
童顔
童顔 (baby face:1.0) これは効果あると思う。
こないだ年齢の検証したけど、明らかに効果あったからねー。
数値増やせば増やすほど、童顔になっていくんじゃないだろうか。
(baby face:0.6~1.0) / (baby face:1.1~1.5)
これは効果出まくってますね。1.5はもう童顔の域超えてる。
子供とかの場合はこれを使うんかな?
あれ?体はそのまま顔だけ幼くなるんか?笑
普通に children とか入れるほうがええんやろか。
やったことないんで、これはまた別で気が向いたらやります。
気になるから 2.0 やってみる
いやー、作画崩壊が起こるらしいけど、気になるから一応やってみる。
あ・・・あかんやつ。
まとめ
以上のことから・・・
- 重みは数値が多いほど、ワードに対する効果が増加する
- 今回はシンプルにその単語のみだったので、複合の場合はわからん
- 2.0は過剰な効果が表れるので、自己責任で・・・。
ってな具合でした。
他のモデルではどういう結果になるのか分かりませんので
あくまでも参考までに。
その他、Stable Diffusion 関連の情報
年齢についてのプロンプトの検証をこちらでやってます。
こちらで各種プロンプトの一覧を紹介していますので、興味ありましたらご活用下さい。
ポースを指定できる ControlNet の導入方法や使用方法についても紹介しています。