Stable Diffusion プロンプト(呪文)「重み」について検証してみた

Stable Diffusion
スポンサーリンク

※本ページはプロモーションが含まれています

Stable Diffusion Web UI で使用するプロンプト
今回は「重み」について、ちょっと試してみようと思います。

ソフトの仕組的にどうとか、内部のことがどうとか
そういうのは全然分からないんで、実際にやってみてどうだったか
という、素人ユーザー側の視点で書きます。

なので、あくまでも参考程度にご覧くださいませ。

スポンサーリンク

検証で使用するモデル

今回も DreamShaper V5 を使用して検証します。
イラストから結構リアルな画像まで幅広く生成してくれるのでおすすめです。

DreamShaper - 8 | Stable Diffusion Checkpoint | Civitai
DreamShaper - V∞! Please check out my other base models , including SDXL ones! Check the version description below (bottom right) for more info and...

ダウンロード、インストール方法など、詳細はこちらで紹介しています。

Stable Diffusion モデル【DreamShaper V5】
Stable Diffusion Web UI で使用出来る モデル DreamShaper V5 の紹介です。クレジット表示不要で商用利用も可能という親切モデル。イラスト系からリアル手前くらいまで幅広く対応してくれます。
スポンサーリンク

プロンプトの「重み」とはなんぞや

私も理解しているわけではないんですけど、簡単に言うと
プロンプトのワードを強調したりすることですかね。

(high quality:1.3)

こんな感じで使われているプロンプトですね。
カッコで囲って、ワードの後ろにコロン「:」で数値を付ける。
これが書き方のルールになっているようです。

1を基準に大きい程、効果が強くて、小さい程、効果が弱くなる
そんなイメージだと思ってます。

じゃー、プロンプト内でいろんなワードに強調つけまくったらどうなんねん
とか、そういうややこしいことは、知らん笑
今回はシンプルに1ワードに付けてみて、どうなるかってとこを見たいと思います。

スポンサーリンク

今回のプロンプト

prompt:
incredibly absurdres, insanely detailed, Ultra detailed, best quality, High quality, finerly detailed face, beautiful, masterpiece, hyperrealism, photorealistic detail, HDR:1.3, 1 girl,
BREAK
(ここに入れて検証します)

Negative prompt:
EasyNegative, (worst quality:2), (low quality:2), (normal quality:2), lowres, normal quality, monochrome, grayscale, skin spots, acnes, skin blemishes, age spot, manboobs, (backlight:1.2), double navel, mutad arms, hused arms, neck lace, analog, analog effects, nipples, nsfw

Steps: 15, Sampler: DPM++ 2M Karras, CFG scale: 9, Seed: 591941812, Size: 544x680, Model hash: 6d492d946c, Model: dreamshaper_5BakedVae

今回はこれをベースに行きますね。
プロンプトの方はとりあえず、重みはナシにしてあります。

他の記事でも書いたんですけど、低スペックVRAM4GBでやっていて
生成時間長いんでステップ数は15で、画像サイズも微妙なとこついてます笑

黒髪

黒髪 (black hair:1.0) これをとりあえずやってみる。

いや、黒髪は黒髪やろ!って思うんですけどね笑
実際どんな挙動なのか興味あるんで、まぁやってみます。

5枚を1セットにしたいんで
(記事に貼るときのことを考えてです)
0.6~1.0、1.1~1.5 でやりたいと思います。

なんか、あんまり数値増やすと崩壊するようなこと
どっかに書いてたような気がするんで、基本1.5までしかつかってないんですよね。

ネガティブプロンプトに 2 入れてるやんけ!ってのはナシで笑

(black hair:0.6~1.0) / (black hair:1.1~1.5)

どうでしょうかね?
1.0をベースとして見ると、1.0でも正直黒髪に見えますが
1.5と比べたら1.5のが黒髪ですね。

逆に0.6はちょっと茶色かかってますよね。
なんか髪よりも肌の色の変化が気になるけど笑

結果としては、数値が増えるほど、より黒くなったって感じですかね。

化粧

これどうですかね。化粧 (makeup:1.0)

いや、その前に makeup とか今まで使ったことないわ。
効果あるのかどうかが、まず心配。

すっぴん → ナチュラルメイク → 厚化粧 みたいになるんかな?

(makeup:0.6~1.0) / (makeup:1.1~1.5)

うわ、めっちゃ効果ありますやん。
個人的には0.6くらいの方が好みですね笑

なんとなく意味わかってきましたねー。
数値増やすほど、そのワードに対して、より効果がハッキリと出る感じ。

いや、重みやねんから、そりゃそうやろってのはナシで。

笑顔

笑顔 (smile:1.0) このワードはよく使うんじゃないですか?
なんかとりあえず入れとけ、みたいな。

深く考えたことなかったけど、数値多い程、すごい笑顔になるんかな。

そうなってくると smile よりももっと笑顔にしたい、とかで
Laugh, Big laugh 使ってたけど、数値増やすだけでいけたんじゃ・・・

(smile:0.6~1.0) / (smile:1.1~1.5)

うわー、まじかー。笑顔も数値で強弱付けれるんかいなー。
これで今までより、細かい調整できるような気がするわー。

まぁ他のワード混ざってきたら、わからんようになるんやろけど。

童顔

童顔 (baby face:1.0) これは効果あると思う。
こないだ年齢の検証したけど、明らかに効果あったからねー。

数値増やせば増やすほど、童顔になっていくんじゃないだろうか。

(baby face:0.6~1.0) / (baby face:1.1~1.5)

これは効果出まくってますね。1.5はもう童顔の域超えてる。
子供とかの場合はこれを使うんかな?

あれ?体はそのまま顔だけ幼くなるんか?笑
普通に children とか入れるほうがええんやろか。

やったことないんで、これはまた別で気が向いたらやります。

気になるから 2.0 やってみる

いやー、作画崩壊が起こるらしいけど、気になるから一応やってみる。

あ・・・あかんやつ。

まとめ

以上のことから・・・

  • 重みは数値が多いほど、ワードに対する効果が増加する
  • 今回はシンプルにその単語のみだったので、複合の場合はわからん
  • 2.0は過剰な効果が表れるので、自己責任で・・・。

ってな具合でした。

他のモデルではどういう結果になるのか分かりませんので
あくまでも参考までに。

その他、Stable Diffusion 関連の情報

年齢についてのプロンプトの検証をこちらでやってます。

Stable Diffusion プロンプト(呪文)年齢
Stable Diffusion Web UI の プロンプト(呪文)に年齢をした場合は効果があるのかを検証してみました。生成したいイメージに合わせて人物の年齢を操作して、欲しい画像を生成しましょう。

こちらで各種プロンプトの一覧を紹介していますので、興味ありましたらご活用下さい。

Stable Diffusion プロンプト(呪文)一覧
Stable Diffusion で使用するプロンプト(呪文)の一覧です。プロンプト(呪文)とは何か。プロンプト(呪文)を指定して画像を生成します。表情、髪型、髪色、体型、胸、背景、服装、衣装、コスチューム、構図等 まだまだ追加していきますよ。

ポースを指定できる ControlNet の導入方法や使用方法についても紹介しています。

Stable Diffusion ControlNet 導入方法
Stable Diffusion Web UI で使用する ControlNet の導入方法を説明します。こういうポーズを生成したい!という場合は ControlNet があればかなりラクに狙えます。
タイトルとURLをコピーしました