CFG Scale 設定値の比較

2023年8月15日

CFG Scaleとは?

Stable DiffusionのCFG Scale設定値は、アルゴリズムに影響を与えます。CFG Scaleは、条件付き生成において、生成器が出力する特定の画像に対して、条件として与えられたラベルやテキストなどの情報を表すスケールです。CFG Scaleが大きい場合、生成される画像はより条件付けられたものになり、スケールが小さい場合は、より自由度の高い画像が生成されます。

数値が大きい場合、生成される画像は、より条件付けられるなら最大の30で良いの?

ん~? 例えば、可愛い女の子のイメージを僕に教えて!

肌は白く、髪型はショートカットで、目が大きく、鼻筋の通った感じかな?

言葉に忠実に描くとこうなるけど、イメージ通りかな?

イメージと賭けは離れているわね😱
条件に縛り付け過ぎるとダメなのね!
分かったわ。

CFG Scaleは〇〇の条件を設定範囲内で自由に描いてね!と言う意味で使うんだ、先ほどのイメージをスケール値3.5まで下げると可愛くなったよ!

広告

CFG Scale値での画像の変化

CFG Scale値で画像にどの様な変化が起きるか検証してみます。

使用するモデルは「citrinedreammix_v11BakedVAE」
プロンプト : 1 girl,<ora:zko:1>

<ora:zko:1>は【超初心者用】LoRA学習起動パッチを使用した学習環境のセットアップ方法で制作したLoRAを使用しています。

それでは、見て行きましょう。

CFG Scale値 7.0が元画像になりますので1.0と2.0はLoRAの設定すら無視されている様で画質も良くありません。

CFG Scale値3.0以降からLoRAが適応されキャライメージ通りの画像が生成される様になります 。

CFG Scale値 15.0までは安定した画像生成を保ているがCFG Scale値7.0以降の画像は崩壊し始めている。

CFGスケール20.0以降では、なぜか足が生成される様になってしまっていますが、スケール7.0の±3.0の範囲で使うことが多いので気にしないようにします。
ここで注目したいのは、CFGスケール毎にポージングや衣装が微妙に変わる事です、特に猫耳の有る無しはイメージが変わってしまうので自由度設定(CFGスケール)で調整する場合もあるんだ。

猫耳😚