実写系モデル BRA V4 を比較してみた

実写系モデル BRA V4 を比較してみた Stable Diffusion
実写系モデル BRA V4 を比較してみた

実写系モデルといえばChilloutMixの一強なイメージですが、BRAもいい感じです。
ChilloutMixは長らくバージョンアップはしていませんが、BRAは着々とバージョンアップしています。
今回はこの2つのモデルについて比較していきます。

ChiilloutMixは、chilloutmix_NiPrunedFp32Fix.safetensorsを使用します。
BRA V4は、braBeautifulRealistic_v40.safetensorsを使用します。
どちらもCivitaiからダウンロード可能です。

画像の質

1. プロンプト固定

同じプロンプトで生成した画像を比較します。
シードはランダムですが、その他のパラメータは同じにしています。
(モデルが異なるのでシードを同じにしても同じような画像にはなりません)

左:ChilloutMix、右:BRA

chill1
chill1
bra4
bra4
chill2
chill2
bra1
bra1
chill4
chill4
bra3
bra3
chill3
chill3
bra2
bra2

どちらも綺麗な画像を生成しています。
BRAの方がより本物っぽいかなという印象です。BRAは陰影が上手く付いています。
Chilloutmixは3D感が若干残っている印象です。

こちらのプロンプトで生成しました。

ポジティブプロンプト
best quality, masterpiece, ultra high res, realistic, photo-realistic, soft lighting, 8k, ray photo, (detailed face), 1girl, 40 years old, Japanese girl, piece suit, business suit, pants suit, open jacket, cleavage, long legs, full body, smile, looking at viewer
ネガティブプロンプト
(worst quality:2.0), low quality, normal quality, monochrome, grayscale, sepia, analog photo, blurry, blur, out of focus, error, cropped, jpeg artifacts, bad anatomy, bad body, disfigured, deformed, ugly, bad proportions, mutation, mutated, malformed, bad hands, missing fingers, fewer digit, extra digit, missing arms, fused fingers, extra arms , extra digit, poorly drawn hands, malformed hands, mutated hands and fingers, missing limb, extra limb, floating limbs, disconnected limbs, malformed hands, fused hand, on hand with less than 5 fingers, poorly drawn face, cloned face, unclear eyes, bad feet, extra legs, long neck, long body, multiple breasts, logo, text, title, watermark, painting, sketch, illustration, cartoon

2. LoRA使用

LoRAを使用した場合の画像を比較します。
イケメンを生成するLoRAを使用させていただきました。ありがとうございます。
Pretty Boy

左:ChilloutMix、右:BRA

chill_lora2
chill_lora2
bra_lora1
bra_lora1
chill_lora1
chill_lora1
bra_lora2
bra_lora2

やはりBRAの方が本物っぽいです。
ただ、どちらも綺麗ですので好みの問題かもしれません。

こちらのプロンプトで生成しました。

ポジティブプロンプト
best quality, masterpiece, ultra high res, realistic, photo-realistic, soft lighting, 8k, ray photo, (detailed face), pretty boy, asian <lora:PrettyBoy:1>
ネガティブプロンプト
(worst quality:2.0), low quality, normal quality, monochrome, grayscale, sepia, analog photo, blurry, blur, out of focus, error, cropped, jpeg artifacts, bad anatomy, bad body, disfigured, deformed, ugly, bad proportions, mutation, mutated, malformed, bad hands, missing fingers, fewer digit, extra digit, missing arms, fused fingers, extra arms , extra digit, poorly drawn hands, malformed hands, mutated hands and fingers, missing limb, extra limb, floating limbs, disconnected limbs, malformed hands, fused hand, on hand with less than 5 fingers, poorly drawn face, cloned face, unclear eyes, bad feet, extra legs, long neck, long body, multiple breasts, logo, text, title, watermark, painting, sketch, illustration, cartoon

3. ポーズ固定(OpenPose)

OpenPoseで人物のポーズを固定した場合の画像を比較します。
3人を生成するポーズを使用させていただきました。ありがとうございます。
Beauty Trio Poses Pack

左:ChilloutMix、右:BRA

chill_openpose1
chill_openpose1
bra_openpose1
bra_openpose1
chill_openpose2
chill_openpose2
bra_openpose2
bra_openpose2

これはもう好みですね。
今日は50枚ChilloutMix、50枚BRAで画像生成してみよう!と両方運用するのもいいですね。

こちらのポーズとプロンプトで生成しました。

OpenPose_比較用
OpenPose_比較用
ポジティブプロンプト
best quality, masterpiece, ultra high res, realistic, photo-realistic, soft lighting, 8k, ray photo, (detailed face), 3 Japanese girls posing for photo, school uniform 
ネガティブプロンプト
(worst quality:2.0), low quality, normal quality, monochrome, grayscale, sepia, analog photo, blurry, blur, out of focus, error, cropped, jpeg artifacts, bad anatomy, bad body, disfigured, deformed, ugly, bad proportions, mutation, mutated, malformed, bad hands, missing fingers, fewer digit, extra digit, missing arms, fused fingers, extra arms , extra digit, poorly drawn hands, malformed hands, mutated hands and fingers, missing limb, extra limb, floating limbs, disconnected limbs, malformed hands, fused hand, on hand with less than 5 fingers, poorly drawn face, cloned face, unclear eyes, bad feet, extra legs, long neck, long body, multiple breasts, logo, text, title, watermark, painting, sketch, illustration, cartoon, nsfw

モデル容量

モデルの容量はネットワーク(層)の大きさに依存します。
どちらもSD1.5をベースにファインチューニングしており、容量も似た感じになっています。

  • ChilloutMix:3.97GB
  • BRA V4:3.82GB

画像生成時間

画像生成時間はモデル容量に依存します。
ただしGPUのスペックにもよります。

結果はどちらも同じ時間でした。
25秒/ステップ = 1.16 iter / sec

[実験パラメータ]
サンプラー:DPM++ 2M Karras、ステップ数:30、生成画像数:20

まとめ

ChilloutMixもBRAも実写系モデルとして素晴らしい画像を生成してくれました。
今回は画像しか生成しておりませんので、その他の物体でも比較すると差異がわかりやすくなるかもしれません。

今回はBRA V4で試しましたが、BRA V5もそろそろリリースされそうです。
2次元モデルと同じように実写系モデルもどんどん発展していきそうですね♪

コメント

タイトルとURLをコピーしました