画像生成するときは、プロンプトをどう指定するかが重要です。
最近ではプロンプトエンジニアと呼ばれる、プロンプトをどう指定すべきかを考える専門家なんかも出てきました。
みなさん自分の求める画像を生成するために試行錯誤を繰り返しているのではないでしょうか。
- AI画像生成が初めてで何を書けばよいかわからない
- もっと再現性を高めるプロンプトがあるはずだ
- お気に入りプロンプトばかりでマンネリ化している
- 掘り出し物のプロンプトを見つけたい
などなど、困り事もあるのではないでしょうか。
そんなときは同じAI画像生成師のプロンプトを参考にしてみましょう!
プロンプトの基本
- Positive プロンプトには描写したいものを指定
- Negative プロンプトには描写したくないものを指定
- カンマ区切りで指定
- 英語で指定
- 文章で指定してもよい
- 単語を文頭に書く(早めに登場させる)ほど優先されがち
- 単語を()で囲むと、1.1倍強く反映(より描写させたい)
- 単語を[]で囲むと、1.1倍弱く反映(描写したいけど控えめに)
- (単語:強度)とすると、強度分強く反映。(cat)は(cat:1.1)と同じ意味になります。
- <lora:LoRA:強度>でLoRAを指定
[]は分かりにくいですが、1.1倍弱く = 0.9倍強く と同じ意味です。
1/1.1=0.9091というわけです。
Stable Diffusion Web UIの公式Wikiにもプロンプトについて書かれていますので、ぜひ参考に。
https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Features
LoRAについてや作り方は以下で紹介しています。
プロンプトの例
// Positive プロンプト
1girl, (classroom), [kawaii]
// Negative プロンプト
out of focus, (low quality:1.5)
意味としては、
1人の少女で教室(重要!)にいて可愛い(若干)
ただし、ピンボケで低画質(特に!)は描かないように。

プロンプト参考サイト
MajinAI

プロンプトは呪文と呼ばれることもあり、「呪い(まじない)」という名称はしっくりきます。
さらに「魔人 + AI」になっておりダブルミーニングでセンスもりもりの名称ですね!
魔人といえばアキネーターが思い浮かびますよね笑
画面いっぱいに画像が表示されますので、気に入った画像を探しやすいです。
画像をクリックすると、プロンプトや用いたモデル、パラメータなどを確認することができます。
似たプロンプトの画像も紹介してくれますので、数珠繋ぎで画像探索ができます。
ゾーニングで「18禁/NSFW」を解禁することもできます。
AIBooru
2次元の画像のみです。
左メニューにあるTagsの単語をクリックすると、関連する単語が並び替えられます。
「?」をクリックすると、その単語がどう描写するのか教えてくれます。
chichi-pui(ちちぷい)

ユーザー登録しないとプロンプトは確認できません。
Twitterで登録しますので、画像生成者のTwitterをすぐ確認することができます。
画像のレベルは高いです。
裏技
txt2img2txt
たまたま生成した画像がすごく良く、どういうプロンプトか確認したい時があります。
もちろん生成に使用したプロンプト、パラメータ、シードを確認すればよいのですが、
その生成画像はAIからするとどういうプロンプトとして認識するのか確認することができます。
LoRAを使わずに指定する方法、プロンプトのアイデア出しなんかにも使えますね。
- txt:人がプロンプトを入力する
- img:AIが画像を生成する
- txt:AIが生成画像を単語にする
このような流れでテキスト→画像→テキストを実現します。
画像→テキスト(img2txt)は、Stable Diffusionにも採用されているCLIPという技術を使います。
CLIPは簡単にいうと、単語をベクトル化(数値化)することで計算できるように、さらには他の単語と比較できるようにするものです。数値化された単語、数値化された画像を同じ指標にすることで、単語と画像の類似度がわかり変換できるようになるイメージです。
Stable Diffusion Web UIのimg2imgタブの「Interrogate CLIP」をクリックすることで、画像→テキストをしてくれます。
// 1. 最初のtxt(人が入力)
office lady, 30 years old, Japanese woman, piece suit, black hair, best quality, soft lighting, 8k, realistic, photo

// 3. 最後のtxt(AIが出力)
a woman in a suit standing in front of a desk with a computer on it and a monitor behind her, professional, a stock photo, Chizuko Yoshida, purism
AIが出力したプロンプトは英語の勉強にもなりますね!
AIに英文の採点をさせる取り組みなんかもあり、AIを活用してジョイフルな生活をしたいですね。
コメント