【プロンプト完全ガイド】プロンプトの基礎知識・書き方・テクニックを徹底解説!

プロンプトってどうやって書けばいいの?

そんな方向けにプロンプトの基礎知識から書き方まで解説していきますね!

 

本記事を書いているのは
浮月つばさ
  • AIクリエイター
    音楽生成AIや画像生成AIを使ってYouTubeを運営中
  • 生成AI歴3年目
    2022年11月ChatGPT-3.5リリース時から利用
  • ブログ運用歴5年
    現在3つのブログと最近noteを運用中
    ※記事内の不明な点・質問などは、XのDMやお問い合わせにて気軽に聞いてくださいね!

現在、生成AIやブログに関してnoteの方でも発信しています!ぜひご覧ください。

目次

プロンプト(呪文)の基礎知識

まずは画像生成における「プロンプト」における基礎知識を解説していきます。

プロンプトとは?

画像生成AIに対して、AIに何を描いてほしいのかを指示する言葉(文章)のことを「プロンプト」と言います。

AIはプロンプトで与えられた指示を読み取って画像を生成するため、プロンプトの質と内容が生成される画像の品質やイメージとの一致度を大きく左右します。

より具体的で詳細な指示を与えることで、AIは意図を正確に理解し、理想的な画像を生成できるようになりますよ。

プロンプトと言語

プロンプトとして入力できる言語は、各AIサービスによって異なります。

下記では、それぞれのサービスの特徴を踏まえて、英語プロンプト・日本語プロンプトの対応状況と精度差をまとめました。

画像生成AIサービス英語プロンプト日本語プロンプト英語と日本語の精度差
ChatGPT(DALL·E 3)英語の方が細かい表現に強い。日本語も使えるが、意図が少し変わることあり。
Gemini(画像生成)日本語はまだ弱く、英語のほうが圧倒的に安定。
Midjourney×英語のみ対応。日本語は不可。
nijijourneyアニメ風イラストに特化した生成AI。
Stable Diffusion基本は英語推奨。日本語拡張で部分的に対応可能。
SeaArt日本語対応しており、差は少なめ。画像生成初心者におすすめ。
Novel AI×Danbooruタグ(英語ベース)必須。日本語は非対応。
Canva(AI画像生成)日本語の自然文に強く、英語でも可。ただし細かい調整は難しい。
Adobe Firefly日本語でも動作するが、ニュアンスの細かさは英語のほうが有利。

自分が利用したいサービスによって、最適な言語を使えるようにしていきましょう。

「画像生成AIを使うの初めてなんだよね」という人は、プロンプトを書くのに慣れるまで「日本語対応」しているサービスを使うことをおすすめします。

私のおすすめは『SeaArt』です!
無料プランもあり日本語にも対応しているので、画像生成AI初心者にはおすすめのツールになっていますよ!

下記の記事で、登録から画像生成の基礎まで解説しています。

プロンプトの書き方

では実際に画像生成する際に知っておきたい、プロンプトの書き方やコツについてまとめていきます。

プロンプトはタグをカンマで繋げていく

プロンプトは、「タグ」と呼ばれる画像生成したい要素である「単語」や複数の単語からなる「フレーズ」を、カンマ( , )で繋げていく方法が基本となります。

プロンプトは英語が基本で日本語対応ツールもありますが、再現性は英語が安定しています。

例えば、「アニメ風の猫耳をしたアイドルの女の子」を描きたいとします。このプロンプトは下記のように、単語やフレーズをカンマ( , )で区切って書きます。

1girl, solo, 2D, anime style, orange hair, cat ears, idol outfit

日本語のプロンプトに対応しているツールでは、下記のように書くことも可能です。

1人の女の子, ソロ, 2D, アニメ風, オレンジの髪, 猫耳, アイドルの衣装

タグの優先度は先頭ほど強めに解釈され、長文ほど先頭ワードの影響が残りやすいです。

どんなプロンプトを書けばいいのか?

プロンプトには、生成する画像の「品質」「画風」、人物の「性別・年齢・人数」「表情」など、さらには「背景」「構図」など、様々な要素をタグで指定することができます。

下記は代表的なプロンプト(タグ)です。それぞれの項目で詳細記事へのリンクを貼っておきますので、そちらも合わせてご覧ください!

プロンプトの書くときのテクニック

基礎的な書き方は上記の「プロンプトの書き方」で紹介した通りですが、以下で紹介するコツ・テクニックも使えるようになれば、より一層理想に近い画像生成をできるでしょう。

①:かっこ()を使った強調構文

プロンプトのどの部分を強調したいかによって、()をつけることで強弱をコントロールすることが可能です。

「丸のかっこ()」でプロンプトを囲むと強度が「1.1倍」になり、プロンプトの内容が生成されやすくなります。

elven sage, (close up portrait), 

また更にもう一度囲むと「1.1×1.1=1.21倍」となります。

elven sage, ((close up portrait)), 

またまた更にもう一度囲むと「1.1×1.1×1.1=1.331倍」になります。

elven sage, (((close up portrait))), 

また、()とコロン「:」を使って倍率を直接指定することもできますよ。

elven sage, (close up portrait:1.1), 

「1.0」より値を小さくすることで、強度を下げることも 。

elven sage, (close up portrait:0.9), 

 

下記は、実際に「顔のクローズアップ」の強調を比較した画像です。

(close up portrait:1.0)
(close up portrait:1.2)
(close up portrait:1.1)
(close up portrait:1.3)

「1.1」と「1.2」にそこまで大きな違いはありませんが、「1.3」だとかなり顔のクローズアップが強調されていますね。

②:「AND構文」でプロンプトを結合

AND構文は、文字列と文字列の間に「AND」と入力することでプロンプト同士を結合し、どちらの要素も持つ画像を生成することができます。

「AND」はすべて大文字で入力しなければ機能してくれません。

girl AND cat
dragon AND ice
cream AND bear

 

また上記の機能だけでなく、AND構文を使うことで結果的にプロンプトを結合し、トークン数を減らすことができます。

画像生成AIにおける「トークン数」とは

Stable DiffusionやMidjourneyなどの画像生成AIには、画像を生成する際のプロンプトのワード数(トークン数)にそれぞれ限界値があるとされています。

Stable Diffusionでは75トークン、Midjourneyでは60~70トークン(ワード)と言われていて、制限トークン以上の単語やフレーズは認識されません。

たとえば、女の子と男の子の画像を生成する際、「girl, boy」と入力すると、「girl」「,」「boy」の3つのトークンとしてカウントされます。

girl, boy

そこで「AND構文」を使えば「girl AND boy」と1つのトークンにまとめることができるわけです。

girl AND boy

 

③:「BREAK構文」でタグを強調や分離させる

プロンプトに書かれた単語が画像生成に影響を与えますが、トークンは75個ごとに「グループ」(チャンク)として処理されます。そして、プロンプトの前半にあるトークンほど影響力が強く、後半に行くほど弱くなる傾向があります。

「BREAK」を使うと、強制的に新しいグループを作り、その直後のトークンを「次のグループの先頭(76番目や151番目)」として扱います。BREAKの後ろに書いた要素が強調されやすくなり、前の部分との混ざり合いを防ぐ効果もあります。

そのため、赤い髪を実施しているのに合わせて赤い服まで生成される色混ざりを防ぐ効果があります。

「BREAK構文」を利用して、生成する画像に反映させたい要素を強調・分離することで、思い通りの画像を生成できる可能性が高くなりますよ。

「AND」と同じく「BREAK」もすべて大文字で入力しなければ機能してくれません。

たとえば、「金髪の男の子・白いTシャツ・黒いキャップ・紺のズボン・赤いスニーカー・シルバーの腕時計」のアニメ風のイラストを生成したいとします。

「BREAK構文」なし
8k, best quality, 1boy, solo, blonde hair, mash cut, straight bangs, slight smile, hazel eyes, white t-shirt, black cap, navy pants, red sneakers, wearing a silver wristwatch, stylish city background, 

上記では、プロンプトでは後半のほうの「シルバーの腕時計」が反映されていませんでしたね。

そこでBREAK構文を使って、「wearing a silver wristwatch」を強調してみます。

「BREAK構文」あり
8k, best quality, 1boy, solo, blonde hair, mash cut, straight bangs, slight smile, hazel eyes, white t-shirt, black cap, navy pants, red sneakers, BREAK wearing a silver wristwatch, stylish city background, 

腕時計のシルバーが画像に反映されるようになっていますね。

④:改行を使ってプロンプトの見直しをしやすく

プロンプトを書き慣れてくると、どんどんタグを追加して長文化していきます。すると「どこに何を書いたっけ?」と分かりにくくなることも多いです。そんな時に便利なのが「改行」を使う書き方です。

たとえば、1行にすべてのタグを書いてしまうと、後から修正するときに探すのが大変です。プロンプトを書き慣れてくると、どんどんタグを追加して長文化していきます。すると「どこに何を書いたっけ?」と分かりにくくなることも多いです。そんな時に便利なのが「改行」を使う書き方です。

たとえば、1行にすべてのタグを書いてしまうと、後から修正するときに探すのが大変です。

(8k, best quality, masterpiece), 1girl, solo, orange hair, cat ears, idol outfit, smile, bright eyes, singing, stage lights, vibrant background

これを改行を使ってカテゴリごとに整理してみると、見やすさがぐっと上がります。

# 基本品質
(8k, best quality, masterpiece),  
# キャラクター
1girl, solo, orange hair, cat ears, idol outfit,  
# 表情・ポーズ
smile, bright eyes, singing,  
# 背景
stage lights, vibrant background

このように分けておけば、「キャラの服装を変えたい」「背景を差し替えたい」といったときに、すぐに修正できます。

実際の生成には改行は関係なく処理されるので、管理上の工夫として取り入れると便利ですよ。

 

代表的なプロンプト

AIイラストを生成するときは、まずは自身の画風を設定しましょう。基本的なテンプレを決めることで生成する時間も短縮することができます。

下記は代表的なプロンプト(タグ)です。それぞれの項目で詳細記事へのリンクを貼っておきますので、そちらも合わせてご覧ください!

品質

プロンプトを書く上でまず重要なのが「品質」を指定することです。品質に関するタグは、生成される画像の解像度や完成度をコントロールするために使われます。

代表的なものとしては

プロンプト例(呪文)説明
master piece傑作
best quality,highest quality最高品質
ultra detailed調高精細
highres高解像度
4k,8k4k,8k
extremely detailed CG超高精細CG
very aesthetic,highly aesthetic非常に美的な

などがあります。

例えば「masterpiece, best quality, ultra-detailed」と組み合わせて書くことで、より細かい描写や高品質な仕上がりをAIに指示することができます。

ただし、品質タグを入れすぎても画像が劇的に変わるわけではなく、むしろ無意味にトークン数を消費してしまう場合もあります。

基本的には「masterpiece, best quality」くらいをベースに置いて、必要に応じて「ultra-detailed」などを追加するイメージで十分です。

↓画像付きで紹介している記事は下記です。(準備中)

ネガティブプロンプト

理想の画像を作るために欠かせないのが「ネガティブプロンプト」です。これは「この要素は入れないでほしい」とAIに指示するためのプロンプトです。

たとえば、人物を生成するときにAIがよくやりがちなミスとして「手の指が変形する」「余分な腕や足が生える」などがあります。

こうした不要な生成を防ぐために、以下のようなネガティブプロンプトを加えると効果的です。

呪文(プロンプト)一覧説明
low quality低品質
worst quality最悪の画質
bad anatomy変な身体
very displeasing非常に不快な
lowres低品質,低解像度
NSFW性的描写
long body長い体
bad hands不自然な手
missing fingers欠けた指
extra digit余分な指
textテキスト
simple background単純な背景

ポジティブプロンプト(描いてほしいもの)とネガティブプロンプト(描いてほしくないもの)をセットで書くことで、より安定して思い通りの画像を作れるようになります。

これらが入ったネガティブプロンプトのセットは下記です。使ってみてください。

facial hair, tan skin, paint brush, brush, unclear iris, modern, weird iris, ugly eyes, ugly iris, asymmetrical eyes, blurry iris, weird iris, closed eyes, weird eyes, asymmetrical iris, unclear iris, recent, old, oldest, cartoon, graphic, text, painting, crayon, graphite, abstract, glitch, deformed, mutated, ugly, disfigured, long body, lowres, bad anatomy, bad hands, missing fingers, extra digit, fewer digits, cropped, very displeasing, (worst quality, bad quality:1.2), bad anatomy, sketch, jpeg artifacts, signature, watermark, username, simple background, conjoined

画風

画像生成では「どんな絵柄で描くか」を指定することで、仕上がりの方向性を決めることができます。

例えば

プロンプト(呪文)一覧説明
line art線画
oil painting油絵
sketchスケッチ
watercolor水彩
watercolor painting水彩画
ink artインク
flat color単調な塗り
pixel artドット絵
flat designフラットデザイン
realistic,photorealistic写実的
manga style漫画
anime styleアニメ風
chibi animeちびキャラ

↓画像付きで紹介している記事は下記です。(準備中)

人物

続いては人物に関するプロンプトです。

性別から年齢、髪色・髪型・服装など、キャラクターを特徴付けるには様々な要素があります。

これらを使いこなして、表現したいキャラクターを形作っていきましょう。
 

性別・年齢・人数

プロンプトの最初のほうには、描きたいキャラが「女性か男性か」「何人なのか」を表すタグを書くようにしましょう。

「1人の女の子」を描きたいなら「1girl」。「2人の男の子」なら「2boys」になります。

「1人の女の子と1人の男の子」なら「1girl, 1boy」のように2つのタグをカンマで区切って並べればOKです。また、「1girl and 1boy」でも対応できますよ。

1girl
(1人の女の子)
2girls
(2人の女の子)
1girl, 1boy
(1人の女の子と1人の男の子)

また、性別や人数だけでなく年齢層まで指定して描くこともできます。

10代男性
成人男性
40代男性

また下記は代表的なプロンプトです。

プロンプト(呪文)一覧説明
○○ yo,○○ years old○○歳
high school student高校生
college age大学生
young girl若い女性
middle age中年
boy男の子
girl女の子

 

体型

キャラクターの特徴を出すために、生成したいキャラの体型などもプロンプトで指定するのもよいでしょう。

体型(瘦せ型)

プロンプト(呪文)一覧説明
slimスリム
slenderスレンダー
medium標準的な
skinnyスキニー・瘦せている
scrawnyやせすぎ

体型(ぽっちゃり)

プロンプト(呪文)一覧説明
obese肥満な
overweight肥満な
overweight太り気味な
voluptuous豊満な体型
chubby body typeぽっちゃりした体型
plump body typeマシュマロ女子的な

 

肌色

肌色を変えることで、さらに生成できるキャラクターのバリエーションを増やすことができますよ。

プロンプト(呪文)一覧呪文
pale skin白い肌
fair skin色白
tan skin日焼け肌
tanned skin日焼けした肌
tanlines日焼けのあと
wheat skin小麦肌

↓画像付きで紹介している記事は下記です。(準備中)

目の形・目線・目の色

目の形や目線を変えることで、様々なキャラクターを表現することができます。

プロンプト(呪文)一覧呪文
one eye closedウィンク
multicolored eyes多色の虹彩
heterochromiaオッドアイ
hair over one eye片目に髪がかかる
bandage over one eye片目に包帯
upturned eyes上目遣い

↓画像付きで紹介している記事は下記です。

表情

表情を変えることで、様々なシーンのキャラクターを表現することができます。

プロンプト(呪文)一覧呪文
^o^口を開けて喜ぶ
anger vein怒りマーク
wavy mouth波打つ口
pensive物思いにふける
furrowed brow眉をひそめる
embarrassed恥ずかしい

↓画像付きで紹介している記事は下記です。

髪色・髪型

髪色

プロンプト例(呪文)説明
black hair黒髪
brown hair茶髪
red hair赤髪
orange hairオレンジ髪
yellow hair黄色
green hair
blue hair
purple hair
white hair白髪
silver hair銀髪

髪型

プロンプト例(呪文)説明
straight hairストレートヘア
parted bangsセンター分け
bangs pinned backピン留め前髪
ponytailポニーテール
twin tailsツインテール
bunお団子
half updoハーフアップ
single braid三つ編み
crown braidクラウンブレイド

↓画像付きで紹介している記事は下記です。

服装・靴・アクセサリー

プロンプト(呪文)一覧説明
school uniform制服
swim suit水着
bikiniビキニ
dressドレス
T-shirtsTシャツ
brouseブラウス
pajamasパジャマ
knee-high socks knee socks膝丈の靴下
braブラジャー
glassesメガネ

↓画像付きで紹介している記事は下記です。(準備中)

ポーズ

プロンプト(呪文)説明
standing立っている
sitting座っている
all fours 四つん這い
leaning forward前のめり(腰から曲げるイメージ)
arched back背筋を伸ばす(んーって感じ)
jumping跳ねる
lie on ~~の上で横になる

↓画像付きで紹介している記事は下記です。

背景

プロンプト(呪文)説明
white background白背景
black background黒背景
blue background青背景
blurry backgroundぼやけた背景
card backgroundカード風
snowflake background雪の結晶
repuscular rays薄明光線(雲の切れ間から漏れる光)
magic effect魔法のエフェクト

↓画像付きで紹介している記事は下記です。

構図

プロンプト例(呪文)説明
full body全身
cowboy shot太ももから頭
upper body胸から頭
portrait首から頭
face顔に焦点を当てる
from below下から
from above上から
from side横から

↓画像付きで紹介している記事は下記です。

その他

職業・キャラクター属性

プロンプト例(呪文)説明
elfエルフ
dwarfドワーフ
orcオーク
fairy妖精
wizard魔術師
warrior戦士
non修道女
knight wizard聖騎士
clergy聖職者
dragon knight竜騎士
samirai
ninja忍者

↓画像付きで紹介している記事は下記です。(準備中)

ファンタジー系の武器

プロンプト例(呪文)説明
dagger短剣
longswordロングソード
crossbowクロスボウ
spear
ax
staff
katana
falchionファルシオン
whipムチ

↓画像付きで紹介している記事は下記です。(準備中)

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次