【実例画像あり】Nano Bananaの使い方まとめ|Gemini 2.5 Flash Image

どうも、浮月つばさです。

2025年8月26日、Googleが新しいAIモデルであるGemini 2.5 Flash Image(旧  Nano Banana)をリリースしました。

実際に私もその性能を使ってみて、便利だなーと思った使用例などを紹介していきたいと思います。

 

本記事を書いているのは
浮月つばさ
  • AIクリエイター
    音楽生成AIや画像生成AIを使ってYouTubeを運営中
  • 生成AI歴3年目
    2022年11月ChatGPT-3.5リリース時から利用
  • ブログ運用歴5年
    現在3つのブログと最近noteを運用中
    ※記事内の不明な点・質問などは、XのDMやお問い合わせにて気軽に聞いてくださいね!

現在、生成AIやブログに関してnoteの方でも発信しています!ぜひご覧ください。

目次

Nano Bananaの特徴

Gemini 2.5 Flash Imageとは「Nano Banana」と呼ばれる、Googleが開発した最新のAIモデルです。

実はこの「Nano Banana」という名は、公式発表前の2025年8月中旬にAIモデル評価プラットフォーム「LMArena」で正体不明ながら非常に高性能なモデルとして突如現れ、AI界隈の中で大きな話題となっていました。

このモデルは、自然言語を使った高度な画像編集・生成機能に特化していて、単にテキストから画像を生成するだけでなく、既存の画像に対して、まるで人間と対話しているように細かな修正を加えることができたり、一貫したキャラクターを複数の画像で登場させることも可能です。

この革新的な技術は、一般ユーザー向けにはGeminiアプリに搭載され、開発者向けにはGoogle AI Studio、Gemini API、Vertex AIを通じてプレビュー版として提供が開始されています。

Nano Bananaでできること

①:キャラクターの一貫性維持

キャラクター制作において画像生成AIが抱えていた最大の課題の一つが「同じキャラクターを別のシーンで描かせると、顔・髪型・服装などが変わってしまう」という点でした。

Nano Bananaは、この「一貫性」の問題を解決。生成したキャラクターの外見的特徴を記憶・維持しつつする生成する能力が従来モデルから大幅に向上しました。

この機能は、漫画やMVの制作など、一貫したストーリーテリングが求められる場面で絶大な効果を発揮しそうです。

②:言語(プロンプト)による精密な画像編集

Nano Bananaの最も凄い点が、従来のような生成AIの編集ソフトの知識を一切必要とせず、まるで日常会話のような自然な言葉(プロンプト)で画像を編集できる機能です。

例えば、画像内にある人物の「髪の色を変えて」と指示したり、人物と帽子の別々の写真を読み込ませて「人物に帽子をかぶらせて」と複数画像を融合させることも、たった簡単な指示文ですることができます。

③:ネイティブな世界知識の活用

Nano Bananaは、単に言葉の指示を画像に変換するだけではありません。Googleの大規模言語モデル「Gemini」の世界知識と論理推論力を活かし、画像生成に意味的な整合性を持たせることができます。

その能力がわかるのが「影」の自動描写です。「この人物に影を追加して」と指示するだけで、Nano Bananaは光源の位置を自動で判断し、影の向きや濃さ、形を極めて自然に描き出してくれます。
この能力については、他の画像生成と比べて群を抜いてレベルが高いと感じています。

④:複数画像の融合・合成

Nano Bananaは、単一の画像を編集するだけでなく、異なるビジュアル要素を自然に融合させる高度な能力も備えています。ある画像のスタイルを別の画像に適用する「スタイル転写」や、全く新しい要素を違和感なく溶け込ませる「オブジェクト追加」などがその代表例です。

画像編集の例:20選

実際に私がChatGPT・Midjourney・SeaArtで生成した画像をもとに、Nano Bananaで画像編集した例を紹介したいと思います。

①:描き換え

👇元画像👇

画像

持っているものを「りんご飴」に変換して

画像

棒が指を貫通していますが、この程度ならば加筆修正可能だと思います。

 

👇元画像👇

画像

男性のピアスを左右同じ長いピアスに揃えて

画像

生成されたピアスのほうが若干ぼやけてますが、無かった部分を一から加筆するより、かなり労力は楽だと思います。

②:ポーズの変更

👇元画像👇

画像

男性が腕を組んでいる画像にして

画像

肌の色や影、浴衣の皺なども自然に生成できていますね。

③:表情の変更

👇元画像👇

画像

口を開いて笑顔にして

画像

口の形や口内の色など、かなり自然だと思います。

④:服装の変更

👇元画像👇

画像

半袖のシャツに変えて

画像

半袖になって見えている腕も違和感なく生成されています。

⑤:背景の変更

👇元画像👇

画像

背景をコンサート会場に変えて

画像

画角が元画像より引きになってますが、スカートの裾の部分や脚の黒のストッキングの部分など自然に生成できています。

⑥:時間の経過

👇元画像👇

画像

15分後のシーンを描いて

画像

⑦:マルチターンの編集

👇元画像👇

画像

建物内の畳で正座している姿を描いて

画像

キャラクターの特徴や画風を壊さずに、しっかりと正座しています。畳の再現性や、柱や障子による影もとても自然ですね。

⑧:3Dフィギュアの生成

👇元画像👇

画像

このキャラクターの3Dフィギュアを生成して。背景は白にして

画像

靴を履いていなかったので、下記のように追記して生成しました。

アイドルっぽいヒールの靴を履かせて

画像

新たに生成されたヒールによる影もしっかり生成されています。

⑨:漫画の生成

👇元画像👇

画像

女の子が漫画で敵と戦っているシーンをコマ割りを工夫して使って生成して

画像

たった一つの指示文でここまで生成することができました。敵キャラの元画像や細かい指示があれば、もっと良い漫画が作れそうです。
 

⑩:線画化

👇元画像👇

画像

線画化して

画像

線の細い部分や太い部分、影を黒主してあるなど、かなり再現度が高いですね。

⑪:色塗り

👇元画像👇

画像

油絵風に色塗りして

画像

背景や刀の質感が油絵とあっていますね!画風とマッチすればこういった使い方もできそうです。
 

⑫:画風の変更

👇元画像👇

画像

splatter watercolor(スプラッター水彩画)風の画像にして

画像

元画像をアレンジするのも面白いなぁと感じました。この画像結構お気に入りです。

⑬:複数画像の合成

👇元画像👇

画像
画像

女の子のリュックを赤いリュックに変えて

画像

少し違和感はありますが、まったく別の画像から指示文だけで合成できるので、これは凄い性能だと感じています。
 

⑭:ポーズの指定(複数画像の融合・合成を利用)

ポーズは指示文で指定するのもいいですが、複数画像の融合・合成できる特徴を利用して、下記のように指示してみました。

👇元画像👇

画像
画像

女の子を棒人間のような敬礼しているポーズにして

画像

なぜかポーズが左右反転になってしまったり、画像サイズが変わってしまいましたが、指の本数やポーズはとても自然です。

ちなみに棒人間はPCにあるペイントアプリでササっと描いたものです。これが画像に反映されるなんて本当にすごい!
 

⑮:構図の変更

👇元画像👇

画像

ドローンで上空から撮ったような画角に変更して

画像

背景に見えていた3つの雪山や家屋に積もった雪の具合など、とても再現されていると思います。これはアニメ映像やMVなどで活用できそうですね。
 

⑯:アイソメトリックモデルの生成

アイソメトリックモデル(Isometric Model)は、等角投影法を使って物体を立体的に表現するモデル化手法です。

👇元画像👇

画像

この建物をアイソメトリックモデルにして

画像

元画像もなかなか立体感がありましたが、一層見えるようになりましたね。アニメ映像などの作品作りに映えそうです。 

⑰:サムネイルの生成(日本語は課題あり)

👇元画像👇

画像

バナナのキャラクターを左によせて
右側に「Nano Banana (改行) 使い方まとめ」
というサムネイルを作って
字体はキャラクターに合わせてポップにして

画像

キャラクターの移動と改行を読み取ってくれたのは凄い!しかし日本語の認識まだまだですね。
 

⑱:文字の生成(日本語は課題あり)

👇元画像👇

画像

文字を「NANO BANANA」にしてください

画像

元々の文字のような影は消えていますが、字体はほぼ同じで見事に英文字を変えることができました!

 

👇元画像👇

画像

吹き出しの中の文字を「おはよう」に変えて

画像

やはり日本語は苦手なようですね…。日本語の文字生成は今後生成AIの改善点かなと思います。

⑲:LINEスタンプの生成(日本語は課題あり)

👇元画像👇

画像

LINEスタンプ集を生成して

画像

デザインはいいと思いますが、日本語は半分以上思い通りの生成とは違いました。キャラクターデザインのみを活用して、文字は自分で生成するのがいいと思います。
 

まとめ

Nano Banana(Gemini 2.5 Flash Image)は、これまでの画像生成AIの常識を大きく超える性能を備えていました。

一貫したキャラクター生成、自然言語だけでの直感的な編集、影や光源まで含めた高度な描写、さらには複数画像の合成まで、クリエイターが求めていた「痒いところに手が届く機能」が次々に搭載されています。

もちろん、日本語文字生成などまだ課題は残されていますが、それでもここまで幅広い応用ができるAIは他にありません。

今後さらにアップデートされていくことで、クリエイターにとって欠かせない相棒になるのは間違いないでしょう。
AIを使った表現の可能性がますます広がっていく未来に、ワクワクが止まりません!!
 

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次