Googleが無料の超高品質な画像編集AI「Gemini 2.5 Flash Image」をリリース、日本語で指示できて実写からアニメキャラへの変換も可能

2025年08月27日 11時06分レビュー

Googleが優れた画像編集能力を持つ「Gemini 2.5 Flash Image」をGeminiに統合しました。Gemini 2.5 Flash Imageは画像の特徴を維持しながら編集することが得意で、AIの画像編集能力を測定するテストではOpenAIの画像生成AIやFluxシリーズを大きく超えるスコアを示しています。

Google announces native image editing in Gemini app

https://blog.google/products/gemini/updated-image-editing-model/ Gemini 2.5 Flash Imageは画像とともに「編集内容を説明するテキスト」を入力することで元画像の特徴を維持したまま編集できるAIです。GoogleのスンダーピチャイCEOがGemini 2.5 Flash Imageの威力をアピールするべく自身の愛犬の写真を編集した例が以下。犬の毛色や体形を維持しつつ多様な画像を作れていることが分かります。

Our image editing model is now rolling out in @Geminiapp - and yes, it’s 🍌🍌. Top of @lmarena’s image edit leaderboard, it’s especially good at maintaining likeness across different contexts. Check out a few of my dog Jeffree in honor of International Dog Day - though don’t let… pic.twitter.com/8Y45DawZBc
— Sundar Pichai (@sundarpichai) August 26, 2025

複数の画像を合成することも可能。Googleはバスケットボールを持つ女性と犬の写真の合成例も公開しています。

合成結果はこんな感じ。女性の髪型や犬の毛並みなどがそのまま受け継がれています。

AIの正体を隠した状態で画像編集能力を競う「Image Edit Arena」では、「gpt-image-1」や「flux-1-kontext-max」を大きく超えるスコアを記録し、1位の座を獲得しました。なお、テスト時点では「nano-banana」というコードネームで呼ばれていたそうです。

Gemini 2.5 Flash Imageはすでに日本の無料ユーザーも利用可能だったので、実際に使ってみました。今回は以下の写真を編集してみます。

Geminiに画像と編集内容を入力します。今回は「この人の服装を浴衣に変更」と入力。

10秒前後で浴衣を着た女性の画像が出力されました。

編集前(左)と編集後(右)を並べるとこんな感じ。手の位置や顔の角度が少し変かしていますが、体形や顔の特徴は維持できています。編集後の画像の右下にはGeminiのロゴが付いていて、AI生成画像であることを示す人間の目には見えない電子透かし「SynthID」も埋め込まれています。

さらに、「夜間にビルの屋上で花火を見上げて笑っている写真に変えて」と入力。

指示通りに編集できました。よく見ると浴衣の柄の位置が少し変わっていますが、ぱっと見ただけでは変化に気付けないレベルです。

「人物部分を切り取ってソシャゲのSSRキャラ風の立ち絵に変更。アニメ調のゲームの美麗イラスト風で」と入力。

編集結果はこんな感じ。実写風のまま人物が切り取られてコラージュ画像っぽくなりました。

イラスト風に変更したいので「アニメ調のイラストに変更。スマホの代わりに剣をもたせて、真剣な表情で剣を構えるポーズ。キャラクター名は『GIGA子』」と指示してみました。

結果が以下。画像上部にはキャラクター名が表示されているのですが、「GIGA」の部分は正しく描画できたものの「子」の部分はおかしくなってしまいました。また、足元が実写風のままなのも残念ポイント。まだ「適当な指示でも一発で理解して完璧に編集する」という次元には到達していませんが、指示を繰り返せば望みの画像を簡単に得ることができます。

画像生成AI「Qwen-Image」登場、OpenAIやFlux超えの高品質画像を生成可能で「複数行の漢字」を自然に描写できる驚異的テキスト描画性能をアピール - GIGAZINE

Photoshopに生成AIを使った新しい画像編集機能が追加、最大8メガピクセルまで高画質化する「生成アップスケール」機能や数クリックで自然な合成を可能にする「調和」機能など - GIGAZINE

高品質な画像編集AI「FLUX.1 Kontext [dev]」が登場、元の画像を保ったまま指示通りに加工できるオープンモデル - GIGAZINE

MetaがMidjourneyとパートナーシップを締結、画像・動画生成AIモデルを開発か - GIGAZINE

Metaが視覚言語モデル「DINOv3」を発表、ラベルなし画像から自己教師学習してさまざまなタスクで高いパフォーマンスを発揮可能 - GIGAZINE