このページでは、テキスト プロンプトのみを使用したマスクなしの編集について説明します。マスクなしの編集では、マスクを使用せずに画像を編集できます。この編集方法は、画像全体に関連する編集や、編集対象がユースケースにおいてそれほど重要でない場合に適しています。
マスクなし(画像全体)の編集の例
テキスト プロンプトを使用するだけで、(生成またはアップロードされた)ベース画像を編集できます。変更する領域を指定する必要はなく、更新は画像全体に適用されます(マスクなしの編集とも呼ばれます)。
マスクなしで編集するには、変更箇所を指示するのではなく、描写したい内容を説明するプロンプトを使用します。たとえば、既存の猫画像を犬に変更したいとします。「この猫を一匹の犬に変える」よりも「一匹の犬」というマスクなしの編集プロンプトの方が効果が高い可能性があります。同様に、「浜辺にいる一匹の猫」というプロンプトで生成した画像について考えてみましょう。この画像を変更するには、編集プロンプト「浜辺にいる一匹の犬」を使用します。

編集後の画像(右): Vertex AI の Imagen を使用して、元のベース画像とプロンプト「一匹の犬」から生成された画像
編集とカスタマイズ用 Imagen のモデルカードを表示する
始める前に
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
環境の認証を設定します。
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
Python
ローカル開発環境でこのページの Python サンプルを使用するには、gcloud CLI をインストールして初期化し、ユーザー認証情報を使用してアプリケーションのデフォルト認証情報を設定します。
Google Cloud CLI をインストールします。
外部 ID プロバイダ(IdP)を使用している場合は、まず連携 ID を使用して gcloud CLI にログインする必要があります。
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
詳細については、 Google Cloud 認証ドキュメントのローカル開発環境の ADC の設定をご覧ください。
REST
このページの REST API サンプルをローカル開発環境で使用するには、gcloud CLI に指定した認証情報を使用します。
Google Cloud CLI をインストールします。
外部 ID プロバイダ(IdP)を使用している場合は、まず連携 ID を使用して gcloud CLI にログインする必要があります。
詳細については、 Google Cloud 認証ドキュメントの REST を使用して認証するをご覧ください。
マスクなしの編集を使用する
マスク領域なしで画像全体を編集するには、次のサンプルを使用します。
コンソール
-
Google Cloud コンソールで、[Vertex AI] > [Media Studio] ページに移動します。
[Media Studio] に移動 - 下部のタスクパネルで [画像を編集] をクリックします。
[
画像を編集] 画面に移動します。生成された画像を編集する
- テキスト プロンプトを使用して画像を生成します。
- 生成された画像をクリックします。
- [画像を編集] をクリックします。
アップロードした画像を編集する
- [画像のアップロード] をクリックします。
- 編集するローカル ファイルを選択します。
画像を変更する新しいプロンプトを入力します。
- 省略可。任意のパラメータを変更します。
[生成] をクリックします。
Vertex AI の Imagen でプロンプト「抹茶ケーキ」を使用して編集した画像の [画像を編集] 画面。右側最上部に表示されているのが元の画像。元の画像のクレジット: David Holifield 氏、Unsplash より( Google Cloud コンソールに表示)
Python
Vertex AI SDK for Python のインストールまたは更新の方法については、Vertex AI SDK for Python をインストールするをご覧ください。 詳細については、Python API リファレンス ドキュメントをご覧ください。
このサンプルでは、
load_from_file
メソッドを使用して、変更対象となるベースImage
としてローカル ファイルを参照します。ベース画像を指定したら、ImageGenerationModel
でedit_image
メソッドを使用して、編集した画像をローカルに保存します。保存が終ると、ノートブックでshow()
メソッドを使用して、編集された画像を表示できるようになります。REST
リクエストのデータを使用する前に、次のように置き換えます。
- PROJECT_ID: 実際の Google Cloud プロジェクト ID。
- LOCATION: プロジェクトのリージョン。たとえば、
us-central1
、europe-west2
、asia-northeast3
です。使用可能なリージョンの一覧については、Vertex AI の生成 AI のロケーションをご覧ください。 - TEXT_PROMPT: 生成する画像をモデルに指示するテキスト プロンプト。生成と編集のどちらでも必須フィールドです。
- B64_BASE_IMAGE: 編集またはアップスケールするベース画像。画像は base64 でエンコードされたバイト文字列として指定する必要があります。サイズの上限: 10 MB。
- EDIT_IMAGE_COUNT: 編集された画像の数。デフォルト値: 4。
HTTP メソッドと URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict
リクエストの本文(JSON):
{ "instances": [ { "prompt": "TEXT_PROMPT", "image": { "bytesBase64Encoded": "B64_BASE_IMAGE" } } ], "parameters": { "sampleCount": EDIT_IMAGE_COUNT } }
リクエストを送信するには、次のいずれかのオプションを選択します。
curl
リクエスト本文を
request.json
という名前のファイルに保存して、次のコマンドを実行します。curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict"PowerShell
リクエスト本文を
request.json
という名前のファイルに保存して、次のコマンドを実行します。$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@002:predict" | Select-Object -Expand Content"sampleCount": 2
を含むリクエストに対するものです。レスポンスは、生成された画像のバイトを base64 でエンコードした 2 つの予測オブジェクトを返します。{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
次のステップ
Imagen や Vertex AI のその他の生成 AI プロダクトに関する次の記事を読む。
- Vertex AI で Imagen 3 を使い始めるためのデベロッパー ガイド
- クリエイターとともにクリエイターのために構築された、新しい生成メディアのモデルとツール
- Gemini の新機能: カスタム Gem と Imagen 3 による画像生成の改善
- Google DeepMind: Imagen 3 - 最も高い品質水準の Text-to-Image モデル
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-08-28 UTC。
-