Halaman ini menjelaskan cara mengganti latar belakang gambar. Imagen di Vertex AI memungkinkan Anda menggunakan segmentasi objek otomatis untuk mempertahankan konten tersebut saat mengubah konten gambar lainnya. Dengan Imagen 3, Anda juga dapat memberikan area mask sendiri untuk mendapatkan kontrol yang lebih besar saat mengedit.
Melihat kartu model Imagen untuk Pengeditan dan Penyesuaian
Contoh pengeditan gambar produk
Kasus penggunaan berikut menyoroti peningkatan kualitas gambar produk dengan memodifikasi latar belakang gambar, tetapi tetap mempertahankan tampilan produk dalam gambar.

Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
Siapkan autentikasi untuk lingkungan Anda.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
Python
Untuk menggunakan contoh Python di halaman ini dalam lingkungan pengembangan lokal, instal dan lakukan inisialisasi gcloud CLI, lalu siapkan Kredensial Default Aplikasi dengan kredensial pengguna Anda.
-
Install the Google Cloud CLI.
-
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
-
To initialize the gcloud CLI, run the following command:
gcloud init
-
If you're using a local shell, then create local authentication credentials for your user account:
gcloud auth application-default login
You don't need to do this if you're using Cloud Shell.
If an authentication error is returned, and you are using an external identity provider (IdP), confirm that you have signed in to the gcloud CLI with your federated identity.
Untuk mengetahui informasi selengkapnya, lihat Menyiapkan ADC untuk lingkungan pengembangan lokal dalam dokumentasi autentikasi Google Cloud .
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .
Mengedit dengan mask latar belakang yang terdeteksi secara otomatis
Dengan Imagen, Anda dapat mengedit gambar produk dengan deteksi latar belakang otomatis. Hal ini dapat berguna jika Anda perlu mengubah latar belakang gambar produk, tetapi tetap mempertahankan tampilan produk. Pengeditan gambar produk menggunakan penawaran Google Product Studio (GPS). Anda dapat menggunakan fitur GPS ini sebagai bagian dari Imagen menggunakan konsol atau API.
Gambar yang dihasilkan dengan fitur pengeditan gambar produk Imagen dari perintah: di atas meja di toko butik. Sumber gambar asli: Irene Kredenets di Unsplash. Gunakan petunjuk berikut untuk mengaktifkan dan menggunakan pengeditan gambar produk dengan deteksi latar belakang otomatis.
Imagen 3
Gunakan contoh berikut untuk mengirim permintaan pengeditan gambar produk menggunakan model Imagen 3.
Konsol
-
Di Google Cloud konsol, buka halaman Vertex AI > Media Studio .
- Klik Upload. Di dialog file yang ditampilkan, pilih file yang akan diupload.
- Klik Perbaiki.
- Di panel Parameter, klik Latar Belakang Produk.
- Di toolbar pengeditan, klik background_replaceEkstrak.
-
Pilih salah satu opsi ekstraksi mask:
- Elemen latar belakang: mendeteksi elemen latar belakang dan membuat masker di sekitarnya.
- Elemen latar depan: mendeteksi objek latar depan dan membuat mask di sekitarnya.
- background_replaceOrang: mendeteksi orang dan membuat mask di sekelilingnya.
-
Opsional: Di panel samping Parameters, sesuaikan opsi
berikut:
- Model: model Imagen yang akan digunakan
- Jumlah hasil: jumlah hasil yang akan dibuat
- Perintah negatif: item yang harus dihindari pembuatannya
- Pada kolom perintah, masukkan perintah untuk mengubah gambar.
- Klik sendGenerate.
Python
Instal
pip install --upgrade google-genai
Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.
Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
REST
Untuk mengetahui informasi selengkapnya, lihat referensi API Edit gambar.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Google Cloud Project ID Anda.
- LOCATION: Region project Anda. Misalnya,
us-central1
,europe-west2
, atauasia-northeast3
. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI. - TEXT_PROMPT: Perintah teks yang memandu gambar yang dihasilkan model. Kolom ini wajib diisi untuk pembuatan dan pengeditan.
referenceType
:ReferenceImage
adalah gambar yang memberikan konteks tambahan untuk pengeditan gambar. Gambar referensi mentah RGB normal (REFERENCE_TYPE_RAW
) diperlukan untuk kasus penggunaan pengeditan. Maksimal satu gambar referensi mentah dapat ada dalam satu permintaan. Gambar output memiliki tinggi dan lebar yang sama dengan gambar referensi mentah. Gambar referensi mask (REFERENCE_TYPE_MASK
) diperlukan untuk kasus penggunaan pengeditan dengan mask.referenceId
: ID bilangan bulat dari gambar referensi. Dalam contoh ini, dua objek gambar referensi memiliki jenis yang berbeda, sehingga memiliki nilaireferenceId
yang berbeda (1
dan2
).- B64_BASE_IMAGE: Gambar dasar yang akan diedit atau di-upscale. Gambar harus ditentukan sebagai string byte berenkode base64. Batas ukuran: 10 MB.
maskImageConfig.maskMode
: Mode mask untuk pengeditan mask.MASK_MODE_BACKGROUND
digunakan untuk secara otomatis menutupi latar belakang tanpa mask yang disediakan pengguna.- MASK_DILATION - float. Persentase lebar gambar untuk memperlebar masker ini. Nilai
0.00
direkomendasikan untuk menghindari perluasan produk latar depan. Minimum: 0, maksimum: 1. Default: 0,03. - EDIT_STEPS - bilangan bulat. Jumlah langkah pengambilan sampel untuk model dasar. Untuk
pengeditan gambar produk, mulai dari langkah
75
. - EDIT_IMAGE_COUNT - Jumlah gambar yang diedit. Nilai bilangan bulat yang diterima: 1-4. Nilai default: 4.
Metode HTTP dan URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Isi JSON permintaan:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "B64_BASE_IMAGE" } }, { "referenceType": "REFERENCE_TYPE_MASK", "referenceId": 2, "maskImageConfig": { "maskMode": "MASK_MODE_BACKGROUND", "dilation": MASK_DILATION } } ] } ], "parameters": { "editConfig": { "baseSteps": EDIT_STEPS }, "editMode": "EDIT_MODE_BGSWAP", "sampleCount": EDIT_IMAGE_COUNT } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" } ] }
Imagen 2
Gunakan contoh berikut untuk mengirim permintaan pengeditan gambar produk menggunakan model Imagen 2 atau Imagen.
Konsol
Di Google Cloud konsol, buka halaman Vertex AI > Media Studio .
-
Di panel tugas di bagian bawah, klik
Edit gambar. -
Klik Upload untuk memilih gambar produk yang disimpan secara lokal yang akan diedit.
-
Di panel Parameter, pilih
Aktifkan pengeditan gambar gaya produk. -
Di kolom Prompt (Tulis perintah di sini), masukkan perintah Anda.
Klik Generate.
Python
Untuk mempelajari cara menginstal atau mengupdate Vertex AI SDK untuk Python, lihat Menginstal Vertex AI SDK untuk Python. Untuk mengetahui informasi selengkapnya, lihat Dokumentasi referensi API Python.
REST
Untuk mengetahui informasi selengkapnya tentang permintaan model
imagegeneration
, lihat referensi API modelimagegeneration
.Untuk mengaktifkan pengeditan gambar produk menggunakan model 006 versi Imagen 2 (
imagegeneration@006
), sertakan kolom berikut di objek"editConfig": {}
:"editMode": "product-image"
. Permintaan ini selalu menampilkan 4 gambar.Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Google Cloud Project ID Anda.
- LOCATION: Region project Anda. Misalnya,
us-central1
,europe-west2
, atauasia-northeast3
. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI. - TEXT_PROMPT: Perintah teks yang memandu gambar yang dihasilkan model. Kolom ini wajib diisi untuk pembuatan dan pengeditan.
- B64_BASE_IMAGE: Gambar dasar yang akan diedit atau di-upscale. Gambar harus ditentukan sebagai string byte berenkode base64. Batas ukuran: 10 MB.
- PRODUCT_POSITION: Opsional. Setelan untuk mempertahankan posisi asli
produk atau objek yang terdeteksi, atau mengizinkan model untuk memosisikannya ulang. Nilai yang tersedia:
reposition
(nilai default), yang memungkinkan penyesuaian posisi, ataufixed
, yang mempertahankan posisi produk. Untuk gambar input non-persegi, perilaku posisi produk selalu "reposisi", meskipun "tetap" disetel.
Metode HTTP dan URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict
Isi JSON permintaan:
{ "instances": [ { "prompt": "TEXT_PROMPT", "image": { "bytesBase64Encoded": "B64_BASE_IMAGE" }, } ], "parameters": { "editConfig": { "editMode": "product-image", "productPosition": "PRODUCT_POSITION", } } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict"PowerShell
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagegeneration@006:predict" | Select-Object -Expand Content{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" } ] }
Mengedit dengan area mask yang ditentukan
Anda dapat memilih untuk menutupi area yang diganti, daripada membiarkan Imagen mendeteksi mask secara otomatis.
Konsol
-
Di Google Cloud konsol, buka halaman Vertex AI > Media Studio .
- Klik Upload. Di dialog file yang ditampilkan, pilih file yang akan diupload.
- Klik Perbaiki.
- Di panel Parameter, klik Latar Belakang Produk.
-
Lakukan salah satu hal berikut:
- Mengupload topeng Anda sendiri:
- Buat masker di komputer Anda.
- Klik Upload mask. Pada dialog yang ditampilkan, pilih mask yang akan diupload.
- Tentukan mask Anda sendiri: di toolbar pengeditan, gunakan alat mask (masked_transitions) untuk menentukan area yang akan ditambahi konten. kotak, kuas, atau alat inversi
- Mengupload topeng Anda sendiri:
-
Opsional: Di panel Parameters, sesuaikan opsi berikut:
- Model: model Imagen yang akan digunakan
- Jumlah hasil: jumlah hasil yang akan dibuat
- Perintah negatif: item yang harus dihindari pembuatannya
- Pada kolom perintah, masukkan perintah untuk mengubah gambar.
- Klik Generate.
Python
Instal
pip install --upgrade google-genai
Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.
Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=us-central1 export GOOGLE_GENAI_USE_VERTEXAI=True
REST
Untuk mengetahui informasi selengkapnya, lihat referensi API Edit gambar.
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Google Cloud Project ID Anda.
- LOCATION: Region project Anda. Misalnya,
us-central1
,europe-west2
, atauasia-northeast3
. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI. - TEXT_PROMPT: Perintah teks yang memandu gambar yang dihasilkan model. Kolom ini wajib diisi untuk pembuatan dan pengeditan.
referenceId
: ID bilangan bulat dari gambar referensi. Dalam contoh ini, dua objek gambar referensi memiliki jenis yang berbeda, sehingga memiliki nilaireferenceId
yang berbeda (1
dan2
).- B64_BASE_IMAGE: Gambar dasar yang akan diedit atau di-upscale. Gambar harus ditentukan sebagai string byte berenkode base64. Batas ukuran: 10 MB.
- B64_MASK_IMAGE: Gambar hitam putih yang ingin Anda gunakan sebagai lapisan mask untuk mengedit gambar asli. Gambar harus ditentukan sebagai string byte berenkode base64. Batas ukuran: 10 MB.
- MASK_DILATION - float. Persentase lebar gambar untuk memperlebar masker ini. Nilai
0.00
direkomendasikan untuk menghindari perluasan produk latar depan. Minimum: 0, maksimum: 1. Default: 0,03. - EDIT_STEPS - bilangan bulat. Jumlah langkah pengambilan sampel untuk model dasar. Untuk
pengeditan gambar produk, mulai dari langkah
75
. - EDIT_IMAGE_COUNT - Jumlah gambar yang diedit. Nilai bilangan bulat yang diterima: 1-4. Nilai default: 4.
Metode HTTP dan URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Isi JSON permintaan:
{ "instances": [ { "prompt": "TEXT_PROMPT": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "B64_BASE_IMAGE" } }, { "referenceType": "REFERENCE_TYPE_MASK", "referenceId": 2, "referenceImage": { "bytesBase64Encoded": "B64_MASK_IMAGE" }, "maskImageConfig": { "maskMode": "MASK_MODE_USER_PROVIDED", "dilation": MASK_DILATION } } ] } ], "parameters": { "editConfig": { "baseSteps": EDIT_STEPS }, "editMode": "EDIT_MODE_BGSWAP", "sampleCount": EDIT_IMAGE_COUNT } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" } ] }
Batasan
Karena terkadang mask tidak lengkap, model mungkin mencoba melengkapi objek latar depan jika ada bagian yang sangat kecil yang hilang di batas. Sebagai efek samping yang jarang terjadi, saat objek latar depan sudah selesai, model dapat membuat sedikit ekstensi.
Solusinya adalah menyegmentasikan output model, lalu menggabungkannya. Berikut adalah contoh cuplikan python yang menunjukkan solusi:
blended = Image.composite(out_images[0].resize(image_expanded.size), image_expanded, mask_expanded)
Langkah berikutnya
Baca artikel tentang Imagen dan produk AI Generatif lainnya di Vertex AI:
- Panduan developer untuk mulai menggunakan Imagen 3 di Vertex AI
- Model dan alat media generatif baru, yang dibuat dengan dan untuk kreator
- Baru di Gemini: Gem kustom dan peningkatan pembuatan gambar dengan Imagen 3
- Google DeepMind: Imagen 3 - Model text-to-image berkualitas tertinggi kami
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-07-16 UTC.
-