Penyesuaian Terkontrol memungkinkan Anda membuat gambar baru berdasarkan gambar sumber atau sinyal gambar sumber (tepi canny atau coretan). Halaman ini menunjukkan cara mengirim dua jenis permintaan Penyesuaian Terkontrol:
Penyesuaian Terkontrol Imagen 3 (fitur GA)
Penyesuaian Terkontrol Imagen 2 - sinyal gambar sumber tepi canny atau coretan (Fitur pratinjau)
Kasus penggunaan
Penyesuaian Terkontrol Imagen 3 menawarkan perintah gaya bebas, yang dapat memberi Anda kesan bahwa model dapat melakukan lebih dari yang dilatih untuk dilakukan. Bagian berikut menjelaskan kasus penggunaan dan contoh untuk Penyesuaian Terkontrol Imagen 3.
Model ini telah dilatih untuk kasus penggunaan yang kami berikan, dan kami mengharapkan hasil yang baik saat Anda menggunakan Penyesuaian Terkontrol Imagen 3. Jika Anda mendorong model untuk merespons dengan cara yang tidak terduga, kami tidak mengharapkan hasil yang baik.
Contoh kasus penggunaan yang dimaksudkan
Berikut adalah kasus penggunaan yang dilatih untuk dilakukan oleh Penyesuaian Kustom yang Dikontrol Imagen 3 dan menghasilkan hasil yang baik:
Buat gambar yang mengikuti perintah dan gambar kontrol tepi canny.
Buat gambar yang mengikuti perintah dan gambar coretan.
Menata gaya foto seseorang sambil mempertahankan ekspresi wajah.
Contoh kasus penggunaan yang tidak diinginkan
Berikut adalah kasus penggunaan yang tidak dilatih oleh Penyesuaian Kustom yang Dikontrol Imagen 3 dan menghasilkan hasil yang buruk:
Buat gambar menggunakan gaya yang ditentukan dalam perintah.
Membuat gambar dari teks yang mengikuti gaya tertentu yang disediakan oleh gambar referensi, dengan tingkat kontrol tertentu pada komposisi gambar menggunakan gambar kontrol.
Buat gambar dari teks yang mengikuti gaya tertentu yang disediakan oleh gambar referensi, dengan beberapa tingkat kontrol pada komposisi gambar menggunakan coretan kontrol.
Buat gambar dari teks yang mengikuti gaya tertentu yang disediakan oleh gambar referensi, dengan beberapa tingkat kontrol pada komposisi gambar menggunakan gambar kontrol. Orang dalam gambar memiliki ekspresi wajah tertentu.
Menata gaya foto dua orang atau lebih, dan mempertahankan ekspresi wajah mereka.
Menata gaya foto hewan peliharaan, dan mengubahnya menjadi gambar. Pertahankan atau tentukan komposisi gambar (misalnya, cat air).
Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Verify that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
Siapkan autentikasi untuk lingkungan Anda.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, Anda menggunakan kredensial yang Anda berikan ke gcloud CLI.
Menginstal Google Cloud CLI. Setelah penginstalan, lakukan inisialisasi Google Cloud CLI dengan menjalankan perintah berikut:
gcloud init
Jika Anda menggunakan penyedia identitas (IdP) eksternal, Anda harus login ke gcloud CLI dengan identitas gabungan Anda terlebih dahulu.
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .
Penulisan perintah penyesuaian
Perintah yang Anda gunakan dengan Penyesuaian Imagen 3 dapat memengaruhi kualitas gambar yang dihasilkan. Gunakan template perintah berikut sebagai titik awal untuk menulis perintah penyesuaian. Anda mungkin perlu mengirim beberapa permintaan untuk mendapatkan output yang ditargetkan.
Kasus penggunaan Gambar referensi Template perintah Contoh Penyesuaian terkontrol Peta coretan (1) Buat gambar yang sesuai dengan scribble map [1] agar cocok dengan deskripsi: ${STYLE_PROMPT} ${PROMPT}. Buat gambar yang sesuai dengan scribble map [1] agar cocok dengan deskripsi: Gambar harus bergaya lukisan cat minyak impresionistik dengan sapuan kuas yang santai. Karya ini memiliki suasana yang diterangi cahaya alami dan goresan kuas yang terlihat jelas. Tampilan samping mobil. Mobil diparkir di permukaan jalan yang basah dan memantulkan cahaya, dengan pantulan lampu kota di genangan air. Penyesuaian terkontrol Gambar kontrol yang cerdas (1) Buat gambar yang sesuai dengan edge map [1] agar cocok dengan deskripsi: ${STYLE_PROMPT} ${PROMPT} Buat gambar yang selaras dengan edge map [1] agar sesuai dengan deskripsi: Gambar harus bergaya lukisan cat minyak impresionis, dengan sapuan kuas yang santai. Memiliki suasana yang diterangi cahaya alami dan goresan kuas yang terlihat jelas. Tampilan samping mobil. Mobil diparkir di permukaan jalan yang basah dan memantulkan cahaya, dengan pantulan cahaya lampu kota di genangan air. Penataan gaya gambar orang dengan input FaceMesh Gambar subjek (1-3)
Gambar kontrol FaceMesh (1)Buat gambar tentang SUBJECT_DESCRIPTION [1] dalam pose CONTROL_IMAGE [2] agar sesuai dengan deskripsi: potret SUBJECT_DESCRIPTION [1] ${PROMPT} Buat gambar tentang a woman with short hair [1] dalam pose control image [2] agar sesuai dengan deskripsi: potret a woman with short hair [1] dalam gaya kartun 3D dengan latar belakang yang diblur. Karakter yang imut dan menggemaskan, dengan wajah tersenyum, menghadap kamera, nuansa warna pastel, kualitas tinggi, 4k, mahakarya, detail super, tekstur kulit, pemetaan tekstur, bayangan lembut, pencahayaan realistis yang lembut, warna-warna cerah Penataan gaya gambar orang dengan input FaceMesh Gambar subjek (1-3)
Gambar kontrol FaceMesh (1)Buat gambar ${STYLE_PROMPT} tentang SUBJECT_DESCRIPTION [1] dalam pose CONTROL_IMAGE [2] agar sesuai dengan deskripsi: potret SUBJECT_DESCRIPTION [1] ${PROMPT} Buat gambar gaya kartun 3D tentang a woman with short hair [1] dalam pose control image [2] agar sesuai dengan deskripsi: potret a woman with short hair [1] dalam gaya kartun 3D dengan latar belakang yang diburamkan. Karakter yang imut dan menawan dengan wajah tersenyum, menghadap kamera, nuansa warna pastel, kualitas tinggi, 4K, mahakarya, detail super, tekstur kulit, pemetaan tekstur, bayangan lembut, pencahayaan realistis lembut, warna cerah Mengirim permintaan Penyesuaian Terkontrol Imagen 3
Gunakan contoh berikut untuk mengirim permintaan Penyesuaian Terkontrol Imagen 3:
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Google Cloud Project ID Anda.
- LOCATION: Region project Anda. Misalnya,
us-central1
,europe-west2
, atauasia-northeast3
. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI. - TEXT_PROMPT: Perintah teks memandu gambar yang dihasilkan
model. Untuk menggunakan Penyesuaian Terkontrol Imagen 3, sertakan
referenceId
dari gambar referensi kontrol yang Anda berikan dalam format [$referenceId]. Contoh:- Buat gambar yang sesuai dengan peta coretan [1] agar cocok dengan deskripsi: [image description].
- BASE64_CONTROL_IMAGE: Gambar kontrol dasar (sketsa). Gambar
harus ditentukan sebagai string byte berenkode base64.
UntukCONTROL_TYPE_SCRIBBLE
: Gambar kontrol coretan yang diharapkan memiliki latar belakang hitam dan garis coretan putih.
UntukCONTROL_TYPE_CANNY
: Gambar kontrol tepi Canny yang diharapkan memiliki latar belakang hitam dan tepi Canny putih. - CONTROL_TYPE: Jenis sinyal kontrol. Gunakan
CONTROL_TYPE_CANNY
untuk tepi canny. GunakanCONTROL_TYPE_SCRIBBLE
untuk coretan. enableControlImageComputation
: Tetapkan kefalse
jika Anda memberikan gambar kontrol Anda sendiri. Dalam hal ini,B64_BASE_IMAGE
harus berupa gambar sinyal kontrol. Setel ketrue
jika Anda ingin Imagen menghitung gambar kontrol dari gambar referensi. Dalam hal ini,B64_BASE_IMAGE
harus berupa gambar RGB mentah.- IMAGE_COUNT: Jumlah gambar yang dihasilkan. Nilai bilangan bulat yang diterima: 1-4. Nilai default: 4.
Metode HTTP dan URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Isi JSON permintaan:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_CONTROL", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_CONTROL_IMAGE" }, "controlImageConfig": { "controlType": "CONTROL_TYPE", "enableControlImageComputation": false } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
. Respons ini menampilkan dua objek prediksi, dengan byte gambar yang dihasilkan berenkode base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Python
Coret-coret
Tepi Canny
Mengirim permintaan Penyesuaian Terkontrol Imagen 2
Gambar input Parameter lainnya Output gambar Gambar input. Sumber gambar: Alec Cutter di Unsplash. Perintah: "versi seni digital"
Perintah negatif: "hitam putih"
Jenis gambar panduan: RGB Standar
Kondisi kontrol: tepi canny
Skala Kontrol Imagen: 0,95
Gambar input. Sumber gambar: Alec Cutter di Unsplash
(deteksi tepi Canny diterapkan).Perintah: "versi seni digital"
Perintah negatif: "hitam putih"
Jenis gambar panduan: canny edge
Skala Kontrol Imagen: 0,95
Gunakan contoh berikut untuk mengirim permintaan Penyesuaian Terkontrol Imagen 2:
Konsol
-
Di Google Cloud konsol, buka halaman Vertex AI > Media Studio .
-
Di panel tugas di bagian bawah, klik
Edit gambar. -
Klik Upload untuk memilih gambar yang disimpan secara lokal yang akan diedit.
-
Di bagian Mode pada panel Parameter, klik Kontrol.
-
Opsional. Ubah Jumlah hasil, berikan Perintah negatif, atau ubah Opsi lanjutan > Wilayah.
-
Di bagian Opsi lanjutan, pilih Jenis gambar panduan: RGB standar, Canny edge, atau Scribble.
-
Di bagian Opsi lanjutan, pilih Kondisi kontrol: Canny edge atau Scribble.
-
Di kolom perintah (Tulis perintah Anda...), berikan perintah teks.
-
Klik
Generate.
REST
Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Google Cloud Project ID Anda.
- TEXT_PROMPT: Perintah teks yang memandu gambar yang dihasilkan model. Kolom ini wajib diisi untuk pembuatan dan pengeditan.
- B64_BASE_IMAGE: Gambar dasar yang akan diedit atau di-upscale. Gambar harus ditentukan sebagai string byte berenkode base64. Batas ukuran: 10 MB.
- EDIT_IMAGE_COUNT: Jumlah gambar yang diedit. Nilai default: 4.
- NEGATIVE_PROMPT: Perintah negatif untuk membantu membuat gambar. Misalnya: "hewan" (menghapus hewan), "blur" (memperjelas gambar), "teks" (menghapus teks), atau "terpangkas" (menghapus gambar yang dipangkas).
-
CONDITION:
string
. Jenis sinyal gambar kontrol yang diberikan. Nilai:cannyEdges
atauscribble
. -
CONTROL_SCALE:
float
. Kekuatan sinyal gambar kontrol. Nilai:0.0
-1.0
. Nilai default:0.95
. Rentang yang direkomendasikan:0.9
-1.0
. -
SAMPLING_STEPS:
integer
. Jumlah langkah pengambilan sampel. Nilai:1
-30
. Default:16
. -
COMPUTE_CONDITION_MAP:
boolean
. Apakah akan menghitung peta kondisi dari gambar input dasar Anda. Jika disetel kefalse
, layanan mengharapkan gambar input berupa coretan atau tepi canny, dan gambar diberikan langsung ke model. Jika disetel ketrue
, layanan mengharapkan gambar input berupa gambar RGB, dan layanan dapat menghitung tepi canny atau informasi coretan dari gambar input Anda berdasarkanconditionName
. Kemudian, layanan ini menyediakan peta kondisi yang diproses ke model untuk pengeditan gambar. Saat Anda memberikan gambar coretan, gambar tersebut harus memiliki latar belakang hitam dan garis putih menggambarkan objek yang akan dibuat. Default:false
.
Metode HTTP dan URL:
POST https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict
Isi JSON permintaan:
{ "instances": [ { "prompt": "TEXT_PROMPT", "image": { "bytesBase64Encoded": "B64_BASE_IMAGE" } } ], "parameters": { "sampleCount": EDIT_IMAGE_COUNT, "negativePrompt": "NEGATIVE_PROMPT", "controlPluginConfig": { "conditions": [ { "conditionName": "CONDITION", "controlScale": CONTROL_SCALE, "samplingSteps": SAMPLING_STEPS, "computeConditionMap": COMPUTE_CONDITION_MAP } ] } } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict"PowerShell
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://us-central1-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/us-central1/publishers/google/models/imagen-2.0-edit-preview-0627:predict" | Select-Object -Expand Content"sampleCount": 2
. Respons ini menampilkan dua objek prediksi, dengan byte gambar yang dihasilkan berenkode base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Penggunaan produk
Untuk melihat standar penggunaan dan batasan konten yang terkait dengan Imagen di Vertex AI, lihat panduan penggunaan.
Versi model
Ada beberapa model pembuatan gambar yang dapat Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat Model Imagen.
Langkah berikutnya
Baca artikel tentang Imagen dan produk AI Generatif lainnya di Vertex AI:
- Panduan developer untuk mulai menggunakan Imagen 3 di Vertex AI
- Model dan alat media generatif baru, yang dibuat dengan dan untuk kreator
- Yang baru di Gemini: Gem kustom dan peningkatan pembuatan gambar dengan Imagen 3
- Google DeepMind: Imagen 3 - Model text-to-image berkualitas tertinggi kami
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-08-25 UTC.