Penyesuaian gaya Imagen 3 membantu Anda membuat gambar baru dari perintah teks dan gambar referensi yang Anda berikan. Gambar referensi memandu pembuatan gambar baru.
Kasus penggunaan
Penyesuaian Imagen 3 menawarkan perintah gaya bebas, yang dapat memberikan kesan bahwa Imagen 3 dapat melakukan lebih dari yang dilatih untuk dilakukan. Bagian berikut menjelaskan kasus penggunaan yang dimaksudkan untuk Penyesuaian Imagen 3, dan contoh kasus penggunaan yang tidak dimaksudkan yang tidak lengkap.
Sebaiknya gunakan Penyesuaian Imagen 3 untuk kasus penggunaan yang dimaksud, karena kami telah melatih model pada kasus penggunaan tersebut dan mengharapkan hasil yang baik. Sebaliknya, meskipun Anda dapat mendorong model untuk melakukan hal-hal di luar kasus penggunaan yang dimaksudkan, kami tidak mengharapkan hasil yang baik.
Kasus penggunaan yang dimaksudkan
Berikut adalah kasus penggunaan yang ditujukan untuk penyesuaian gaya Penyesuaian Imagen 3:
- Membuat gambar dari input teks yang mengikuti gaya spesifik yang diberikan oleh gambar referensi.
- Mengubah foto seseorang.
- Mengubah foto seseorang dan mempertahankan ekspresi wajahnya.
Contoh kasus penggunaan yang tidak diinginkan
Berikut adalah daftar tidak lengkap kasus penggunaan yang tidak dilatih untuk dilakukan oleh Penyesuaian Imagen 3, dan menghasilkan hasil yang buruk untuk:
Membuat gambar dari teks dan menggunakan gambar referensi, dengan maksud untuk memiliki tingkat kontrol tertentu atas komposisi yang dihasilkan dari gambar referensi.
Buat gambar seseorang dari gambar referensi yang memiliki seseorang dengan ekspresi wajah tertentu.
Tempatkan dua orang dalam adegan yang berbeda, pertahankan identitas mereka, dan sambil menentukan gaya gambar output (seperti lukisan cat minyak) menggunakan gambar referensi.
Menata gaya foto hewan peliharaan dan mengubahnya menjadi gambar, sambil mempertahankan atau menentukan komposisi gambar.
Tempatkan produk, seperti kue atau sofa, ke dalam adegan yang berbeda dengan sudut produk yang berbeda, dan mengikuti gaya gambar tertentu (seperti fotorealistik dengan warna, gaya pencahayaan, atau animasi tertentu).
Contoh penyesuaian gaya
Berikut adalah contoh kasus untuk penyesuaian gaya Penyesuaian Imagen 3:
Contoh Input | Contoh Output |
---|---|
|
![]() |
1 Gambar input referensi yang dibuat menggunakan pembuatan gambar Imagen 3 dari perintah: mosaik sederhana.
Melihat kartu model Imagen untuk Pengeditan dan Penyesuaian
Sebelum memulai
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
Siapkan autentikasi untuk lingkungan Anda.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .
Penyesuaian gaya
Anda dapat memberikan gambar referensi jenis gaya saat menggunakan Penyesuaian Imagen 3. Gaya yang Anda pilih memengaruhi cara Anda membuat permintaan pembuatan.
Perintah yang Anda gunakan dengan Penyesuaian Imagen 3 dapat memengaruhi kualitas gambar yang dihasilkan. Bagian berikut menjelaskan template dan contoh perintah yang direkomendasikan untuk mengirim permintaan penyesuaian.
Kasus penggunaan Gambar referensi Template perintah Contoh Gaya objek Gambar subjek (1-4) Buat gambar di STYLE_DESCRIPTION [1] berdasarkan teks berikut: IMAGE_DESCRIPTION. Buat gambar di neon sign style [1] berdasarkan teks berikut: a sign saying have a great day. Penyesuaian gaya gambar orang tanpa input mesh wajah Gambar subjek (1-4) Buat gambar tentang SUBJECT_DESCRIPTION [1] agar sesuai dengan deskripsi: potret SUBJECT_DESCRIPTION [1] ${PROMPT} Buat gambar tentang a woman with short hair[1] agar sesuai dengan deskripsi: potret a woman with short hair[1] dalam gaya kartun 3D dengan latar belakang blur. Karakter yang imut dan cantik, wajah tersenyum, melihat ke kamera, nuansa warna pastel, kualitas tinggi, 4K, karya agung, detail super, tekstur kulit, pemetaan tekstur, bayangan lembut, pencahayaan realistis lembut, warna cerah Penataan gaya gambar orang dengan input mesh wajah Gambar subjek (1-3)
Gambar kontrol Facemesh (1)Buat gambar tentang SUBJECT_DESCRIPTION [1] dalam pose CONTROL_IMAGE [2] agar sesuai dengan deskripsi: potret SUBJECT_DESCRIPTION [1] ${PROMPT} Buat gambar tentang a woman with short hair [1] dalam pose control image [2] agar sesuai dengan deskripsi: potret a woman with short hair [1] dalam gaya kartun 3D dengan latar belakang blur. Karakter yang imut dan menggemaskan, wajah tersenyum. Lihat kamera, nuansa warna pastel, kualitas tinggi, 4K, mahakarya, detail super, tekstur kulit, pemetaan tekstur, bayangan lembut, pencahayaan realistis lembut, warna cerah REST
Untuk mengetahui informasi selengkapnya tentang permintaan model
imagen-3.0-capability-001
, lihat referensi API modelimagen-3.0-capability-001
.Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:
- PROJECT_ID: Google Cloud Project ID Anda.
- LOCATION: Region project Anda. Misalnya,
us-central1
,europe-west2
, atauasia-northeast3
. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI. - TEXT_PROMPT: Perintah teks memandu gambar yang dihasilkan
model. Untuk menggunakan Penyesuaian Imagen 3, sertakan
referenceId
dari gambar atau gambar referensi yang Anda berikan dalam format [$referenceId]. Contoh:- Perintah teks berikut adalah untuk permintaan yang memiliki satu gambar referensi dengan
"referenceId": 1
dan deskripsi opsional"styleDescription": "glowing style"
: Buat gambar di glowing style [1] berdasarkan teks berikut: Sebuah gereja di pegunungan.
- Perintah teks berikut adalah untuk permintaan yang memiliki satu gambar referensi dengan
"referenceId"
: ID gambar referensi, atau ID untuk serangkaian gambar referensi yang sesuai dengan subjek atau gaya yang sama. Dalam contoh ini, satu gambar referensi memilikireferenceId
(1
).- BASE64_REFERENCE_IMAGE: Gambar referensi untuk memandu pembuatan gambar. Gambar harus ditentukan sebagai string byte berenkode base64.
- STYLE_DESCRIPTION: Opsional. Deskripsi teks gambar referensi yang kemudian dapat Anda gunakan di kolom
prompt
. Contoh:"prompt": "Generate an image in glowing style [1] based on the following caption: A church in the mountain.", [...], "styleImageConfig": { "styleDescription": "glowing style" }
- IMAGE_COUNT: Jumlah gambar yang dihasilkan. Nilai bilangan bulat yang diterima: 1-4. Nilai default: 4.
Metode HTTP dan URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
Isi JSON permintaan:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_STYLE", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "styleImageConfig": { "styleDescription": "STYLE_DESCRIPTION" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:
curl
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
Simpan isi permintaan dalam file bernama
request.json
, dan jalankan perintah berikut:$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
. Respons ini menampilkan dua objek prediksi, dengan byte gambar yang dihasilkan berenkode base64.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Python
Penggunaan produk
Untuk melihat standar penggunaan dan batasan konten yang terkait dengan Imagen di Vertex AI, lihat panduan penggunaan.
Versi model
Ada beberapa model pembuatan gambar yang dapat Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat Model Imagen.
Langkah berikutnya
Baca artikel tentang Imagen dan produk AI Generatif lainnya di Vertex AI:
- Panduan developer untuk mulai menggunakan Imagen 3 di Vertex AI
- Model dan alat media generatif baru, yang dibuat dengan dan untuk kreator
- Baru di Gemini: Gem kustom dan peningkatan pembuatan gambar dengan Imagen 3
- Google DeepMind: Imagen 3 - Model text-to-image berkualitas tertinggi kami
Kecuali dinyatakan lain, konten di halaman ini dilisensikan berdasarkan Lisensi Creative Commons Attribution 4.0, sedangkan contoh kode dilisensikan berdasarkan Lisensi Apache 2.0. Untuk mengetahui informasi selengkapnya, lihat Kebijakan Situs Google Developers. Java adalah merek dagang terdaftar dari Oracle dan/atau afiliasinya.
Terakhir diperbarui pada 2025-07-14 UTC.