Penyesuaian Instruksi

Anda dapat menggunakan Imagen di Vertex AI untuk menginstruksikan model cara menyesuaikan dan mengubah subjek dalam gambar ke gaya yang Anda tentukan dalam perintah teks.

Melihat kartu model Imagen untuk Pengeditan dan Penyesuaian

Penulisan perintah penyesuaian

Perintah yang Anda gunakan dengan Penyesuaian Imagen 3 dapat memengaruhi kualitas gambar yang dihasilkan. Gunakan template perintah berikut sebagai titik awal untuk menulis perintah penyesuaian. Anda mungkin perlu mengirim beberapa permintaan untuk mendapatkan output yang ditargetkan.

Kasus penggunaan Gambar referensi Template perintah Contoh
Penyesuaian perintah - Transfer gaya Gambar (1) Ubah subject in image [1] agar memiliki gaya ${STYLE_DESCRIPTION}. Gambar tersebut menggambarkan ${IMAGE_DESCRIPTION}. Ubah subject in image [1] agar memiliki gaya lukisan cat air gambar dengan teknik cat air yang tidak kaku, warna lembut, warna pastel, sapuan kuas, halus, latar belakang bersih, spontanitas, gambar gaya analog, lukisan rumit yang sangat detail. Gambar menggambarkan potret seorang wanita yang bangga.

Menyesuaikan menggunakan penyesuaian perintah untuk transfer gaya

Gunakan contoh kode berikut untuk menentukan gaya gambar output berdasarkan gaya yang dijelaskan dalam perintah teks.

REST

Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

  • PROJECT_ID: Google Cloud Project ID Anda.
  • LOCATION: Region project Anda. Misalnya, us-central1, europe-west2, atau asia-northeast3. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI.
  • TEXT_PROMPT: Perintah teks memandu gambar yang dihasilkan model. Untuk menggunakan Penyesuaian Imagen 3, sertakan referenceId dari gambar atau gambar referensi yang Anda berikan dalam format [$referenceId]. Contoh:
    • Ubah subjek dalam gambar [1] agar memiliki gaya Digital Stained Glass image.
    • Tambahkan topi koboi merah ke kucing dalam gambar [1].
    • Hapus corgi dalam gambar [1].
    • Ubah bola merah dalam gambar [1] menjadi kotak biru.
  • "referenceId": ID gambar referensi, atau ID untuk serangkaian gambar referensi yang sesuai dengan subjek atau gaya yang sama.
  • BASE64_REFERENCE_IMAGE: Gambar referensi untuk memandu pembuatan gambar. Gambar harus ditentukan sebagai string byte berenkode base64.
  • IMAGE_COUNT: Jumlah gambar yang dihasilkan. Nilai bilangan bulat yang diterima: 1-4. Nilai default: 4.

Metode HTTP dan URL:

POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

Isi JSON permintaan:

{
  "instances": [
    {
      "prompt": "TEXT_PROMPT",
      "referenceImages": [
        {
          "referenceType": "REFERENCE_TYPE_RAW",
          "referenceId": 1,
          "referenceImage": {
            "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
          }
        }
      ]
    }
  ],
  "parameters": {
    "sampleCount": IMAGE_COUNT
  }
}

Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:

curl

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

PowerShell

Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }

Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
Contoh respons berikut adalah untuk permintaan dengan "sampleCount": 2. Respons ini menampilkan dua objek prediksi, dengan byte gambar yang dihasilkan berenkode base64.
{
  "predictions": [
    {
      "bytesBase64Encoded": "BASE64_IMG_BYTES",
      "mimeType": "image/png"
    },
    {
      "mimeType": "image/png",
      "bytesBase64Encoded": "BASE64_IMG_BYTES"
    }
  ]
}

Penggunaan produk

Untuk melihat standar penggunaan dan batasan konten yang terkait dengan Imagen di Vertex AI, lihat panduan penggunaan.

Versi model

Ada beberapa model pembuatan gambar yang dapat Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat Model Imagen.

Langkah berikutnya

Baca artikel tentang Imagen dan produk AI Generatif lainnya di Vertex AI: