Penyesuaian gaya

Penyesuaian gaya Imagen 3 membantu Anda membuat gambar baru dari perintah teks dan gambar referensi yang Anda berikan. Gambar referensi memandu pembuatan gambar baru.

Kasus penggunaan

Penyesuaian Imagen 3 menawarkan perintah gaya bebas, yang dapat memberikan kesan bahwa Imagen 3 dapat melakukan lebih dari yang dilatih untuk dilakukan. Bagian berikut menjelaskan kasus penggunaan yang dimaksudkan untuk Penyesuaian Imagen 3, dan contoh kasus penggunaan yang tidak dimaksudkan yang tidak lengkap.

Sebaiknya gunakan Penyesuaian Imagen 3 untuk kasus penggunaan yang dimaksud, karena kami telah melatih model pada kasus penggunaan tersebut dan mengharapkan hasil yang baik. Sebaliknya, meskipun Anda dapat mendorong model untuk melakukan hal-hal di luar kasus penggunaan yang dimaksudkan, kami tidak mengharapkan hasil yang baik.

Kasus penggunaan yang dimaksudkan

Berikut adalah kasus penggunaan yang ditujukan untuk penyesuaian gaya Penyesuaian Imagen 3:

  • Membuat gambar dari input teks yang mengikuti gaya spesifik yang diberikan oleh gambar referensi.
  • Mengubah foto seseorang.
  • Mengubah foto seseorang dan mempertahankan ekspresi wajahnya.

Contoh kasus penggunaan yang tidak diinginkan

Berikut adalah daftar tidak lengkap kasus penggunaan yang tidak dilatih untuk dilakukan oleh Penyesuaian Imagen 3, dan menghasilkan hasil yang buruk untuk:

  • Membuat gambar dari teks dan menggunakan gambar referensi, dengan maksud untuk memiliki tingkat kontrol tertentu atas komposisi yang dihasilkan dari gambar referensi.

  • Buat gambar seseorang dari gambar referensi yang memiliki seseorang dengan ekspresi wajah tertentu.

  • Tempatkan dua orang dalam adegan yang berbeda, pertahankan identitas mereka, dan sambil menentukan gaya gambar output (seperti lukisan cat minyak) menggunakan gambar referensi.

  • Menata gaya foto hewan peliharaan dan mengubahnya menjadi gambar, sambil mempertahankan atau menentukan komposisi gambar.

  • Tempatkan produk, seperti kue atau sofa, ke dalam adegan yang berbeda dengan sudut produk yang berbeda, dan mengikuti gaya gambar tertentu (seperti fotorealistik dengan warna, gaya pencahayaan, atau animasi tertentu).

Contoh penyesuaian gaya

Berikut adalah contoh kasus untuk penyesuaian gaya Penyesuaian Imagen 3:

Contoh Input Contoh Output
  1. Gambar referensi1:
    Contoh input untuk penyesuaian pendamping hewan
  2. Perintah teks:
    Buat gambar di mosaic style [1] berdasarkan
    keterangan berikut: Deretan gedung pencakar langit New York City

Contoh output untuk penyesuaian pendamping hewan

1 Gambar input referensi yang dibuat menggunakan pembuatan gambar Imagen 3 dari perintah: mosaik sederhana.

Melihat kartu model Imagen untuk Pengeditan dan Penyesuaian

Sebelum memulai

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI API.

    Enable the API

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI API.

    Enable the API

  8. Siapkan autentikasi untuk lingkungan Anda.

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Untuk menggunakan contoh REST API di halaman ini dalam lingkungan pengembangan lokal, gunakan kredensial yang Anda berikan ke gcloud CLI.

      After installing the Google Cloud CLI, initialize it by running the following command:

      gcloud init

      If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

    Untuk mengetahui informasi selengkapnya, lihat Melakukan autentikasi untuk menggunakan REST dalam dokumentasi autentikasi Google Cloud .

    Penyesuaian gaya

    Anda dapat memberikan gambar referensi jenis gaya saat menggunakan Penyesuaian Imagen 3. Gaya yang Anda pilih memengaruhi cara Anda membuat permintaan pembuatan.

    Perintah yang Anda gunakan dengan Penyesuaian Imagen 3 dapat memengaruhi kualitas gambar yang dihasilkan. Bagian berikut menjelaskan template dan contoh perintah yang direkomendasikan untuk mengirim permintaan penyesuaian.

    Kasus penggunaan Gambar referensi Template perintah Contoh
    Gaya objek Gambar subjek (1-4) Buat gambar di STYLE_DESCRIPTION [1] berdasarkan teks berikut: IMAGE_DESCRIPTION. Buat gambar di neon sign style [1] berdasarkan teks berikut: a sign saying have a great day.
    Penyesuaian gaya gambar orang tanpa input mesh wajah Gambar subjek (1-4) Buat gambar tentang SUBJECT_DESCRIPTION [1] agar sesuai dengan deskripsi: potret SUBJECT_DESCRIPTION [1] ${PROMPT} Buat gambar tentang a woman with short hair[1] agar sesuai dengan deskripsi: potret a woman with short hair[1] dalam gaya kartun 3D dengan latar belakang blur. Karakter yang imut dan cantik, wajah tersenyum, melihat ke kamera, nuansa warna pastel, kualitas tinggi, 4K, karya agung, detail super, tekstur kulit, pemetaan tekstur, bayangan lembut, pencahayaan realistis lembut, warna cerah
    Penataan gaya gambar orang dengan input mesh wajah Gambar subjek (1-3)

    Gambar kontrol Facemesh (1)
    Buat gambar tentang SUBJECT_DESCRIPTION [1] dalam pose CONTROL_IMAGE [2] agar sesuai dengan deskripsi: potret SUBJECT_DESCRIPTION [1] ${PROMPT} Buat gambar tentang a woman with short hair [1] dalam pose control image [2] agar sesuai dengan deskripsi: potret a woman with short hair [1] dalam gaya kartun 3D dengan latar belakang blur. Karakter yang imut dan menggemaskan, wajah tersenyum. Lihat kamera, nuansa warna pastel, kualitas tinggi, 4K, mahakarya, detail super, tekstur kulit, pemetaan tekstur, bayangan lembut, pencahayaan realistis lembut, warna cerah

    REST

    Untuk mengetahui informasi selengkapnya tentang permintaan model imagen-3.0-capability-001, lihat referensi API model imagen-3.0-capability-001.

    Sebelum menggunakan salah satu data permintaan, lakukan penggantian berikut:

    • PROJECT_ID: Google Cloud Project ID Anda.
    • LOCATION: Region project Anda. Misalnya, us-central1, europe-west2, atau asia-northeast3. Untuk mengetahui daftar region yang tersedia, lihat Lokasi AI Generatif di Vertex AI.
    • TEXT_PROMPT: Perintah teks memandu gambar yang dihasilkan model. Untuk menggunakan Penyesuaian Imagen 3, sertakan referenceId dari gambar atau gambar referensi yang Anda berikan dalam format [$referenceId]. Contoh:
      • Perintah teks berikut adalah untuk permintaan yang memiliki satu gambar referensi dengan "referenceId": 1 dan deskripsi opsional "styleDescription": "glowing style": Buat gambar di glowing style [1] berdasarkan teks berikut: Sebuah gereja di pegunungan.
    • "referenceId": ID gambar referensi, atau ID untuk serangkaian gambar referensi yang sesuai dengan subjek atau gaya yang sama. Dalam contoh ini, satu gambar referensi memiliki referenceId (1).
    • BASE64_REFERENCE_IMAGE: Gambar referensi untuk memandu pembuatan gambar. Gambar harus ditentukan sebagai string byte berenkode base64.
    • STYLE_DESCRIPTION: Opsional. Deskripsi teks gambar referensi yang kemudian dapat Anda gunakan di kolom prompt. Contoh:
            "prompt": "Generate an image in glowing style [1] based on the following
              caption: A church in the mountain.",
            [...],
            "styleImageConfig": {
              "styleDescription": "glowing style"
            }
          
    • IMAGE_COUNT: Jumlah gambar yang dihasilkan. Nilai bilangan bulat yang diterima: 1-4. Nilai default: 4.

    Metode HTTP dan URL:

    POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict

    Isi JSON permintaan:

    {
      "instances": [
        {
          "prompt": "TEXT_PROMPT",
          "referenceImages": [
            {
              "referenceType": "REFERENCE_TYPE_STYLE",
              "referenceId": 1,
              "referenceImage": {
                "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE"
              },
              "styleImageConfig": {
                "styleDescription": "STYLE_DESCRIPTION"
              }
            }
          ]
        }
      ],
      "parameters": {
        "sampleCount": IMAGE_COUNT
      }
    }
    

    Untuk mengirim permintaan Anda, pilih salah satu opsi berikut:

    curl

    Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"

    PowerShell

    Simpan isi permintaan dalam file bernama request.json, dan jalankan perintah berikut:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
    Contoh respons berikut adalah untuk permintaan dengan "sampleCount": 2. Respons ini menampilkan dua objek prediksi, dengan byte gambar yang dihasilkan berenkode base64.
    {
      "predictions": [
        {
          "bytesBase64Encoded": "BASE64_IMG_BYTES",
          "mimeType": "image/png"
        },
        {
          "mimeType": "image/png",
          "bytesBase64Encoded": "BASE64_IMG_BYTES"
        }
      ]
    }
    

    Python

    from google import genai
    from google.genai.types import EditImageConfig, Image, StyleReferenceConfig, StyleReferenceImage
    
    client = genai.Client()
    
    # TODO(developer): Update and un-comment below line
    # output_gcs_uri = "gs://your-bucket/your-prefix"
    
    # Create a style reference image of a neon sign stored in Google Cloud Storage
    # using https://storage.googleapis.com/cloud-samples-data/generative-ai/image/neon.png
    style_reference_image = StyleReferenceImage(
        reference_id=1,
        reference_image=Image(gcs_uri="gs://cloud-samples-data/generative-ai/image/neon.png"),
        config=StyleReferenceConfig(style_description="neon sign"),
    )
    
    image = client.models.edit_image(
        model="imagen-3.0-capability-001",
        prompt="generate an image of a neon sign [1] with the words: have a great day",
        reference_images=[style_reference_image],
        config=EditImageConfig(
            edit_mode="EDIT_MODE_DEFAULT",
            number_of_images=1,
            seed=1,
            safety_filter_level="BLOCK_MEDIUM_AND_ABOVE",
            person_generation="ALLOW_ADULT",
            output_gcs_uri=output_gcs_uri,
        ),
    )
    
    # Example response:
    # gs://your-bucket/your-prefix
    print(image.generated_images[0].image.gcs_uri)

    Penggunaan produk

    Untuk melihat standar penggunaan dan batasan konten yang terkait dengan Imagen di Vertex AI, lihat panduan penggunaan.

    Versi model

    Ada beberapa model pembuatan gambar yang dapat Anda gunakan. Untuk mengetahui informasi selengkapnya, lihat Model Imagen.

    Langkah berikutnya

    Baca artikel tentang Imagen dan produk AI Generatif lainnya di Vertex AI: