Imagen 3 맞춤설정의 스타일 맞춤설정을 사용하면 제공한 텍스트 프롬프트와 참조 이미지에서 새 이미지를 생성할 수 있습니다. 참고 이미지는 새 이미지 생성을 안내합니다.
사용 사례
Imagen 3 맞춤설정은 자유 형식의 프롬프트를 제공하므로 학습된 것보다 더 많은 작업을 할 수 있다는 인상을 줄 수 있습니다. 다음 섹션에서는 Imagen 3 맞춤설정의 의도된 사용 사례와 의도하지 않은 사용 사례를 예시를 들어 설명합니다.
의도한 사용 사례에 Imagen 3 맞춤설정을 사용하는 것이 좋습니다. 이러한 사용 사례에 대해 모델을 학습시켰으므로 좋은 결과를 기대할 수 있기 때문입니다. 반대로 의도한 사용 사례 외의 작업을 하도록 모델을 푸시할 수는 있지만 좋은 결과를 얻을 수는 없습니다.
의도한 사용 사례
다음은 Imagen 3 맞춤설정 스타일 맞춤설정을 위한 사용 사례입니다.
- 참조 이미지에서 제공된 특정 스타일을 따르는 텍스트 입력에서 이미지를 생성합니다.
- 사람의 사진을 변경합니다.
- 사람의 사진을 수정하고 얼굴 표정을 보존합니다.
의도하지 않은 사용 사례의 예
다음은 Imagen 3 맞춤설정이 학습되지 않았으며 다음과 같은 경우 좋지 않은 결과를 산출하는 사용 사례의 일부 목록입니다.
참조 이미지에서 생성된 컴포지션을 어느 정도 제어할 수 있도록 텍스트와 참조 이미지를 사용하여 이미지를 생성합니다.
특정 표정을 짓는 사람이 있는 참조 이미지에서 사람의 이미지를 생성합니다.
두 사람을 서로 다른 장면에 배치하고, 신원을 보존하면서 참조 이미지를 사용하여 출력 이미지의 스타일(예: 유화)을 지정합니다.
이미지의 구도를 유지하거나 지정하면서 반려동물 사진을 스타일화하여 그림으로 변환합니다.
쿠키나 소파와 같은 제품을 다양한 제품 각도와 특정 이미지 스타일(예: 특정 색상, 조명 스타일 또는 애니메이션이 있는 사실적인 이미지)에 따라 다양한 장면에 배치합니다.
스타일 맞춤설정 예
다음은 Imagen 3 맞춤설정 스타일 맞춤설정의 예시 사례를 보여줍니다.
샘플 입력 | 샘플 출력 |
---|---|
|
![]() |
1 간단한 모자이크라는 프롬프트에서 Imagen 3 이미지 생성을 사용하여 생성된 참조 입력 이미지.
시작하기 전에
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI API.
-
환경에 대한 인증을 설정하세요.
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
REST
로컬 개발 환경에서 이 페이지의 REST API 샘플을 사용하려면 gcloud CLI에 제공한 사용자 인증 정보를 사용합니다.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
자세한 내용은 Google Cloud 인증 문서의 REST 사용을 위한 인증을 참조하세요.
스타일 맞춤설정
Imagen 3 맞춤설정을 사용할 때 스타일 유형의 참고 이미지를 제공할 수 있습니다. 선택한 스타일은 생성 요청을 작성하는 방식에 영향을 미칩니다.
Imagen 3 맞춤설정에 사용하는 프롬프트는 생성된 이미지의 품질에 영향을 줄 수 있습니다. 다음 섹션에서는 맞춤설정 요청을 전송하는 데 권장되는 프롬프트 템플릿과 샘플을 설명합니다.
사용 사례 참조 이미지 프롬프트 템플릿 예시 객체 스타일 피사체 이미지(1-4) 다음 캡션을 바탕으로 STYLE_DESCRIPTION [1]의 이미지를 생성해 줘: IMAGE_DESCRIPTION 다음 캡션을 바탕으로 neon sign style [1]의 이미지를 생성해 줘: a sign saying have a great day 얼굴 메시 입력 없이 사람 이미지 스타일 지정 피사체 이미지(1-4) 다음 설명과 일치하는 SUBJECT_DESCRIPTION [1] 이미지를 만들어 줘: SUBJECT_DESCRIPTION [1]의 초상화 ${PROMPT} 다음 설명과 일치하는 a woman with short hair[1] 이미지를 만들어 줘: a woman with short hair[1]의 초상화, 배경이 흐리게 처리된 3D 만화 스타일. 귀엽고 사랑스러운 캐릭터, 웃는 얼굴, 카메라를 바라보는 모습, 파스텔 색조, 고화질, 4K, 걸작, 섬세한 디테일, 피부 질감, 텍스처 매핑, 부드러운 그림자, 부드럽고 사실적인 조명, 생생한 색상 얼굴 메시 입력을 사용한 사람 이미지 스타일 지정 피사체 이미지(1-3)
얼굴 메시 대조 이미지(1)설명과 일치하는 CONTROL_IMAGE [2]의 포즈로 SUBJECT_DESCRIPTION [1]에 관한 이미지를 만들어 줘: SUBJECT_DESCRIPTION [1]의 초상화 ${PROMPT} 다음 설명과 일치하는 a woman with short hair [1] 이미지를 만들어 줘: control image [2]의 포즈를 취한 a woman with short hair [1]의 초상화로 배경이 흐리게 처리된 3D 만화 스타일. 귀엽고 사랑스러운 캐릭터, 웃는 얼굴. 카메라 보기, 파스텔 색조, 고화질, 4K, 걸작, 슈퍼 디테일, 피부결, 텍스처 매핑, 부드러운 그림자, 부드럽고 사실적인 조명, 생생한 색상 REST
imagen-3.0-capability-001
모델 요청에 대한 자세한 내용은imagen-3.0-capability-001
모델 API 참조를 확인하세요.요청 데이터를 사용하기 전에 다음을 바꿉니다.
- PROJECT_ID: Google Cloud 프로젝트 ID
- LOCATION: 프로젝트의 리전. 예를 들면
us-central1
,europe-west2
,asia-northeast3
입니다. 사용 가능한 리전 목록은 Vertex AI의 생성형 AI 위치를 참조하세요. - TEXT_PROMPT: 모델이 생성하는 이미지를 안내하는 텍스트 프롬프트. Imagen 3 맞춤설정을 사용하려면 제공하는 참고 이미지 또는 이미지의
referenceId
를 [$referenceId] 형식으로 포함합니다. 예를 들면 다음과 같습니다.- 다음은
"referenceId": 1
이 지정된 단일 참고 이미지와"styleDescription": "glowing style"
에 대한 설명(선택사항)이 있는 요청을 위한 텍스트 프롬프트입니다. 다음 캡션을 바탕으로 glowing style [1]의 이미지를 생성해 줘: 산에 있는 교회
- 다음은
"referenceId"
: 참고 이미지의 ID 또는 동일한 피사체 또는 스타일에 해당하는 일련의 참고 이미지 ID. 이 예에서 단일 참고 이미지의referenceId
는 (1
)입니다.- BASE64_REFERENCE_IMAGE: 이미지 생성을 안내하는 참고 이미지. 이미지는 base64 인코딩 바이트 문자열로 지정되어야 합니다.
- STYLE_DESCRIPTION: (선택사항)
prompt
필드에서 사용할 수 있는 참고 이미지의 텍스트 설명입니다. 예를 들면 다음과 같습니다."prompt": "Generate an image in glowing style [1] based on the following caption: A church in the mountain.", [...], "styleImageConfig": { "styleDescription": "glowing style" }
- IMAGE_COUNT: 생성 이미지의 수. 허용되는 정수 값: 1~4. 기본값: 4.
HTTP 메서드 및 URL:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
JSON 요청 본문:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_STYLE", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" }, "styleImageConfig": { "styleDescription": "STYLE_DESCRIPTION" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
요청을 보내려면 다음 옵션 중 하나를 선택합니다.
curl
요청 본문을
request.json
파일에 저장하고 다음 명령어를 실행합니다.curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"PowerShell
요청 본문을
request.json
파일에 저장하고 다음 명령어를 실행합니다.$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content"sampleCount": 2
요청에 대한 샘플 응답입니다. 응답은 생성된 이미지 바이트를 base64로 인코딩한 두 개의 예측 객체를 반환합니다.{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
Python
제품 사용량
Vertex AI 기반 Imagen과 관련된 사용량 표준과 콘텐츠 제한을 보려면 사용 가이드라인을 참조하세요.
모델 버전
사용할 수 있는 이미지 생성 모델은 여러 가지가 있습니다. 자세한 내용은 Imagen 모델을 참고하세요.
다음 단계
Imagen 및 Vertex AI의 기타 생성형 AI 제품 관련 문서 읽기:
- Vertex AI에서 Imagen 3 시작을 위한 개발자 가이드
- 크리에이터를 위해 제작된 새로운 생성형 미디어 모델 및 도구
- Gemini의 새로운 기능: Imagen 3의 커스텀 젬 및 향상된 이미지 생성
- Google DeepMind: Imagen 3 - 최고 품질의 텍스트 이미지 변환 모델
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2025-07-08(UTC)