您可以使用 Vertex AI 的 Imagen,透過文字提示指定樣式,指示模型如何自訂及轉換圖片中的主體。
查看「Imagen for Editing and Customization」模型資訊卡
撰寫自訂提示
使用 Imagen 3 自訂功能時,提示可能會影響生成圖片的品質。請使用下列提示範本做為撰寫自訂提示的起點。您可能需要傳送多個要求,才能取得目標輸出內容。
用途 | 參考圖片 | 提示範本 | 範例 |
---|---|---|---|
Instruct customization - Style transfer | 圖片 (1) | 將 subject in image [1] 轉換為具有「${STYLE_DESCRIPTION}」${STYLE_DESCRIPTION}樣式。${IMAGE_DESCRIPTION} | 將 subject in image [1] 轉換為水彩畫風格,以鬆散的水彩技巧繪製圖片,呈現柔和色調、粉彩色、筆觸、精緻、乾淨的背景、自發性、類比風格的繪圖,以及精細的細節豐富的繪畫。這張圖片描繪一位充滿自信的女性肖像。 |
使用指令自訂功能進行風格轉移
使用下列程式碼範例,根據文字提示中描述的風格,指定輸出圖片的風格。
REST
使用任何要求資料之前,請先替換以下項目:
- PROJECT_ID:您的 Google Cloud 專案 ID。
- LOCATION:專案的區域。例如
us-central1
、europe-west2
或asia-northeast3
。如需可用區域的清單,請參閱「Vertex AI 的生成式 AI 服務地區」。 - TEXT_PROMPT:文字提示會引導模型生成圖片。如要使用 Imagen 3 自訂功能,請在 [$referenceId] 格式中加入您提供的參考圖片
referenceId
。例如:- 將圖片中的主體[1]轉換為數位彩繪玻璃風格的圖像。
- 在圖片中的貓咪頭上加上紅色牛仔帽 [1]。
- 移除圖片中的柯基犬 [1]。
- 將圖片 [1] 中的紅球換成藍色方塊。
"referenceId"
:參考圖片的 ID,或對應相同主題或風格的一系列參考圖片 ID。- BASE64_REFERENCE_IMAGE:引導圖片生成的參考圖片。圖片必須指定為採用 base64 編碼的位元組字串。
- IMAGE_COUNT:生成的圖片數量。 接受的整數值:1 到 4。預設值:4。
HTTP 方法和網址:
POST https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict
JSON 要求主體:
{ "instances": [ { "prompt": "TEXT_PROMPT", "referenceImages": [ { "referenceType": "REFERENCE_TYPE_RAW", "referenceId": 1, "referenceImage": { "bytesBase64Encoded": "BASE64_REFERENCE_IMAGE" } } ] } ], "parameters": { "sampleCount": IMAGE_COUNT } }
如要傳送要求,請選擇以下其中一個選項:
curl
將要求主體儲存在名為 request.json
的檔案中,然後執行下列指令:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict"
PowerShell
將要求主體儲存在名為 request.json
的檔案中,然後執行下列指令:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://LOCATION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/LOCATION/publishers/google/models/imagen-3.0-capability-001:predict" | Select-Object -Expand Content
"sampleCount": 2
的範例回應。回應會傳回兩個預測物件,其中包含以 base64 編碼的生成圖片位元組。
{ "predictions": [ { "bytesBase64Encoded": "BASE64_IMG_BYTES", "mimeType": "image/png" }, { "mimeType": "image/png", "bytesBase64Encoded": "BASE64_IMG_BYTES" } ] }
產品使用量累進區間
如要查看與 Vertex AI 上的 Imagen 相關聯的使用標準和內容限制,請參閱使用指南。
模型版本
你可以使用多種圖片生成模型。詳情請參閱「Imagen 模型」。
後續步驟
閱讀有關 Imagen 和其他 Vertex AI 生成式 AI 產品的文章:
- 開發人員指南:開始使用 Vertex AI 中的 Imagen 3
- 專為創作者打造的全新生成式媒體模型和工具
- Gemini 新功能:自訂 Gem 和 Imagen 3 圖像生成功能
- Google DeepMind:Imagen 3 - 品質最高的文字轉圖像模型