本頁面由 Cloud Translation API 翻譯而成。

提示和圖像屬性指南

如要使用 Vertex AI 的 Imagen，請提供要生成或編輯內容的文字說明。這些描述稱為「提示」，是您在 Vertex AI 上與生成式 AI 溝通的主要方式。

本指南將說明如何修改文字轉圖片提示的部分內容，產生不同的結果，並提供可建立的圖片範例。本指南也會說明如何使用文字提示和疊代編輯圖片。

產品使用量累進區間

如要查看與 Vertex AI 上的 Imagen 相關聯的使用標準和內容限制，請參閱使用指南。

內容篩選：輸入文字、上傳圖片和生成圖片

系統會篩除生成圖像中的不當或有害內容。同樣地，系統也會檢查 Vertex AI 中 Imagen 收到的任何輸入內容，包括輸入的文字提示，以及圖片編輯功能上傳的相片。詳情請參閱「Imagen 的負責任 AI 和使用指南」。

如要檢舉疑似濫用 Imagen on Vertex AI 的行為，或檢舉含有不當內容或不實資訊的生成輸出內容，請使用「檢舉疑似濫用行為」Google Cloud表單。

提示撰寫基本概念 (主題、脈絡和風格)

雖然撰寫優質提示的方法不只一種，但加入一些關鍵字和修飾符，有助於達成最終目標。提示不必冗長或複雜，但大多數的優質提示都清楚詳盡。

你可以先從主題、情境和風格著手。

提示詞強調主題、脈絡和風格 — 圖片文字：*現代公寓大樓*的草圖 (風格)，周圍環繞著*摩天大樓* (**背景和環境**)。

主題：在任何提示中，首先要考慮的是主題，也就是您想生成圖片的物件、人物、動物或風景。
背景資訊：背景或情境同樣重要，因為主體會放置在其中。嘗試將拍攝主體放在各種背景中。例如白色背景的攝影棚、戶外或室內環境。
風格：最後，新增想要的圖片風格。風格可以是通用的 (繪畫、攝影、素描)，也可以非常具體 (粉彩畫、炭筆畫、等距 3D)。

撰寫提示的第一個版本後，請加入更多詳細資料來修正提示，直到生成想要的圖片為止。反覆運算很重要。首先，請確立核心概念，然後不斷修正及擴展這個概念，直到生成的圖片接近您的想像。

擬真範例圖片 3 — 提示：湖畔的春季公園，**夕陽在湖的對岸落下，黃金時段，紅色野花**

撰寫 Imagen 3 提示

查看 Imagen for Generation 模型資訊卡

無論提示簡短或詳細，Imagen 3 都能將你的構想轉化為細節豐富的圖像。透過反覆提示來修正圖像，並新增詳細資料，直到獲得完美結果。

簡短提示可讓你快速生成圖片。

Imagen 3 簡短提示範例 — 提示：20 多歲女性的特寫照片、街頭攝影、電影劇照、柔和的暖橘色調

提示越長，就能加入更多詳細資料，打造出理想的圖片。

Imagen 3 長提示範例 — 提示：20 多歲女性的迷人相片，採用街頭攝影風格。圖片應看起來像電影劇照，並帶有柔和的橘色暖色調。

撰寫 Imagen 3 提示的其他建議：

使用描述性語言：使用詳細的形容詞和副詞，讓 Imagen 3 清楚瞭解你的需求。
提供背景資訊：視需要提供背景資訊，協助 AI 瞭解內容。
參考特定藝人或風格：如果心中已有特定美學，參考特定藝人或藝術運動會很有幫助。
使用提示工程工具：考慮探索提示工程工具或資源，協助您修正提示並獲得最佳結果。
修飾個人和團體相片中的臉部細節：
- 將臉部細節設為相片焦點 (例如在提示中使用「肖像」一詞)。
- 如要提升細節品質，建議使用 Imagen 3 等較大型的模型，而非 Imagen 3 Fast。

生成圖片中的文字

Imagen 3 可在圖片中加入文字，讓您盡情發揮創意生成圖片。請參考下列指引，充分運用這項功能：

放心疊代：您可能需要重新生成圖片，直到達到想要的樣貌為止。Imagen 的文字整合功能仍在演進中，有時多試幾次才能獲得最佳結果。
簡短扼要：文字長度應限制在 25 個字元以內，才能獲得最佳生成結果。
多個詞組：嘗試使用兩到三個不同的詞組，提供額外資訊。為求簡潔，請避免使用超過三個片語。

提示：海報，標題為粗體字「Summerland」，下方是「Summer never felt so good」的宣傳標語。
引導文字放置位置：Imagen 會嘗試按照指示放置文字，但偶爾可能會出現變化。這項功能會持續改進。
激發字型樣式：指定一般字型樣式，以細微方式影響 Imagen 的選擇。請勿要求精確複製字型，但可期待創意詮釋。
字型大小：指定字型大小或一般大小 (例如小、中、大)，以影響字型大小的生成結果。

提示參數化

如要進一步控管輸出結果，使用 Imagen API 或 Vertex AI SDK for Python 時，您可能會發現將輸入內容參數化很有幫助。舉例來說，假設您希望顧客能為自己的商家生成標誌，並確保標誌一律以純色背景生成，您也想限制用戶端可從選單中選取的選項。

在本例中，您可以建立類似下列內容的參數化提示：

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

在自訂使用者介面中，顧客可以使用選單輸入參數，而他們選擇的值會填入 Imagen 收到的提示。

例如：

提示：A minimalist logo for a health care company on a solid color background. Include the text Journey.
提示：A modern logo for a software company on a solid color background. Include the text Silo.
提示：A traditional logo for a baking company on a solid color background. Include the text Seed.

風格：攝影

提示包含：「一張...的相片」

如要使用這種風格，請先使用清楚告知 Vertex AI 版 Imagen 你要尋找相片的關鍵字。提示開頭為「一張<某某事物>的相片」。。.」。例如：

^{圖片來源：每張圖片都是使用 Imagen 3 模型，根據對應的文字提示生成。}

風格：插畫和藝術

提示包含：「painting」"A painting of..."、「A sketch of...」(A sketch 的...)

藝術風格從鉛筆素描等單色風格，到超寫實數位藝術都有。舉例來說，以下圖片使用相同提示，但風格不同：

「背景為摩天大樓的運動風電動斜背轎車」[art style or creation technique]

^{圖片來源：每張圖片都是使用 Imagen 2 模型，根據對應的文字提示生成。}

進階提示撰寫技巧

根據攝影描述符、形狀和材質、歷史藝術運動和圖像品質修飾符等屬性，使用下列範例建立更具體的提示。

攝影修飾符

在下列範例中，您可以看到幾個攝影專用的修飾符和參數。

相機距離 - 近拍、遠拍

攝影機位置 - 空拍、由下往上拍

提示：高樓林立的城市空照圖

提示：從下方拍攝的森林樹冠層相片，背景為藍天

光線 - 自然、戲劇化、暖色、冷色

相機設定 - 動作模糊、柔焦、散景、人像

提示：從車內拍攝城市相片，要有摩天大樓和動態模糊效果

提示：夜間城市橋梁的柔焦相片
鏡頭類型 - 35 公釐、50 公釐、魚眼、廣角、微距

提示：葉子的相片，微距鏡頭

提示：街頭攝影、紐約市、魚眼鏡頭
底片類型 - 黑白、拍立得

提示：戴著太陽眼鏡的狗的拍立得肖像照

提示：戴太陽眼鏡的狗的黑白照片

^{圖片來源：每張圖片都是使用 Imagen 3 模型，根據對應的文字提示生成。}

形狀和材質

提示包含：「...製成...」、「...以...形狀呈現...」

這項技術的優點之一，就是能製作出原本難以或無法實現的圖像。舉例來說，你可以用不同材質和紋理重新製作公司標誌。

^{圖片來源：每張圖片都是使用 Imagen 3 模型，根據對應的文字提示生成。}

歷史藝術參考資料

提示包含：「...的風格...」

多年來，某些風格已成為經典。以下列舉一些可嘗試的歷史繪畫或藝術風格。

「generate an image in the style of [art period or movement]: a wind farm」(以「[art period or movement]」的風格生成圖片：風力發電廠)

^{圖片來源：每張圖片都是使用 Imagen 3 模型，根據對應的文字提示生成。}

圖片品質修飾符

某些關鍵字可讓模型瞭解您要尋找高品質素材資源。品質修飾符的範例如下：

一般修飾符 - 高品質、美麗、風格化
相片 - 4K、HDR、攝影棚相片
藝術、插畫 - 由專業人士繪製，細緻

以下列舉幾個範例，說明有/沒有品質修飾符的提示。

玉米範例圖片 (含修飾符) — 提示 (含品質修飾符)：**4K HDR 美麗**
玉米桿的相片，由專業攝影師
拍攝

^{圖片來源：每張圖片都是使用 Imagen 3 模型，根據對應的文字提示生成。}

顯示比例

Imagen 3 圖像生成功能可讓你設定五種不同的圖像顯示比例。

正方形 (1:1，預設) - 標準正方形相片。社群媒體貼文是這個長寬比的常見用途。

全螢幕 (4:3) - 這種顯示比例常見於媒體或電影。這也是大多數舊型 (非寬螢幕) 電視和中片幅相機的尺寸。相較於 1:1，16:9 可橫向捕捉更多場景，因此是攝影的首選長寬比。

顯示比例範例 — 提示：音樂家手指的特寫鏡頭，正在彈奏鋼琴，黑白電影，復古 (4:3 長寬比)

直向全螢幕 (3:4)：這是旋轉 90 度的全螢幕顯示比例。與 1:1 顯示比例相比，這項功能可垂直擷取更多場景。

寬螢幕 (16:9) - 這個比例已取代 4:3，現在是電視、螢幕和手機螢幕 (橫向) 最常見的顯示比例。如要拍攝更多背景 (例如風景)，請使用這個顯示比例。

提示：一名男子穿著全白服裝坐在海灘上，特寫鏡頭，黃金時段光線 (顯示比例 16:9)
直向 (9:16)：這個比例是寬螢幕，但經過旋轉。這是相對較新的長寬比，因短片應用程式 (例如 YouTube Shorts) 而廣為人知。適用於高聳的物件，例如建築物、樹木、瀑布或其他類似物件。

提示：巨大的摩天大樓的數位算繪圖，現代、宏偉、史詩，背景是美麗的日落 (顯示比例 9:16)

負面提示

先前的範例著重於撰寫提示，讓 Imagen 建立您想要的內容，但您也可以提供負面提示，連同原始提示一起使用，協助產品生成或編輯圖片。這些負面提示詞是強大的工具，可協助指定要從圖片中省略的元素。只要描述不想要的內容即可。

建議：清楚描述不想看到的內容。例如「牆壁、框架」。

不建議：避免使用指示性語言或「否」或「不要」等字詞。舉例來說，請避免使用「不要顯示牆壁」或「不要顯示牆壁」等詞組。

沒有負面提示的繪畫範例圖片 — 提示 (無負面提示)：4K 電玩遊戲概念藝術、都市叢林、賽博龐克城市、詳細的算繪結果

使用負面提示詞的繪畫範例圖片 — 提示：4K 電玩遊戲概念藝術、都市叢林、賽博龐克城市、詳細的算繪結果
負面提示：**綠色植物、植物、森林、樹木**

擬真圖像

圖片生成模型的不同版本可能會提供藝術風格和寫實風格的輸出內容。在提示中使用下列字詞，根據要生成的物件生成更擬真的輸出內容。

用途	鏡頭類型	焦距	其他詳細資料
人物 (肖像)	Prime、Zoom	24-35mm	黑白電影、黑色電影、景深、雙色調 (提及兩種顏色)
食物、昆蟲、植物 (物體、靜物)	微距	60-105mm	細節豐富、精準對焦、光線受控
運動、野生動物 (動作)	望遠變焦	100-400mm	快門速度快、動作或移動追蹤
天文、風景 (廣角)	廣角	10-24mm	長時間曝光、焦點清晰、長時間曝光、平滑的水面或雲朵