如要使用 Vertex AI 的 Imagen,請提供要生成或編輯內容的文字說明。這些描述稱為「提示」,是您與 Vertex AI 生成式 AI 溝通的主要方式。
本指南將說明如何修改文生圖提示的部分內容,產生不同的結果,並提供可建立的圖片範例。本指南也說明如何使用文字提示和疊代編輯圖片。
產品使用量累進區間
如要查看與 Vertex AI 上的 Imagen 相關聯的使用標準和內容限制,請參閱使用指南。
內容篩選:輸入文字、上傳圖片和生成圖片
系統會過濾生成的圖片,避免出現不當或有害內容。同樣地,系統也會檢查 Vertex AI 中 Imagen 收到的任何輸入內容,包括輸入的文字提示,以及圖片編輯功能上傳的相片。詳情請參閱「Imagen 的負責任 AI 和使用指南」。
如要檢舉疑似濫用 Imagen on Vertex AI 的行為,或檢舉含有不當內容或不實資訊的生成輸出內容,請使用「檢舉疑似濫用行為」Google Cloud表單。
提示撰寫基本概念 (主題、脈絡和風格)
雖然撰寫優質提示的方法不只一種,但加入一些關鍵字和修飾符,有助於達成最終目標。提示不必冗長或複雜,但大多數的優質提示都清楚明瞭。
你可以先從主題、情境和風格著手。

主題:任何提示的第一個考量因素都是主題,也就是您想生成圖片的物件、人物、動物或風景。
背景資訊:背景或情境同樣重要,因為主體會放置在其中。嘗試將拍攝主體放在各種背景中。例如白色背景的攝影棚、室外或室內環境。
風格:最後,新增想要的圖片風格。風格可以是廣泛的類型 (繪畫、攝影、素描),也可以是非常具體的類型 (粉彩畫、炭筆畫、等距 3D)。
撰寫提示的第一個版本後,請加入更多詳細資料來修正提示,直到生成想要的圖片為止。反覆運算很重要。 首先,請確立核心概念,然後不斷修正及擴充這個概念,直到生成的圖片接近您的想像。
![]() |
![]() |
![]() |
撰寫 Imagen 3 提示
查看 Imagen for Generation 模型資訊卡
無論提示簡短或詳細,Imagen 3 都能將構想轉化為細節豐富的圖像。透過反覆提示來修正圖像,加入細節,直到獲得完美結果。
簡短提示可讓你快速生成圖片。 ![]() |
提示越長,就能加入更多詳細資料,打造出理想的圖片。 ![]() |
撰寫 Imagen 3 提示的其他建議:
- 使用描述性語言:使用詳細的形容詞和副詞,為 Imagen 3 描繪清晰的圖像。
- 提供背景資訊:視需要提供背景資訊,協助 AI 瞭解情況。
- 參考特定藝術家或風格:如果心中已有特定美學,參考特定藝術家或藝術運動會很有幫助。
- 使用提示工程工具:考慮探索提示工程工具或資源,協助您修正提示並獲得最佳結果。
- 提升個人和群組相片中的臉部細節:
- 將臉部細節指定為相片的焦點 (例如在提示中使用「肖像」一詞)。
- 如要提升細節品質,建議使用 Imagen 3 等較大型的模型,而非 Imagen 3 Fast。
生成圖片中的文字
Imagen 3 可在圖片中加入文字,讓您盡情發揮創意生成圖片。請參考下列指引,充分運用這項功能:
- 放心反覆生成:您可能需要多次重新生成圖片,直到達到想要的樣貌為止。Imagen 的文字整合功能仍在演進中,有時需要多次嘗試才能獲得最佳結果。
- 簡短扼要:文字長度應限制在 25 個字元以內,才能獲得最佳生成結果。
多個詞組:嘗試使用兩到三個不同的詞組,提供額外資訊。為求簡潔,請避免使用超過三個片語。
提示:海報,標題為粗體字「Summerland」,下方是「Summer never felt so good」的口號。 文字位置:Imagen 會盡量將文字放置在指定位置,但偶爾會出現變化。這項功能會持續改進。
字型樣式:指定一般字型樣式,以細微方式影響 Imagen 的選擇。請勿要求精確複製字型,但可期待創意詮釋。
字型大小:指定字型大小或一般大小 (例如小、中、大),以影響字型大小的生成。
提示參數化
如要進一步控管輸出結果,使用 Imagen API 或 Python 適用的 Vertex AI SDK 時,您可能會發現將輸入內容參數化很有幫助。舉例來說,假設您希望顧客能為自己的商家生成標誌,並確保標誌一律以純色背景生成,您也想限制用戶端可從選單中選取的選項。
在本例中,您可以建立類似下列的參數化提示:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.
在自訂使用者介面中,顧客可以使用選單輸入參數,而他們選擇的值會填入 Imagen 收到的提示。
例如:
提示:
A minimalist logo for a health care company on a solid color background. Include the text Journey.
提示:
A modern logo for a software company on a solid color background. Include the text Silo.
提示:
A traditional logo for a baking company on a solid color background. Include the text Seed.
風格:攝影
- 提示包含:「一張...的相片」
如要使用這種風格,請先使用清楚告知 Vertex AI 版 Imagen 你要尋找相片的關鍵字。提示開頭為「一張<某某事物>的相片」。。.」。例如:
![]() |
![]() |
![]() |
圖片來源:每張圖片都是使用 Imagen 3 模型,根據對應的文字提示生成。
風格:插畫和藝術
- 提示包含:「painting」,「A sketch of...」(A sketch 的...)
藝術風格從鉛筆素描等單色風格,到超寫實數位藝術都有。舉例來說,下列圖片使用相同提示,但風格不同:
「背景為摩天大樓的運動風電動斜背轎車」[art style or creation technique]
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
圖片來源:每張圖片都是使用 Imagen 2 模型,根據對應的文字提示生成。
進階提示撰寫技巧
根據攝影描述符、形狀和材質、歷史藝術運動和圖像品質修飾符等屬性,使用下列範例建立更具體的提示。
攝影修飾符
在下列範例中,您可以看到幾個攝影專用的修飾符和參數。
相機鄰近度 - 近距離拍攝的特寫照,以及遠距離拍攝的相片
提示:咖啡豆的特寫照片 提示:在凌亂的廚房中,一小袋咖啡豆的縮放相片 攝影機位置 - 空拍、由下往上
提示:高樓林立的城市空照圖 提示:從下方拍攝的森林樹冠層相片,背景為藍天 光線 - 自然、戲劇化、暖色、冷色
提示:現代扶手椅的攝影棚照片,自然光 提示:現代扶手椅的攝影棚照片,戲劇性燈光 相機設定 - 動態模糊、柔焦、散景、人像
提示:從車內拍攝城市高樓大廈的相片,並加上動態模糊效果 提示:夜間城市中的橋梁,柔焦攝影 鏡頭類型 - 35 公釐、50 公釐、魚眼、廣角、微距
提示:葉子的相片,微距鏡頭 提示:街頭攝影、紐約市、魚眼鏡頭 底片類型 - 黑白、拍立得
提示:戴著太陽眼鏡的狗的拍立得肖像照 提示:戴太陽眼鏡的狗的黑白相片
圖片來源:每張圖片都是使用 Imagen 3 模型,根據對應的文字提示生成。
形狀和材質
- 提示包含:「...製成...」、「...形狀...」
這項技術的優點之一,就是能製作出原本難以或無法實現的圖像。舉例來說,你可以用不同材質和紋理重新製作公司標誌。
![]() |
![]() |
![]() |
圖片來源:每張圖片都是使用 Imagen 3 模型,根據對應的文字提示生成。
歷史藝術參考資料
- 提示包含:「...的風格...」
多年來,某些風格已成為經典。以下提供一些歷史繪畫或藝術風格的點子,供您參考。
「generate an image in the style of [art period or movement]: a wind farm」(以「[art period or movement]」的風格生成圖片:風力發電廠)
![]() |
![]() |
![]() |
圖片來源:每張圖片都是使用 Imagen 3 模型,根據對應的文字提示生成。
圖片品質修飾符
某些關鍵字可讓模型瞭解您要尋找高品質素材資源。品質修飾符的例子包括:
- 一般修飾符 - 高品質、美麗、風格化
- 相片 - 4K、HDR、攝影棚相片
- 藝術、插畫 - 由專業人士繪製,細緻
以下列舉幾個範例,說明沒有品質修飾符的提示,以及含有品質修飾符的相同提示。
![]() |
![]() photo of a corn stalk taken by a professional photographer |
圖片來源:每張圖片都是使用 Imagen 3 模型,根據對應的文字提示生成。
顯示比例
Imagen 3 圖像生成功能可讓你設定五種不同的圖像顯示比例。
- 正方形 (1:1,預設) - 標準正方形相片。社群媒體貼文是這個長寬比的常見用途。
全螢幕 (4:3) - 媒體或電影通常會使用這個顯示比例。 這也是大多數舊型 (非寬螢幕) 電視和中片幅相機的尺寸。相較於 1:1,這種長寬比可捕捉更多橫向場景, 因此是攝影的首選長寬比。
提示:音樂家彈奏鋼琴的手指特寫,黑白電影,復古風格 (4:3 長寬比) 提示:為高檔餐廳拍攝的專業薯條棚拍照片,風格類似美食雜誌 (4:3 長寬比) 直向全螢幕 (3:4) - 這是旋轉 90 度的全螢幕顯示比例。與 1:1 顯示比例相比,這項功能可垂直擷取更多場景。
提示:一名女性在健行,水窪中映照出她的靴子,背景是高聳的山脈,廣告風格,戲劇化角度 (3:4 長寬比) 提示:河流流向神祕山谷的空拍圖 (長寬比 3:4) 寬螢幕 (16:9) - 這個比例已取代 4:3,現在是電視、螢幕和手機螢幕 (橫向) 最常見的顯示比例。如要拍攝更多背景 (例如風景),請使用這個顯示比例。
提示:一名穿著全白服裝的男子坐在海灘上,特寫鏡頭,黃金時段光線 (顯示比例 16:9) 直向 (9:16):這個比例是寬螢幕,但經過旋轉。這是相對較新的長寬比,因短片應用程式 (例如 YouTube Shorts) 而廣為人知。適用於高聳的物件,例如建築物、樹木、瀑布或其他類似物件。
提示:巨大的摩天大樓的數位彩現,現代、宏偉、史詩,背景是美麗的日落 (顯示比例 9:16)
負面提示
先前的範例著重於撰寫提示,讓 Imagen 產生您想要的內容,但您也可以提供負面提示,搭配原始提示使用,協助產品生成或編輯圖片。這些負面提示可有效指定要從圖片中省略的元素。只要描述不想要的內容即可。
建議:清楚描述不想看到的內容。例如「牆壁、框架」。
不建議:避免使用指示性語言或「否」或「不要」等字詞。舉例來說,請避免使用「不要顯示牆壁」或「不要顯示牆壁」等詞組。
![]() |
![]() 負面提示:綠色植物、植物、森林、樹木 |
![]() |
![]() 負面提示:雪、霜 |
擬真圖像
圖片生成模型的不同版本可能會提供藝術風格和寫實風格的輸出內容。在提示中使用下列字詞,根據要生成的主題,生成更逼真的輸出內容。
用途 | 鏡頭類型 | 焦距 | 其他詳細資料 |
---|---|---|---|
人物 (人像) | 縮放 | 24-35mm | 黑白電影、黑色電影、景深、雙色調 (提及兩種顏色) |
食物、昆蟲、植物 (物體、靜物) | 微距 | 60-105mm | 細節豐富、精準對焦、光線受控 |
運動、野生動物 (動作) | 望遠變焦 | 100-400mm | 快速快門速度、動作或移動追蹤 |
天文、風景 (廣角) | 廣角 | 10-24mm | 長時間曝光、焦點清晰、長時間曝光、水面或雲朵平滑 |
人像
用途 | 鏡頭類型 | 焦距 | 其他詳細資料 |
---|---|---|---|
人物 (人像) | 縮放 | 24-35mm | 黑白電影、黑色電影、景深、雙色調 (提及兩種顏色) |
Imagen 可以使用表格中的多個關鍵字,生成下列肖像。
![]() |
![]() |
![]() |
![]() |
提示:一位女性,35 公釐人像照,藍色和灰色雙色調
模型:Imagen 3 (imagen-3.0-generate-002
)
![]() |
![]() |
![]() |
![]() |
提示:35 公釐人像照,黑色電影風格的女性
模型:Imagen 3 (imagen-3.0-generate-002
)
物件
用途 | 鏡頭類型 | 焦距 | 其他詳細資料 |
---|---|---|---|
食物、昆蟲、植物 (物體、靜物) | 微距 | 60-105mm | 細節豐富、精準對焦、光線受控 |
使用表格中的幾個關鍵字,Imagen 就能生成下列物件圖片。
![]() |
![]() |
![]() |
![]() |
提示:leaf of a prayer plant, macro lens, 60mm
模型:Imagen 3 (imagen-3.0-generate-002
)
![]() |
![]() |
![]() |
![]() |
提示:一盤義大利麵,100 公釐微距鏡頭
模型:Imagen 3 (imagen-3.0-generate-002
)
動態
用途 | 鏡頭類型 | 焦距 | 其他詳細資料 |
---|---|---|---|
運動、野生動物 (動作) | 望遠變焦 | 100-400mm | 快速快門速度、動作或移動追蹤 |
Imagen 可以使用表格中的幾個關鍵字,生成下列動態圖片。
![]() |
![]() |
![]() |
![]() |
提示:達陣得分、快速快門速度、動作追蹤
模型:Imagen 3 (imagen-3.0-generate-002
)
![]() |
![]() |
![]() |
![]() |
提示:森林中奔跑的鹿,快速快門速度,動作追蹤
模型:Imagen 3 (imagen-3.0-generate-002
)
廣角
用途 | 鏡頭類型 | 焦距 | 其他詳細資料 |
---|---|---|---|
天文、風景 (廣角) | 廣角 | 10-24mm | 長時間曝光、焦點清晰、長時間曝光、水面或雲朵平滑 |
使用表格中的幾個關鍵字,Imagen 可以生成下列廣角圖片。
![]() |
![]() |
![]() |
![]() |
提示:an expansive mountain range, landscape wide angle 10mm
模型:Imagen 3 (imagen-3.0-generate-002
)
![]() |
![]() |
![]() |
![]() |
提示:月球相片,天文攝影,10 公釐廣角
模型:Imagen 3 (imagen-3.0-generate-002
)
後續步驟
閱讀有關 Imagen 和其他 Vertex AI 生成式 AI 產品的文章:
- 開發人員指南:開始使用 Vertex AI 中的 Imagen 3
- 專為創作者打造的全新生成式媒體模型和工具
- Gemini 新功能:自訂 Gem 和 Imagen 3 圖像生成功能
- Google DeepMind:Imagen 3 - 品質最高的文字轉圖像模型