本指南列出使用生成式 AI 模型 API 參考資料時可能遇到的錯誤。這些錯誤遵循 Google Cloud API 的錯誤模型,建議我們提供生成式 AI 模型專屬的原因和解決方案指南。
API 錯誤
下表提供 API 錯誤代碼和說明。
HTTP 錯誤代碼 | 標準化錯誤代碼 | 原因 | 範例 | 解決方案 |
---|---|---|---|---|
400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
要求未通過 API 驗證,或是您嘗試存取需要加入允許清單的模型,或機構政策禁止使用的模型。 | 要求超出模型的輸入權杖限制。 | 如需要求參數、權杖計數和其他參數,請參閱生成式 AI 的模型 API 參考資料 。 |
403 | PERMISSION_DENIED |
用戶端權限不足,無法呼叫 API。 | 服務帳戶沒有權限存取儲存圖片或影片資源的 Cloud Storage 值區。 | 1. 確認已啟用所有必要的 API,且服務帳戶具備存取所選 Vertex AI 服務的正確權限。 2. 系統會授予 Vertex AI 每個產品、每個專案的服務帳戶 (P4SA) 必要權限,以存取輸入內容中參照的資源。 |
404 | NOT_FOUND |
在指定網址找不到有效物件。 | 在儲存空間網址中找不到圖片檔案。 | 檢查並修正檔案位置。 |
429 | RESOURCE_EXHAUSTED |
視錯誤訊息而定,錯誤可能由下列原因造成: 1. API 配額超過上限。 2. 共用伺服器容量導致伺服器超載。 3. 您已達到使用 logprobs 的每日要求次數上限。 |
Gemini API 超出每分鐘要求數上限。 | 1. 請查看 Vertex AI Generative AI 配額限制。如有需要,請申請更多配額。 2. 請稍後再試。如果錯誤持續發生一段時間 (數小時),請與 Vertex AI 支援團隊聯絡。 3. 建議購買「佈建的處理量」。 |
499 | CANCELLED |
用戶端已取消要求。 | ||
500 | UNKNOWN / INTERNAL |
伺服器超載或依附元件故障,導致伺服器發生錯誤。 | 服務暫時超載,因此要求受到限制。 | 請稍後再試。如果錯誤持續發生一段時間 (數小時),請與 Vertex AI 支援團隊聯絡。 |
503 | UNAVAILABLE |
這項服務暫時無法使用。 | 伺服器未回應傳入的要求。 | 「無法使用」狀態可能只是暫時的。不過,如果錯誤持續發生,請與 Vertex AI 支援團隊聯絡。 |
504 | DEADLINE_EXCEEDED |
用戶端設定的期限短於伺服器的預設期限 (10 分鐘),且要求未在用戶端提供的期限內完成。 | 建議延長客戶提供的期限。 |
處理錯誤
避免流量突然爆增。尖峰是指在極短時間內,要求數量突然大幅增加。有時流量暴增可能會導致配額強制執行問題,並增加伺服器過載的機率。
請謹慎重試事件。建議最多重試兩次。延遲時間下限為一秒,後續要求會以指數方式輪詢。
後續步驟
- Vertex AI 生成式 AI 有一些限制。詳情請參閱「PaLM API 限制」。
- 使用 Vertex AI Studio 或 Vertex AI API 進行快速入門教學課程。
- 探索 Model Garden 中的預先訓練模型。
- 瞭解配額與限制。
- 瞭解定價。