Vertex AI 配額和限制

Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性暴增的情況。配額會限制專案可使用的Google Cloud 資源 Google Cloud 數量。配額適用於各種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制對服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或是可建立的專案數量。配額可以預防服務過載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。

Cloud Quotas 系統會執行下列操作:

在大多數情況下,如果您嘗試使用的資源超過配額,系統會封鎖資源存取權,導致您嘗試執行的工作失敗。

配額通常是在 Google Cloud 專案 層級套用。在一個專案中使用資源,不會影響另一個專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址會共用配額。

此外,Vertex AI 資源也有限制。這些限制與配額系統無關。限制無法變更。

要求配額

特定專案及支援地區的 Vertex AI 要求適用下列配額規定。舉例來說,在單一專案中,您每分鐘可於某個地區提出最多 30,000 個線上推論要求,而在另一個支援的地區每分鐘則可另外提出 30,000 個線上推論要求。

要求類型 每分鐘要求數
資源管理 (CRUD) 要求1 600
工作或長時間執行作業 (LRO) 提交要求 60
線上推論要求2 30,000
線上推論要求處理量 1.5 GB
線上說明要求 600
Vertex AI TensorBoard 時間序列讀取要求 60,000
機器學習中繼資料 (CRUD) 要求 12,000
生成式 AI 快取 (CRUD) 要求 200
Vertex AI Vizier (CRUD) 要求 6,000
Vertex AI 特徵儲存庫線上服務要求 300,000
Vertex 機器學習中繼資料要求 12,000
計算詞元數或運算詞元要求數量 3,000

1資源管理要求包括任何非工作、LRO、線上推論要求、Vertex AI Vizier 要求、ML 中繼資料要求、Vertex AI TensorBoard Timeseries Insights API 讀取要求、Vertex AI 特徵儲存庫要求、Vertex AI 特徵儲存庫串流要求或向量搜尋要求。

2 這項配額僅適用於公開端點。

工作或長時間執行的作業則包含下列要求:

  • 建立或刪除資料集。
  • 將資料匯入資料集,或是從資料集匯出資料。
  • 建立端點。
  • 建立或刪除自訂工作。
  • 建立或刪除資料標籤工作。
  • 建立或刪除超參數調整工作。
  • 建立或刪除批次推論工作。
  • 建立或刪除模型。
  • 上傳、刪除或匯出模型。
  • 建立或刪除筆記本執行階段範本。
  • 指派、刪除、啟動或升級筆記本執行階段。
  • 建立、刪除或更新模型監控器。
  • 建立或刪除模型監控工作。


如需生成式 AI 模型的配額資訊,請參閱「Vertex AI 的生成式 AI 配額和限制」。

AutoML 模型配額

特定專案或地區的各個資料類型與目標適用下列配額規定。比方說,您可以在某個專案和地區中部署 10 個 AutoML 圖片分類模型和 10 個 AutoML 圖片物件偵測模型,總計可部署 20 個模型。

圖片

分類

配額
並行訓練工作 5
並行訓練工作 (含 Explainable AI) 2
並行批次推論工作 5
並行模型部署工作 5
並行模型取消部署工作 5
已部署的模型數量 10

物件偵測

配額
並行訓練工作 5
並行批次推論工作 5
已部署的模型數量 10

表格型

配額
並行訓練工作 5
並行批次推論工作 5
已部署的模型數量 30

文字

分類

配額
並行訓練工作 5
並行批次推論工作 5
已部署的模型數量 10

實體擷取

配額
並行訓練工作 5
並行批次推論工作 5
已部署的模型數量 10

情緒分析

配額
並行訓練工作 5
並行批次推論工作 5
已部署的模型數量 10

影片

動作辨識

配額
並行訓練工作 5
並行批次推論工作 5

分類

配額
並行訓練工作 5
並行批次推論工作 5

物件追蹤

配額
並行訓練工作 5
並行批次推論工作 5

Vertex AI Model Registry

Vertex AI Model Registry 支援的最大模型大小為 1 TB。

AutoML 模型限制

特定專案或地區的各個資料類型適用下列限制。舉例來說,在特定專案和地區中,您可以在批次要求輸入內容中納入最多 1,000,000 張圖片。

圖片

限制類型
圖片檔大小 上限:30 MB
每個資料集的圖片數 上限:100 萬張
每個資料集的標籤數 下限:2 個
上限:5,000 個
每個標籤的圖片數 下限:10 張
建議:1,000 張
批次輸入 CSV 檔案大小 上限:100 MB
批次輸入圖片數 上限:100 萬張

表格

限制類型
大小上限 100 GB
列數 擁有 1,000 至 200,000,000 列的資料
欄數 擁有 2 至 1,000 個資料欄
同時執行的資料集匯入作業數量 5 次匯入
CSV 檔案大小 上限:每個檔案 10 GB,總大小上限為 100 GB

文字

以 UTF-8 字元做為計算字元數的基準。

限制類型 分類 實體擷取 情緒分析
訓練項目數量 10 至 1,000,000 50 至 100,000 10 至 100,000
每個資料集的標籤數 2 至 5,000 1 至 100 2 至 11
標籤名稱的長度 1 至 32 1 至 32 0 到 10 之間的整數
註解時距的長度 不適用 1 至 100 個字元 不適用
每個標籤的訓練項目數 10 至 1,000,000 100 至 100,000 10 至 100,000
訓練項目大小 10 MB
5,000,000 個字元
128 KB (文字);20 MB (PDF)
10 至 300,000 個字元 (文字)
128 KB (文字);2 MB (PDF)
60,000 個字元
傳送用於推論的項目 128 KB (文字);2 MB (PDF)
60,000 個字元
20 MB 128 KB (文字);2 MB (PDF)
60,000 個字元
每項批次要求的項目數 10,000 10,000 10,000

影片

限制類型
影片長度上限 3 小時
影片檔案大小上限 50 GB
每個資料集的標籤數下限 2
每個標籤的影片數下限 10 部 (建議值:1,000 部)
批次輸入的 CSV 檔案大小 上限:100 MB
批次輸入的影片片段數 上限:1,000 個

自訂訓練模型配額

特定專案或地區的 Vertex AI 自訂訓練模型適用下列配額規定。

訓練

配額
並行自訂訓練 pipeline 2,000
每個區域用於訓練的 N1 和 E2 CPU 數量
區域
us-west1 2,200
us-west2 20
us-west3 2,200
us-west4 20
us-central1 2,200
us-east1 2,200
us-east4 20
us-east5 450
us-south1 450
northamerica-northeast1 2,200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2,200
europe-west1 2,200
europe-west4 2,200
europe-west6 20
europe-west3 2,200
europe-north1 20
europe-central2 450
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 2,200
asia-southeast1 2,200
asia-southeast2 2,200
asia-east2 2,200
asia-east1 2,200
asia-northeast1 2,200
asia-northeast2 20
australia-southeast1 2,200
australia-southeast2 20
asia-northeast3 2,200
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
每個地區用於訓練的 N2 CPU 數量
區域
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
每個區域用於訓練的 M1 CPU 數量
區域
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-east5 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1 0
europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1 0
asia-south1 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
me-central1 0
me-central2 0
europe-west12 0
africa-south1 0
每個區域用於訓練的 C2 CPU 數量
區域
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 20
me-central2 20
europe-west12 20
africa-south1 20
每個地區用於訓練的 A2 CPU 數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 無限制
us-east1 無限制
us-east4 無限制
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 無限制
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 無限制
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 無限制
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於訓練的並行 A3 CPU 數量
區域
us-west1 無限制
us-west2 無限制
us-west3 無限制
us-west4 無限制
us-central1 無限制
us-east1 無限制
us-east4 無限制
us-east5 無限制
us-south1 無限制
northamerica-northeast1 無限制
northamerica-northeast2 無限制
southamerica-east1 無限制
southamerica-west1 無限制
europe-west2 無限制
europe-west1 無限制
europe-west4 無限制
europe-west6 無限制
europe-west3 無限制
europe-north1 無限制
europe-central2 無限制
europe-west8 無限制
europe-west9 無限制
europe-southwest1 無限制
asia-south1 無限制
asia-southeast1 無限制
asia-southeast2 無限制
asia-east2 無限制
asia-east1 無限制
asia-northeast1 無限制
asia-northeast2 無限制
australia-southeast1 無限制
australia-southeast2 無限制
asia-northeast3 無限制
me-west1 無限制
me-central1 無限制
me-central2 無限制
europe-west12 無限制
africa-south1 無限制
每個地區用於訓練的並行 H200 GPU 數量
區域
us-west1 0
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 0
us-east1 不適用
us-east4 8
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 0
europe-west4 不適用
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於訓練的 P4 GPU 數量
區域
us-west1 不適用
us-west2 6
us-west3 不適用
us-west4 不適用
us-central1 6
us-east1 不適用
us-east4 1
us-east5 不適用
us-south1 不適用
northamerica-northeast1 6
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 6
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 6
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 6
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於訓練的 T4 GPU 數量
區域
us-west1 2
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 12
us-east1 2
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 6
europe-west1 不適用
europe-west4 2
europe-west6 不適用
europe-west3 0
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 6
asia-southeast1 1
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 6
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 1
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區的訓練用 L4 GPU 數量
區域
us-west1 0
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 0
us-east1 0
us-east4 0
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 0
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 0
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 0
asia-southeast1 0
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 0
me-west1 不適用
me-central1 不適用
me-central2 0
europe-west12 不適用
africa-south1 不適用
每個地區用於訓練的 P100 GPU 數量
區域
us-west1 30
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 56
us-east1 30
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 30
europe-west4 不適用
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 30
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 6
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於訓練的 V100 GPU 數量
區域
us-west1 6
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 6
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 6
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 6
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於訓練的 A100 GPU 數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 8
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 8
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 8
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於訓練的並行 A100 80GB GPU 數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 0
us-east1 不適用
us-east4 0
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 0
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 0
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用

詳情請參閱「查看及管理配額」。

每個地區用於訓練的並行 H100 GPU 數量
區域
us-west1 0
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 0
us-east1 不適用
us-east4 0
us-east5 0
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 0
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 0
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 0
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域用於訓練的並行 B200 GPU 數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 0
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 不適用
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於訓練的並行 H100 Mega GPU 數量
區域
us-west1 0
us-west2 不適用
us-west3 不適用
us-west4 0
us-central1 0
us-east1 不適用
us-east4 0
us-east5 0
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 0
europe-west4 0
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 0
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 0
asia-northeast2 不適用
australia-southeast1 0
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用

詳情請參閱「查看及管理配額」。

每個區域用於訓練的 TPU V2 核心數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 8
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 8
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 8
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域用於訓練的 TPU V2 Pod 核心數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 不適用
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 不適用
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域的訓練用 TPU V3 核心數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 8
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 8
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 8
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域用於訓練的 TPU V3 Pod 核心數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 不適用
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 不適用
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
訓練期間的 HDD 用量 (GB),按區域劃分
區域
us-west1 180,000
us-west2 3,600
us-west3 180,000
us-west4 3,600
us-central1 180,000
us-east1 180,000
us-east4 3,600
us-east5 3,600
us-south1 180,000
northamerica-northeast1 180,000
northamerica-northeast2 3,600
southamerica-east1 3,600
southamerica-west1 3,600
europe-west2 180,000
europe-west1 180,000
europe-west4 180,000
europe-west6 3,600
europe-west3 180,000
europe-north1 3,600
europe-central2 180,000
europe-west8 3,600
europe-west9 180,000
europe-southwest1 3,600
asia-south1 180,000
asia-southeast1 180,000
asia-southeast2 180,000
asia-east2 180,000
asia-east1 180,000
asia-northeast1 180,000
asia-northeast2 3,600
australia-southeast1 180,000
australia-southeast2 3,600
asia-northeast3 180,000
me-west1 180,000
me-central1 3,600
me-central2 3,600
europe-west12 3,600
africa-south1 3,600
訓練期間的 SSD 用量 (GB),按區域劃分
區域
us-west1 75,000
us-west2 450
us-west3 75,000
us-west4 450
us-central1 75,000
us-east1 75,000
us-east4 450
us-east5 450
us-south1 75,000
northamerica-northeast1 75,000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75,000
europe-west1 75,000
europe-west4 75,000
europe-west6 450
europe-west3 75,000
europe-north1 450
europe-central2 75,000
europe-west8 450
europe-west9 75,000
europe-southwest1 450
asia-south1 75,000
asia-southeast1 75,000
asia-southeast2 75,000
asia-east2 75,000
asia-east1 75,000
asia-northeast1 75,000
asia-northeast2 450
australia-southeast1 75,000
australia-southeast2 450
asia-northeast3 75,000
me-west1 75,000
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
訓練期間每個區域的 Hyperdisk Balanced 用量 (GB)
區域
us-west1 75,000
us-west2 450
us-west3 450
us-west4 450
us-central1 75,000
us-east1 450
us-east4 75,000
us-east5 450
us-south1 75,000
northamerica-northeast1 450
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 450
europe-west1 75,000
europe-west4 75,000
europe-west6 450
europe-west3 450
europe-north1 450
europe-central2 450
europe-west8 450
europe-west9 450
europe-southwest1 450
asia-south1 75,000
asia-southeast1 450
asia-southeast2 450
asia-east2 450
asia-east1 450
asia-northeast1 450
asia-northeast2 450
australia-southeast1 450
australia-southeast2 450
asia-northeast3 450
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450

供應

配額
已部署的自訂模型副本數量 100
每個區域的服務 CPU 數量
區域
us-west1 2,200
us-west2 2,200
us-west3 2,200
us-west4 16
us-central1 2,200
us-east1 2,200
us-east4 2,200
us-east5 16
us-south1 450
northamerica-northeast1 2,200
northamerica-northeast2 450
southamerica-east1 2,200
southamerica-west1 450
europe-west2 2,200
europe-west1 2,200
europe-west4 2,200
europe-west6 2,200
europe-west3 2,200
europe-north1 16
europe-central2 450
europe-west8 16
europe-west9 16
europe-southwest1 16
asia-south1 2,200
asia-southeast1 2,200
asia-southeast2 2,200
asia-east2 2,200
asia-east1 2,200
asia-northeast1 2,200
asia-northeast2 16
australia-southeast1 2,200
australia-southeast2 16
asia-northeast3 2,200
me-west1 450
me-central1 16
me-central2 16
europe-west12 16
africa-south1 16
每個地區用於服務的並行 H200 GPU 數量
區域
us-west1 0
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 0
us-east1 不適用
us-east4 0
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 0
europe-west4 不適用
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於服務的 P100 GPU 數量
區域
us-west1 30
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 56
us-east1 30
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 30
europe-west4 不適用
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 30
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於服務的 P4 GPU 數量
區域
us-west1 不適用
us-west2 6
us-west3 不適用
us-west4 不適用
us-central1 6
us-east1 不適用
us-east4 6
us-east5 不適用
us-south1 不適用
northamerica-northeast1 6
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 6
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 6
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 6
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域的服務用 T4 GPU 數量
區域
us-west1 12
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 12
us-east1 12
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 12
europe-west1 不適用
europe-west4 12
europe-west6 不適用
europe-west3 0
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 6
asia-southeast1 6
asia-southeast2 不適用
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 6
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域用於服務的 L4 GPU 數量
區域
us-west1 28
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 28
us-east1 28
us-east4 28
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 28
asia-southeast2 不適用
asia-east2 不適用
asia-east1 28
asia-northeast1 28
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於服務的 V100 GPU 數量
區域
us-west1 6
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 6
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 6
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域用於服務的 A100 GPU 數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 14
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 14
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 14
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 14
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 14
me-west1 1
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個地區用於服務的 A100 80GB GPU 數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 1
us-east1 不適用
us-east4 1
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 1
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 1
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域用於服務的並行 B200 GPU 數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 0
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 不適用
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域的 H100 GPU 數量 (用於提供服務)
區域
us-west1 8
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 8
us-east1 不適用
us-east4 0
us-east5 不適用
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 8
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 8
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域用於服務的 H100 Mega GPU 數量
區域
us-west1 0
us-west2 不適用
us-west3 不適用
us-west4 0
us-central1 0
us-east1 不適用
us-east4 0
us-east5 0
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 0
europe-west4 0
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 0
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 0
asia-northeast2 不適用
australia-southeast1 0
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域的服務用 v5e TPU 晶片數量
區域
us-west1 4
us-west2 不適用
us-west3 不適用
us-west4 0
us-central1 16
us-east1 不適用
us-east4 不適用
us-east5 不適用
us-south1 0
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 0
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 不適用
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用
每個區域的服務用 v6e TPU 晶片數量
區域
us-west1 不適用
us-west2 不適用
us-west3 不適用
us-west4 不適用
us-central1 不適用
us-east1 0
us-east4 不適用
us-east5 0
us-south1 不適用
northamerica-northeast1 不適用
northamerica-northeast2 不適用
southamerica-east1 不適用
southamerica-west1 不適用
europe-west2 不適用
europe-west1 不適用
europe-west4 0
europe-west6 不適用
europe-west3 不適用
europe-north1 不適用
europe-central2 不適用
europe-west8 不適用
europe-west9 不適用
europe-southwest1 不適用
asia-south1 不適用
asia-southeast1 不適用
asia-southeast2 不適用
asia-east2 不適用
asia-east1 不適用
asia-northeast1 0
asia-northeast2 不適用
australia-southeast1 不適用
australia-southeast2 不適用
asia-northeast3 不適用
me-west1 不適用
me-central1 不適用
me-central2 不適用
europe-west12 不適用
africa-south1 不適用

自訂訓練模型限制

特定專案或地區的 Vertex AI 自訂訓練模型適用下列限制。

供應

限制
每項專案的副本數 200
每個叢集的容器數 25,000

Vertex AI 特徵儲存庫

本節列出下列項目的配額與限制:

Vertex AI 特徵儲存庫

特定專案或地區適用下列配額規定。舉例來說,在單一專案中,您可以在 us-central1 中有 200 個線上服務節點,在 us-east4 中則有另外 50 個節點。

配額
每分鐘線上服務要求數 300,000
FeatureOnlineStore 執行個體數量上限 10
每分鐘的搜尋要求次數上限 6,000,000
專案中所有最佳化 FeatureOnlineStore 執行個體的線上服務節點數量上限 80
所有 FeatureOnlineStore 執行個體中的 FeatureView 執行個體數量上限 30

Vertex AI 特徵儲存庫也有下列限制。您無法要求提高下表中的任何限制:

限制
專案和位置的 FeatureGroup 資源數量上限 250
FeatureGroup 中的 Feature 資源數量上限 10,000
每個實體的特徵資料大小上限 5 MB
每個線上放送要求中的實體 ID 數量 (FetchFeatureValues) 1
實體 ID 長度上限 4,076 個字元
最佳化線上提供節點的儲存空間限制 200 GB

Vertex AI 特徵儲存庫 (舊版)

特定專案或地區適用下列配額規定。舉例來說,在單一專案中,您可以在 us-central1 中執行 75 項並行批次工作,在 europe-west4 中執行另外 75 項工作。

配額
每分鐘線上服務要求數 300,000
每分鐘串流擷取要求數 60,000
每分鐘串流擷取寫入處理量 1.2 GB
每分鐘特徵建立要求數 100
所有特徵商店的線上供應節點 30
並行批次工作 (包括擷取、提供和刪除特徵值) 75
並行刪除特徵值的要求 1
所有特徵商店的實體類型 75

Vertex AI 特徵儲存庫 (舊版) 也有下列限制。您無法要求提高下表中的任何限制:

限制
線上供應節點的儲存空間上限 5 TB
離線商店中的資料總量 無限制
每個實體類型的特徵 5,000
每個專案在每個區域每天建立、更新及刪除特徵商店的要求次數 500
串流擷取作業的單次要求大小 1 MB
串流讀取時,每個要求可包含的實體數量 100
批次匯入時,每項要求可納入的檔案數量 Avro 格式為 5,000 個,CSV 格式為 500 個
批次供應和匯出作業可要求的功能數量 5,000
如為批次擷取和串流擷取,可擷取特徵資料的最舊時間戳記 自目前日期起 4,000 天

Vertex AI 特徵儲存庫 (舊版) 的資料保留期限預設值如下,您可以覆寫這些值:

資料保留預設值 預設值
離線儲存庫中的資料保留期限 (系統會刪除超過此期限的特徵值) 自目前日期起 4,000 天
線上商店中的資料保留期限 (系統會刪除超過保留期限的特徵值) 自目前日期起 4,000 天

您可以透過下列方式覆寫資料保留期限:

  • 如要覆寫線上商店的資料保留期限,請在建立或更新特徵儲存庫時設定 online_storage_ttl_days 參數。

  • 如要覆寫離線商店的資料保留期限,請在建立或更新實體類型時設定 offline_storage_ttl_days 參數。

特定專案在各個區域的 Vector Search 適用下列配額規定。

配額
並行建立索引作業 5
並行索引更新作業 5
已部署的索引節點數 50
已部署的索引 N2D 節點數量 5
索引編號 100
每分鐘串流更新要求數 6,000
每分鐘的串流更新輸送量(以 KB 為單位) 120,000

Vertex 機器學習中繼資料

下列限制適用於各區域中特定專案的 Vertex 機器學習中繼資料。

限制
資源中繼資料欄位的序列化大小上限 204,800 個位元組
中繼資料結構定義的序列化大小上限 204,800 個位元組

Vertex AI Pipelines

特定專案在各個區域的 Vertex AI Pipelines 適用下列配額和限制。

配額
平行執行管道工作* 600
並行管道執行作業* 300

* 超過此限制的管道執行和工作要求會排入佇列,直到資源可用為止。

Vertex AI Pipelines 設有下列限制。請注意,與配額不同,您無法要求提高限制。

限制
每個工作的工作管線工作數 10,000
每個管道工作的輸入和輸出構件 100
每個管道作業的輸入和輸出構件 10,000
每個管道工作包含輸出參數和構件的 JSON 酬載大小上限 131,072 個位元組
管道工作的執行時間上限** 7 天

* 超出這項限制的 pipeline 工作會遭到取消。

Colab Enterprise 配額與限制

Colab Enterprise 的配額和限制會另外列出。請參閱「Colab Enterprise 配額與限制」。

增加配額

如要增加任何 Vertex AI 的配額,可以透過 Google Cloud 控制台申請提高配額。

如要進一步瞭解如何提交配額提高要求,請參閱「查看及管理配額」的下列章節:

各區域和模型的配額

在 Google Cloud 控制台中查看及編輯配額

如要在 Google Cloud 控制台中查看及編輯配額,請按照下列步驟操作:
  1. 前往「配額與系統限制」頁面。
  2. 前往「配額與系統限制」頁面

  3. 如要調整配額,請複製並貼上「Filter」(篩選條件) 中的屬性 aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model。按下 Enter 鍵。
  4. 按一下資料列末尾的三點圖示,然後選取「編輯配額」
  5. 在窗格中輸入新的配額值,然後按一下「提交要求」

依區域和模型查看每分鐘要求數 (RPM) 配額

根據預設,2.0 以上版本的模型會使用動態共用配額 (DSQ)

選擇區域即可查看各可用模型的配額:

提高配額

如要增加任何 Vertex AI 的生成式 AI 配額,可以透過 Google Cloud 控制台申請提高配額。

RAG Engine 配額

如要讓各項服務使用 RAG 引擎執行檢索增強生成 (RAG),請遵守下列配額規定,配額以每分鐘要求數 (RPM) 計算。
服務 配額 指標
RAG Engine 資料管理 API 60 RPM VertexRagDataService requests per minute per region
RetrievalContexts 個 API 1,500 RPM VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1,500 RPM Online prediction requests per base model per minute per region per base_model

您可以指定的額外篩選條件為 base_model: textembedding-gecko
以下限制適用於這類要求:
服務 限制 指標
並行 ImportRagFiles 要求 3 RPM VertexRagService concurrent import requests per region
每個 ImportRagFiles 要求的檔案數量上限 10,000 VertexRagService import rag files requests per region

如要瞭解更多頻率限制和配額,請參閱「Vertex AI 的生成式 AI 頻率限制」。

批次要求

所有區域的批次推論工作配額和限制都相同。

Gemini 模型並行批次推論工作限制

Gemini 模型沒有預先定義的批次推論配額限制。而是提供大量共用資源,並根據模型即時可用性,以及所有客戶對該模型的需求,動態分配資源。如果活躍客戶人數增加,導致模型容量飽和,您的批次要求可能會排隊等待容量。

並行批次推論工作配額

下表列出並行批次推論作業數量的配額,不適用於 Gemini 模型:
配額
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs 4
如果提交的工作數量超過分配的配額,系統會將工作排入佇列,並在配額容量可用時處理工作。

自訂訓練模型配額

特定專案和區域的 Generative AI on Vertex AI 微調模型適用下列配額:
配額
每個地區的受限圖片訓練 TPU V3 Pod 核心
* 支援的地區 - europe-west4
64
受限的圖像訓練 Nvidia A100 80GB GPU (每個區域)
* 支援的區域 - us-central1
* 支援的區域 - us-east4

8
2
* 調整情境在特定區域有加速器預留資源。支援微調的配額,但必須在特定區域提出要求。

文字嵌入限制

每項文字嵌入模型要求最多可有 250 個輸入文字 (每個輸入文字產生 1 個嵌入) 和 20,000 個權杖。系統只會使用每個輸入文字的前 2,048 個符記計算嵌入。對於 gemini-embedding-001,每項要求只能包含單一輸入文字。這個模型的配額會列在名稱 gemini-embedding 下方。

每分鐘每個基礎模型嵌入內容輸入的權杖數

與先前主要受 RPM 配額限制的嵌入模型不同,Gemini 嵌入模型的配額會限制每個專案每分鐘可傳送的權杖數量。

配額
每分鐘嵌入內容輸入權杖數 200000

Gen AI Evaluation Service 服務配額

Gen AI Evaluation Service 會使用 gemini-2.0-flash 做為模型評估指標的預設評估模型。以模型為基礎的指標單一評估要求,可能會導致對 Gen AI Evaluation Service 提出多個基礎要求。系統會根據每個專案計算各模型的配額,也就是說,凡是導向 gemini-2.0-flash 的模型推論和模型評估要求,都會計入配額。下表列出 Gen AI Evaluation Service 和基礎評估模型適用的配額:
要求配額 預設配額
每分鐘的 Gen AI Evaluation Service 要求數 每個區域每項專案 1,000 個要求
每分鐘線上預測要求數 (
base_model: gemini-2.0-flash)
請參閱各區域和模型的配額

如果您在使用 Gen AI 評估服務時收到配額相關錯誤,可能需要提出配額提高要求。詳情請參閱「查看及管理配額」。

限制
Gen AI Evaluation Service 請求逾時 60 秒

在新的專案中首次使用生成式 AI 評估服務時,初始設定可能會延遲最多兩分鐘。如果第一次要求失敗,請稍候幾分鐘再重試。後續的評估要求通常會在 60 秒內完成。

模型指標的輸入和輸出權杖上限取決於用來做為評估模型的模型。如需型號清單,請參閱 Google 型號

管道評估配額

如果在評估管道服務中收到配額相關錯誤,可能需要提出配額增加要求。詳情請參閱「查看及管理配額」。 評估管道服務會使用 Vertex AI Pipelines 執行 PipelineJobs。請參閱 Vertex AI Pipelines 的相關配額。以下是一般配額建議:
服務 配額 建議
Vertex AI API 每個區域的並行 LLM 批次預測工作 逐點:1 * num_concurrent_pipelines

逐對:2 * num_concurrent_pipelines
Vertex AI API 每個區域每分鐘的評估要求數量 1000 * num_concurrent_pipelines
此外,以模型為基準的指標相關配額取決於您使用的評估模型:
Tasks 配額 基礎模型 建議
summarization
question_answering
每個基礎模型每分鐘的線上預測要求數 (每個區域) text-bison 60 * num_concurrent_pipelines

Vertex AI Agent Engine

下列限制適用於各區域中特定專案的 Vertex AI Agent Engine
說明 限制
每分鐘建立、刪除或更新 Vertex AI Agent Engine 10
每分鐘建立、刪除或更新 Vertex AI Agent Engine 工作階段 100
每分鐘建立、刪除或更新 Vertex AI Agent Engine 工作階段 100
QueryStreamQuery Vertex AI Agent Engine 每分鐘 60
每分鐘將事件附加至 Vertex AI Agent Engine 工作階段 100
Vertex AI Agent Engine 資源數量上限 100
每分鐘建立、刪除或更新 Vertex AI Agent Engine 記憶體資源 100
每分鐘從 Vertex AI Agent Engine Memory Bank 取得、列出或擷取資料 300

排解錯誤代碼 429

如要排解 429 錯誤,請參閱「錯誤代碼 429」。

後續步驟