Cloud TPU 配額

本文件列出 Cloud TPU 適用的配額。如要瞭解 Cloud TPU 的定價,請參閱「Cloud TPU 定價」。

Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性的尖峰情形。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量。配額適用於多種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制向服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或可建立的專案數量。限制配額可預防服務超載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。

Cloud 配額系統會執行以下作業:

在大多數情況下,如果您嘗試使用的資源超過配額限制,系統會封鎖對該資源的存取權,而您嘗試執行的任務也會失敗。

配額通常會套用至 Google Cloud 專案層級。您在一個專案中使用資源,不會影響其他專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址都會共用配額。

TPU 配額

TPU 配額是指在Google Cloud 專案中可使用的 Cloud TPU 核心數量限制。每個 TPU 版本都會與專屬配額相關聯。此外,每個 Cloud TPU 版本的配額分為隨選配額和先占 (或即時) 配額。

建立 Cloud TPU 資源時,系統預設會建立隨選資源。使用 gcloud 指令建立資源時,您可以使用 --spot 參數建立可先佔資源。詳情請參閱「管理 TPU 資源」。

預設 Cloud TPU 配額

下表列出每個可用區域的隨選和先占配額預設值。這些值會指定專案中可使用的 TPU 核心數量上限。

先占配額

TPU 版本 預設配額 (核心數量) 配額名稱
v6e 1536 個核心 每個可用區中每個專案的先占 TPU v6e 核心
v5p 768 個核心 每個可用區中每個專案的先占 TPU v5p 核心
v5e 1536 個核心 每個可用區中每項專案的先占 TPU v5 Lite Pod 核心
v4 0 個核心 每個區域中每個專案的先占 TPU v4 Pod 核心
v3 Pod 32 個核心 每個可用區中每個專案的先占 TPU v3 Pod 核心
v3 120 個核心 每個可用區中每項專案的先占 TPU v3 核心
v2 Pod 32 個核心 每個區域中每個專案的先占 TPU v2 Pod 核心
v2 120 個核心 每個可用區中每個專案的先占 TPU v2 核心

以量計價配額

TPU 版本 預設配額 (核心數量) 配額名稱
v6e 512 個核心 每個可用區中每個專案的 TPU v6e 核心
v5p 128 個核心 每個可用區中每項專案的 TPU v5p 核心
v5e 512 個核心 每個區域中每個專案的 TPU v5 Lite Pod 核心數
v4 0 個核心 每個區域中每個專案的 TPU v4 Pod 核心
v3 Pod 32 個核心 每個區域中每個專案的 TPU v3 Pod 核心
v3 40 個核心 每個區域中每個專案的 TPU v3 核心
v2 Pod 32 個核心 每個區域中每個專案的 TPU v2 Pod 核心
v2 40 個核心 每個可用區中每個專案的 TPU v2 核心

查看及要求額外配額

您可以在 Google Cloud 控制台的「配額」頁面上,查看 Google Cloud 專案分得的配額。

您可以透過「配額」頁面申請額外的 Cloud TPU 配額。找出要增加的配額,按一下三個垂直點,然後選擇「編輯配額」。詳情請參閱「要求提高配額限制」。如果您要求的配額低於自動核准門檻,系統會自動核准您的要求。

先占配額

TPU 版本 自動核准門檻 配額名稱
v6e 所有可用區:0 個核心 每個可用區中每個專案的先占 TPU v6e 核心
v5p 所有可用區:0 個核心 每個可用區中每個專案的先占 TPU v5p 核心
v5e
  • us-east5-b:800 個核心
  • us-west4-a:1600 個核心
  • us-west4-b:3968 個核心
  • us-west1-c:576 個核心
  • us-central1-a:3264 個核心
  • europe-west4-a:4032 個核心
每個可用區中每項專案的先占 TPU v5 Lite Pod 核心
v4 所有可用區:0 個核心 每個區域中每個專案的先占 TPU v4 Pod 核心
v3 Pod
  • europe-west4-a:512 個核心
  • us-east1-d:320 個核心
每個可用區中每個專案的先占 TPU v3 Pod 核心
v3
  • us-central1-a:64 個核心
  • europe-west4-a:128 個核心
每個可用區中每項專案的先占 TPU v3 核心
v2 Pod
  • us-central1-a:64 個核心
  • europe-west4-a:64 個核心
每個區域中每個專案的先占 TPU v2 Pod 核心
v2
  • us-central1-b:128 個核心
  • us-central1-c:64 個核心
  • us-central1-f:128 個核心
  • europe-west4-a:32 個核心
每個可用區中每個專案的先占 TPU v2 核心

以量計價配額

TPU 版本 自動核准門檻 配額名稱
v6e 所有可用區:0 個核心 每個可用區中每個專案的 TPU v6e 核心
v5p us-east5-a:64 個核心 每個可用區中每項專案的 TPU v5p 核心
v5e 所有區域:64 個核心 每個區域中每個專案的 TPU v5 Lite Pod 核心數
v4 所有可用區:0 個核心 每個區域中每個專案的 TPU v4 Pod 核心
v3 Pod
  • europe-west4-a:128 個核心
  • us-east1-d:64 個核心
每個區域中每個專案的 TPU v3 Pod 核心
v3
  • us-central1-a:64 個核心
  • europe-west4-a:128 個核心
每個區域中每個專案的 TPU v3 核心
v2 Pod
  • us-central1-a:64 個核心
  • europe-west4-a:64 個核心
每個區域中每個專案的 TPU v2 Pod 核心
v2
  • us-central1-b:128 個核心
  • us-central1-c:64 個核心
  • us-central1-f:128 個核心
  • europe-west4-a:32 個核心
每個可用區中每個專案的 TPU v2 核心

我們會透過電子郵件通知您配額要求是否獲得核准。Google Cloud 服務配額會逐步增加。這可能會導致在不同區域或資源中持續推出。在推出期間, Google Cloud 控制台或 Cloud 配額 API 中顯示的配額值不會反映新的、已增加的配額值,直到推出作業完成為止。詳情請參閱「查看目前的推播狀態」。