Cloud TPU 配額
本文件列出 Cloud TPU 適用的配額。如要瞭解 Cloud TPU 的定價,請參閱「Cloud TPU 定價」。
Google Cloud 會使用配額來確保公平性,並減少資源使用量和可用性的尖峰情形。配額會限制 Google Cloud 專案可使用的Google Cloud 資源數量。配額適用於多種資源類型,包括硬體、軟體和網路元件。舉例來說,配額可以限制向服務發出的 API 呼叫數、專案並行使用的負載平衡器數量,或可建立的專案數量。限制配額可預防服務超載,進而保障Google Cloud 使用者社群的權益。配額也能協助您管理自己的 Google Cloud 資源。
Cloud 配額系統會執行以下作業:
在大多數情況下,如果您嘗試使用的資源超過配額限制,系統會封鎖對該資源的存取權,而您嘗試執行的任務也會失敗。
配額通常會套用至 Google Cloud 專案層級。您在一個專案中使用資源,不會影響其他專案的可用配額。在 Google Cloud 專案中,所有應用程式和 IP 位址都會共用配額。
TPU 配額
TPU 配額是指在Google Cloud 專案中可使用的 Cloud TPU 核心數量限制。每個 TPU 版本都會與專屬配額相關聯。此外,每個 Cloud TPU 版本的配額分為隨選配額和先占 (或即時) 配額。
建立 Cloud TPU 資源時,系統預設會建立隨選資源。使用 gcloud
指令建立資源時,您可以使用 --spot
參數建立可先佔資源。詳情請參閱「管理 TPU 資源」。
預設 Cloud TPU 配額
下表列出每個可用區域的隨選和先占配額預設值。這些值會指定專案中可使用的 TPU 核心數量上限。
先占配額
TPU 版本 | 預設配額 (核心數量) | 配額名稱 |
---|---|---|
v6e | 1536 個核心 | 每個可用區中每個專案的先占 TPU v6e 核心 |
v5p | 768 個核心 | 每個可用區中每個專案的先占 TPU v5p 核心 |
v5e | 1536 個核心 | 每個可用區中每項專案的先占 TPU v5 Lite Pod 核心 |
v4 | 0 個核心 | 每個區域中每個專案的先占 TPU v4 Pod 核心 |
v3 Pod | 32 個核心 | 每個可用區中每個專案的先占 TPU v3 Pod 核心 |
v3 | 120 個核心 | 每個可用區中每項專案的先占 TPU v3 核心 |
v2 Pod | 32 個核心 | 每個區域中每個專案的先占 TPU v2 Pod 核心 |
v2 | 120 個核心 | 每個可用區中每個專案的先占 TPU v2 核心 |
以量計價配額
TPU 版本 | 預設配額 (核心數量) | 配額名稱 |
---|---|---|
v6e | 512 個核心 | 每個可用區中每個專案的 TPU v6e 核心 |
v5p | 128 個核心 | 每個可用區中每項專案的 TPU v5p 核心 |
v5e | 512 個核心 | 每個區域中每個專案的 TPU v5 Lite Pod 核心數 |
v4 | 0 個核心 | 每個區域中每個專案的 TPU v4 Pod 核心 |
v3 Pod | 32 個核心 | 每個區域中每個專案的 TPU v3 Pod 核心 |
v3 | 40 個核心 | 每個區域中每個專案的 TPU v3 核心 |
v2 Pod | 32 個核心 | 每個區域中每個專案的 TPU v2 Pod 核心 |
v2 | 40 個核心 | 每個可用區中每個專案的 TPU v2 核心 |
查看及要求額外配額
您可以在 Google Cloud 控制台的「配額」頁面上,查看 Google Cloud 專案分得的配額。
您可以透過「配額」頁面申請額外的 Cloud TPU 配額。找出要增加的配額,按一下三個垂直點,然後選擇「編輯配額」。詳情請參閱「要求提高配額限制」。如果您要求的配額低於自動核准門檻,系統會自動核准您的要求。
先占配額
TPU 版本 | 自動核准門檻 | 配額名稱 |
---|---|---|
v6e | 所有可用區:0 個核心 | 每個可用區中每個專案的先占 TPU v6e 核心 |
v5p | 所有可用區:0 個核心 | 每個可用區中每個專案的先占 TPU v5p 核心 |
v5e |
|
每個可用區中每項專案的先占 TPU v5 Lite Pod 核心 |
v4 | 所有可用區:0 個核心 | 每個區域中每個專案的先占 TPU v4 Pod 核心 |
v3 Pod |
|
每個可用區中每個專案的先占 TPU v3 Pod 核心 |
v3 |
|
每個可用區中每項專案的先占 TPU v3 核心 |
v2 Pod |
|
每個區域中每個專案的先占 TPU v2 Pod 核心 |
v2 |
|
每個可用區中每個專案的先占 TPU v2 核心 |
以量計價配額
TPU 版本 | 自動核准門檻 | 配額名稱 |
---|---|---|
v6e | 所有可用區:0 個核心 | 每個可用區中每個專案的 TPU v6e 核心 |
v5p | us-east5-a:64 個核心 | 每個可用區中每項專案的 TPU v5p 核心 |
v5e | 所有區域:64 個核心 | 每個區域中每個專案的 TPU v5 Lite Pod 核心數 |
v4 | 所有可用區:0 個核心 | 每個區域中每個專案的 TPU v4 Pod 核心 |
v3 Pod |
|
每個區域中每個專案的 TPU v3 Pod 核心 |
v3 |
|
每個區域中每個專案的 TPU v3 核心 |
v2 Pod |
|
每個區域中每個專案的 TPU v2 Pod 核心 |
v2 |
|
每個可用區中每個專案的 TPU v2 核心 |
我們會透過電子郵件通知您配額要求是否獲得核准。Google Cloud 服務配額會逐步增加。這可能會導致在不同區域或資源中持續推出。在推出期間, Google Cloud 控制台或 Cloud 配額 API 中顯示的配額值不會反映新的、已增加的配額值,直到推出作業完成為止。詳情請參閱「查看目前的推播狀態」。