排解資源可用性錯誤


本文說明如何解決嘗試要求新的 Compute Engine 資源或建立 Compute Engine 資源預留時,可能發生的資源可用性錯誤。當您嘗試在可用區中要求資源,但因目前無法使用 Compute Engine 資源 (例如 GPU 或 CPU),而無法滿足要求時,就會發生資源錯誤。

資源錯誤只會套用至區域中的新資源要求,不會影響現有資源。資源錯誤與 Compute Engine 配額無關,且只會套用至您在傳送要求時指定的資源,而不會套用至區域中的所有資源。

常見錯誤訊息

以下是您在要求新的 Compute Engine 資源或建立新的保留項目時,可能會遇到的常見資源錯誤:

ZONE_RESOURCE_POOL_EXHAUSTED
ZONE_RESOURCE_POOL_EXHAUSTED_WITH_DETAILS
The zone 'projects/PROJECT_ID/zones/ZONE' does not have enough resources available to fulfill the request.
Try a different zone, or try again later.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone.

Capacity changes frequently, so try your request in a different zone, with a different VM hardware
configuration, or at a later time. For more options, see troubleshooting documentation.
A VM_TYPE_AND_SIZE VM instance with RESOURCE_ATTACHMENT is currently unavailable in the ZONE zone, because of  REASON.

Consider trying your request in the ZONE zone(s), which currently has capacity to accommodate your request.

If you cannot move your VM to ZONE, review the REASON failure resolution instructions available in troubleshooting documentation, then try your request again.
If your workload can't accommodate the suggested resolution, try your request with a different VM hardware configuration or at a later time.

部分錯誤訊息會包含 reason 欄位,提供 Compute Engine 無法滿足您要求的特定資源相關資訊。請參閱本文件的「資源錯誤原因和建議」一節,進一步瞭解發生資源錯誤的原因,以及每個錯誤的解決策略 reason

解決資源錯誤

一般來說,解決資源錯誤的最佳做法是在不同的區域、時間或 VM 設定下重試要求。如果收到的錯誤訊息包含 reason 欄位,請參閱本文件的「資源錯誤原因和建議」一節,瞭解如何解決錯誤。

如果您嘗試建立含 GPU VM 的區域代管執行個體群組 (MIG),請在 MIG 中建立調整大小要求。大小調整要求可在 MIG 中一次取得大量需求的資源,並在特定時間內執行 VM。指定執行時間長度可提高高需求資源的可取得性,並避免不必要的費用。

如果您要建立區域性 MIG,請嘗試將 MIG 分發形狀變更為 BALANCEDANYANY_SINGLE_ZONE。如要進一步瞭解分配型態,請參閱「區域性 MIG 目標分配型態」。

如果您嘗試建立 Spot VM (或舊版先占 VM),請記住,這些 VM 是備用容量,不受控且不穩定,因此可能無法在尖峰需求期間取得。因此,Spot VM 只適用於不受時間、地點和 VM 設定要求限制的工作負載。您可以遵循最佳做法,讓工作負載更具彈性,藉此避免 Spot VM 發生此錯誤。如果這個錯誤持續發生,請改用標準 VM

如要避免資源錯誤,最佳做法是在需要資源之前建立 Compute Engine 預訂。預訂功能有助於確保您在需要時可以使用資源。

資源錯誤原因和最佳化建議

下表提供部分資源錯誤訊息中 reason 欄位的相關資訊,以及每個 reason 的解決策略建議。

錯誤 reason 說明 建議
resource_availability 您要求的 VM 類型和大小目前無法在您要求的可用區中使用。

請嘗試下列任一做法:

  • 要求其他區域的 VM。
  • 如果您在要求 a3-highgpu-1ga3-highgpu-2ga3-highgpu-4g 機器類型時收到資源供應情形錯誤,請確認您是使用這些支援的方法之一來佈建 VM。
cpu_availability 您要求的可用區中,目前無法提供您要求的 CPU 數量。

請嘗試下列任一做法:

  • 如果您要求單一 VM,請要求位於其他區域的 VM。
  • 如果您要要求多個 VM,請嘗試下列一或多項操作:

    • 要求其他區域中的 VM。
    • 將 vCPU 總數分配給較小的 VM。舉例來說,如果您要求 80 個含有 224 個 vCPU 的 VM,請嘗試要求 160 個含有 128 個 vCPU 的 VM。
memory_availability 您要求的可用區目前無法提供記憶體大小相符的 VM。

請嘗試下列任一做法:

  • 如果您要求單一 VM,請要求位於其他區域的 VM。
  • 如果您要要求多個 VM,請嘗試下列一或多項操作:

    • 要求其他區域中的 VM。
    • 將記憶體要求分割成多個 VM。舉例來說,如果您要求三個 VM,每個 VM 的記憶體為 1.88 TB,請將要求分成多個 VM,總記憶體總和為 1.88 TB。
local_ssd_availability 您要求的本機 SSD 容量 VM 目前無法在您要求的區域中使用。

請嘗試下列任一做法:

  • 如果您要求單一 VM,請要求位於其他區域的 VM。
  • 如果您要要求多個 VM,請嘗試下列一或多項操作:

    • 要求其他區域中的 VM。
    • 如果工作負載允許,請要求可用區或區域性 SSD 永久磁碟,而非本機 SSD。
    • 將本機 SSD 要求分割為多個 VM。舉例來說,如果您要求一個 VM 有 600 GB 的本機 SSD,請將要求分成多個 VM,讓這些 VM 的本機 SSD 總容量達到 600 GB。
gpu_availability 您要求的可用區目前無法提供含有您要求 GPU 的 VM。 請嘗試在其他區域要求 VM。
configuration_availability 您要求的 VM 在您指定的區域中不支援所要求的設定。

請在支援所需機器類型和設定的可用區中重試要求。

如要進一步瞭解各地區和區域支援哪些機器類型,請參閱「可用的地區和區域」。如要進一步瞭解各機器類型支援的設定,請參閱機器系列比較

如果您無法透過上述任何解決建議解決錯誤,請嘗試取得支援