配額管理最佳做法

本頁面說明管理 Cloud Healthcare API 配額的最佳做法。如果您的 Google Cloud 專案有或可能會有大量流量,且需要的配額超過 Cloud Healthcare API 預設提供的配額,請使用這個頁面。

Cloud Healthcare API 的預設配額

Cloud Healthcare API 的預設配額並非適用於所有用途,特別是如果您的 Google Cloud 專案有大量流量。Cloud Healthcare API 不會自動增加配額。您必須規劃及監控配額用量。

監控及查看配額的最佳做法

查看配額使用量的方法有很多種。在估算及查看 Cloud Healthcare API 配額時,建議您使用服務配額模型。您可以根據下列條件,使用模型準確評估可用的配額:

  • 是否存在管理員覆寫值。在機構中獲得「配額管理員」角色的授權主體,可以對機構內Google Cloud 專案中的配額套用管理員覆寫值。管理員覆寫值會取代預設限制和生產端覆寫值。
  • 是否存在製作端覆寫值。服務擁有者會將產生者覆寫值授予服務的消費者。 Google Cloud 是 Cloud Healthcare API 服務的服務擁有者。 Google Cloud 提供的任何配額覆寫值都是供應端覆寫值。

  • 是否存在消費者覆寫值。向 Cloud Healthcare API 提出要求的使用者,就是 Cloud Healthcare API 服務的消費者。您可以針對各種情況套用消費者覆寫值,例如在Google Cloud 專案中限制配額,以便控制成本,避免超出預算。

如果您有任何有效的覆寫值,可以計算消費者配額上限,準確評估可用配額。

申請額外配額的最佳做法

Google Cloud 有申請提高配額的程序。如要瞭解如何處理配額提高要求,請參閱「關於配額提高要求」。

申請額外配額前,請確認您已實作下列兩項:

這些實作方式可能會因下列原因減少所需的配額數量:

  • 這兩種實作方式都會將負載尖峰分散到數小時或數分鐘,而不是數秒。
  • 這兩種實作方式都能在 24 小時內有效運用配額。如果在 24 小時內,要求量持續大幅超出預設配額,系統就會將更多資源集區分配給 Cloud Healthcare API 服務。我們只會依個案情況提供額外資源。
  • 一致的資源使用情形可讓 Google Cloud 更容易瞭解您的配額需求,並提供所需的配額。

如要有效管理容量和配額,您必須瞭解貴機構的容量需求。如果您正在規劃容量需求,並認為 Google Cloud 專案進入實際工作環境時需要大幅提高配額,請向Google Cloud 客戶服務提出提高配額的要求。在 Google Cloud 專案的測試和發布階段,客戶服務團隊可協助您分配及提高配額。

您不需要訂閱付費客戶服務,即可要求提高配額。部分增加配額要求會在 2 到 3 個工作天內完成,但建議您預留更長的時間。如果增加的配額較多,增加配額的要求可能需要 10 個工作天或更久的時間才能完成。您必須在規劃中撥出時間回覆客服團隊,解決與要求相關的任何問題或未解決的問題。如果您確保初始配額增加要求的內容足夠詳細,或許就能縮短等待要求處理的時間。

預測配額需求的最佳做法

Google Cloud 專案正式上線前,請先預測並規劃所需的配額。請事先規劃配額需求,以免日後資源使用量受到非預期的限制。

以下各節說明規劃配額時應考量哪些因素。

預估所有資料儲存庫和用戶端的總用量

瞭解所有 Cloud Healthcare API 資料儲存庫的總用量,以及向Google Cloud 專案提出要求的所有用戶端的總用量。

  • 有些 Google Cloud 專案會實作多個 Cloud Healthcare API 用途。舉例來說, Google Cloud 專案可能會使用多個 Cloud Healthcare API 資料集和資料儲存庫來儲存不同類型的資料,因此會增加總配額用量。
  • 每個Google Cloud專案和區域都有各自的配額。請確保您在多個區域中,都正確評估所需的配額。如果您有多個 Google Cloud 專案,可能需要在各專案中進行更精確的測量。如要進一步瞭解如何規劃個別區域的配額,請參閱「預估個別區域的用量」。
  • Cloud Healthcare API 不會在用戶端、資料集或資料儲存庫之間平衡配額。用戶端必須判斷是否要實作優先順序方案,確保最關鍵的流量不會發生 429 RESOURCE_EXHAUSTED 錯誤。

預估各區域的用量

Cloud Healthcare API 會根據每個Google Cloud專案和每個區域計算配額。配額通常以每分鐘為單位來計算,因此每秒的大量要求數會在每分鐘的規模中平衡。

如果 Google Cloud 專案使用多個區域,您可以設定每個區域的配額。

如果您的 Cloud Healthcare API 資料集位於 us 多地區位置,且您想申請額外配額,請在配額要求中指出配額適用於「美國元資料區域」。us 多地區位置包含下列子區域:

  • us-central1
  • us-east1
  • us-west1

如果您在任何 us- 子區域中,已有使用 Cloud Healthcare API 流量配額的流量,請務必在提出 us 多區域配額調高要求時,考量這些子區域中的現有流量。舉例來說,如果您在 us-central1us 中都有資料集,且您要求提高 us 的配額,請在要求中指定您在 us-central1 中也有資料集。

持續偏好低交易量

以下情境說明為何應持續傳送少量流量,而非傳送大量交易,且交易間隔較長。

系統會使用公式 request payload * time = traffic volume 計算流量大量交易是指在短時間內,向 Cloud Healthcare API 提出一或多個包含大量酬載的要求。無論酬載大小為何,如果在短時間內傳送大量要求,也可能會被視為高頻率

假設用戶端收集大量交易,並每五分鐘以突發方式將交易傳送至 Cloud Healthcare API。會發生以下情況:

  1. 初期的流量爆發會在第一分鐘內消耗配額 (取決於分鐘結轉),直到用盡所有配額為止。
  2. 任何剩餘的突發流量都會收到 429 RESOURCE_EXHAUSTED 錯誤。如已設定,所有受影響的請求都會遇到指數輪詢。
  3. 遇到初始指數輪詢的部分要求會重新排定,在下一個分鐘再次嘗試。某些要求會在 1 分鐘內嘗試多次,然後在下一個分鐘重試。
  4. 如果要求量過高,重試要求可能會再次遇到 429 RESOURCE_EXHAUSTED 錯誤和指數輪詢。某些流量激增情況可能會在不同時間遇到指數輪詢,而日後嘗試再次傳送流量時,可能會在同一分鐘內收斂。
  5. 如果要求量仍偏高,系統會在下一次流量激增時重試部分流量。由於現有待處理要求的流量增加,問題會更加嚴重。您的應用程式可能難以維護積壓的要求,並將這些要求持續傳送至 Cloud Healthcare API。

這個情境說明瞭解每分鐘的流量量的重要性。實作流量和輪詢策略,以免發生網路壅塞,並確保應用程式不會發生需要重試的錯誤。

查看 DICOM 和 FHIR 配額

如要查看與 FHIR 和 DICOM 商店和作業相關的 Cloud Healthcare API 配額,請參閱「配額限制」。