此页面由 Cloud Translation API 翻译。

配额管理最佳实践

本页面介绍了管理 Cloud Healthcare API 配额的最佳实践。如果您的 Google Cloud 项目流量很大或可能很大，并且您需要的配额高于 Cloud Healthcare API 默认提供的配额，请使用本页面。

Cloud Healthcare API 默认配额

默认 Cloud Healthcare API 配额并非适用于所有使用情形，尤其是当您的 Google Cloud 项目流量较大时。Cloud Healthcare API 不会自动增加配额。您必须规划和监控配额用量。

监控和查看配额方面的最佳实践

您可以通过多种方法查看配额用量。在估算和查看 Cloud Healthcare API 的配额时，我们建议您使用服务配额模型。该模型可让您根据以下条件准确评估可用配额：

是否存在管理员替换项。如果某主账号在组织中被授予配额管理员角色，则可以对组织内Google Cloud 项目的配额应用管理员替换值。管理员替换值会取代默认限制和使用方替换值。
是否存在提供方替换值。服务所有者向服务的使用者授予提供方替换值。 Google Cloud 是 Cloud Healthcare API 服务的服务所有者。 Google Cloud 提供的任何配额替换值都是提供方替换值。

重要提示：管理员替换值会取代使用方替换值。如果您已通过使用方替换值获得额外配额，但您已存在管理员替换值，则使用方替换值可能不会生效。
是否存在使用方替换值。向 Cloud Healthcare API 发出请求的人员是 Cloud Healthcare API 服务的消费者。您可以针对各种情况应用使用方替换值，例如，限制Google Cloud 项目中的配额，以作为费用控制措施来防止超出预算。

如果您有任何有效的替换项，可以计算使用方配额上限，以便准确评估可用配额。

申请更多配额的最佳实践

Google Cloud 具有申请更高配额值的程序。如需了解配额调整请求的处理方式，请参阅配额调整简介。

在申请额外配额之前，请确保您已实现以下两项要求：

这些实现可能会减少您所需的配额，原因如下：

这两种实现方式都会将负载高峰分散到几小时或几分钟内，而不是几秒钟内。
这两种实现方式都能在 24 小时内高效利用配额。如果请求在 24 小时内持续大幅超出默认配额，则可以为 Cloud Healthcare API 服务分配更大的资源池。额外资源分配仅根据请求进行，并根据具体情况确定。
资源用量保持一致有助于 Google Cloud 更轻松地了解您的配额要求，并为您提供所需的配额。

为了有效管理容量和配额，您需要了解组织的容量需求。如果您正在规划容量需求，并且认为 Google Cloud 项目投入生产后需要大幅增加配额，请向Google Cloud 客户服务申请增加配额。在 Google Cloud 项目的测试和发布阶段，客户服务团队可以协助您分配和增加配额。

您无需拥有付费 Customer Care 服务即可申请增加配额。部分配额增加请求会在 2-3 个工作日内完成，但我们建议您预留更长的时间。如果您的配额增加幅度较大，则可能需要 10 个工作日或更长时间才能完成配额增加请求。规划的一部分必须包括分配时间来回复客户服务团队，以解决有关请求的任何问题或未解决的问题。如果您确保初始配额增加请求足够详细，或许可以缩短等待请求得到满足的时间。

预测配额需求的最佳实践

在 Google Cloud 项目投入生产之前，请预测并规划您需要的配额。规划配额需求可防止日后资源消耗意外受到限制。

以下部分将介绍规划配额时需要考虑的事项。

预测所有数据存储区和客户端的总用量

了解所有 Cloud Healthcare API 数据存储区的总使用量，以及向您的Google Cloud 项目发出请求的所有客户端的总使用量。

某些 Google Cloud 项目实现了多个 Cloud Healthcare API 使用场景。例如，您的 Google Cloud 项目可能会使用多个 Cloud Healthcare API 数据集和数据存储区来存储不同类型的数据，从而增加您的总配额用量。
配额按Google Cloud项目和区域强制执行。确保您在多个区域准确衡量了所需的配额。如果您有多个 Google Cloud 项目，可能需要更准确地衡量各个项目的效果。如需详细了解如何规划各区域的配额，请参阅预测各区域的用量。
Cloud Healthcare API 不会在客户端、数据集或数据存储区之间进行配额负载平衡。客户端必须确定是否实现优先级划分方案，以确保最关键的流量不会遇到 429 RESOURCE_EXHAUSTED 错误。

预测每个区域的用量

Cloud Healthcare API 按Google Cloud项目和区域衡量配额。配额通常按分钟计算，这样一来，每秒的小幅请求高峰就可以在每分钟的范围内得到平衡。

如果您的 Google Cloud 项目使用多个区域，您可以设置每个区域的配额。

如果您的 Cloud Healthcare API 数据集位于 us 多区域位置，并且您想申请增加配额，请在配额申请中说明该配额适用于“美国元区域”。us 多区域位置包含以下子区域：

us-central1
us-east1
us-west1

如果您已在任何 us- 子区域中使用配额产生 Cloud Healthcare API 流量，请务必在为 us 多区域提出配额增加请求时，将这些子区域中的现有流量考虑在内。例如，如果您在 us-central1 和 us 中都有数据集，并且您在 us 中申请增加配额，请在申请中指明您在 us-central1 中有数据集。

持续偏好低交易量

以下情形说明了持续发送少量流量的重要性，而不是发送交易间隔时间较长的大量交易。

流量量的计算公式为 request payload * time = traffic volume。 高容量交易是指在短时间内向 Cloud Healthcare API 发送的一个或多个包含大型载荷的请求。如果短时间内发送了大量请求，无论载荷大小如何，一系列请求也可视为大容量。

假设某个客户端收集大量交易，并每 5 分钟以突发方式将交易发送到 Cloud Healthcare API。系统会执行以下操作：

初始流量突增会在第一分钟内（取决于分钟轮换）消耗配额，直到所有配额都用完为止。
任何剩余的突发流量都会收到 429 RESOURCE_EXHAUSTED 错误。如果配置了此项，所有受影响的请求都会遇到指数退避算法。
遇到初始指数退避算法的部分请求会被重新安排在下一分钟重试。某些请求在一分钟内尝试多次，然后在下一分钟重试。
如果请求量足够大，重试的请求可能会再次遇到 429 RESOURCE_EXHAUSTED 错误并再次进行指数退避算法。某些流量突发可能会在不同时间遇到指数退避算法，并且重新发送流量的尝试可能会在未来的同一分钟内收敛。
如果请求量仍然很高，则在下一次流量突增开始时，系统会重试部分流量。由于现有积压的请求中增加了更多流量，问题变得更加严重。您的应用可能难以维护积压的请求，并持续将这些请求发送到 Cloud Healthcare API。

此方案表明，了解每分钟的流量非常重要。实现流量量和退避，以防止网络拥塞，并确保您的应用不会遇到许多需要重试的故障。

查看 DICOM 和 FHIR 配额

如需查看与 FHIR 和 DICOM 存储区及操作关联的 Cloud Healthcare API 配额，请参阅配额限制。