Prácticas recomendadas para la administración de cuotas

En esta página, se describen las prácticas recomendadas para administrar la cuota de la API de Cloud Healthcare. Usa esta página si tu proyecto Google Cloud tiene, o podría tener, una gran cantidad de tráfico y necesitas más cuota de la que proporciona la API de Cloud Healthcare de forma predeterminada.

Cuotas predeterminadas de la API de Cloud Healthcare

Las cuotas predeterminadas de la API de Cloud Healthcare no están diseñadas para todos los casos de uso, en especial si tu proyecto Google Cloud tiene una gran cantidad de tráfico. La API de Cloud Healthcare no aumenta la cuota automáticamente. Debes planificar y supervisar el uso de la cuota.

Prácticas recomendadas para supervisar y ver la cuota

Existen varios métodos para ver el uso de tu cuota. Cuando calcules y veas la cuota de la API de Cloud Healthcare, te recomendamos que uses el modelo de cuota de servicio. El modelo te permite evaluar con precisión la cuota disponible que tienes según los siguientes criterios:

  • Indica si hay una anulación del administrador. Una principal a la que se le otorgó el rol de administrador de cuotas en una organización puede aplicar una anulación del administrador a la cuota en los proyectos deGoogle Cloud dentro de la organización. Las anulaciones del administrador sustituyen los límites predeterminados y las anulaciones del productor.
  • Indica si hay una anulación del productor. El propietario de un servicio otorga una anulación del productor a un consumidor de un servicio. Google Cloud es el propietario del servicio de la API de Cloud Healthcare. Cualquier anulación de cuota que proporcione Google Cloud es una anulación del productor.

  • Indica si hay una anulación del consumidor. Una persona que realiza solicitudes a la API de Cloud Healthcare es un consumidor del servicio de la API de Cloud Healthcare. Puedes aplicar anulaciones del consumidor en diversas situaciones, como limitar las cuotas en tu proyecto deGoogle Cloud como medida de control de costos para no exceder tu presupuesto.

Si tienes alguna de estas anulaciones vigentes, puedes calcular tu límite de cuota del consumidor para obtener una evaluación precisa de la cuota disponible.

Prácticas recomendadas para solicitar cuota adicional

Google Cloud tiene procedimientos para solicitar un valor de cuota más alto. Para obtener más información sobre cómo se procesan las solicitudes de ajuste de cuota, consulta Acerca de los ajustes de cuota.

Antes de solicitar una cuota adicional, asegúrate de haber implementado las siguientes opciones:

Estas implementaciones pueden reducir la cantidad de cuota que necesitas por los siguientes motivos:

  • Ambas implementaciones distribuyen los picos de carga durante varias horas o minutos, en lugar de segundos.
  • Ambas implementaciones hacen un uso eficiente de la cuota durante un período de 24 horas. Si las solicitudes que superan significativamente la cuota predeterminada son constantes durante un período de 24 horas, se pueden asignar grupos más grandes de recursos al servicio de la API de Cloud Healthcare. La asignación adicional de recursos solo se realiza a pedido y se determina caso por caso.
  • El uso constante de recursos facilita que Google Cloud comprenda tus requisitos de cuota y te proporcione la cuota que necesitas.

Para administrar tu capacidad y cuota de manera efectiva, debes conocer los requisitos de capacidad de tu organización. Si estás planificando tus requisitos de capacidad y crees que necesitarás un aumento de cuota grande cuando tu proyecto esté en producción, solicita un aumento al Google Cloud equipo de Atención al cliente. Google Cloud El equipo de Atención al cliente puede ayudarte a asignar y aumentar la cuota durante las fases de prueba y lanzamiento de tu proyecto Google Cloud .

No necesitas tener un servicio pagado de Atención al cliente para solicitar un aumento de cuota. Algunas solicitudes de aumento de cuota se completan en un plazo de 2 a 3 días hábiles, pero te recomendamos que planifiques un plazo más largo. Si el aumento de cuota es grande, la solicitud puede tardar 10 días hábiles o más en completarse. Parte de tu planificación debe incluir la asignación de tiempo para responder al equipo de Atención al cliente y resolver cualquier pregunta o problema abierto sobre la solicitud. Si te aseguras de que tu solicitud inicial de aumento de cuota sea lo suficientemente detallada, es posible que puedas reducir el tiempo de espera para que se cumpla la solicitud.

Prácticas recomendadas para anticipar las necesidades de cuota

Antes de que tu proyecto de Google Cloud pase a producción, anticipa y planifica la cantidad de cuota que necesitarás. Planificar los requisitos de cuota evita limitaciones inesperadas del consumo de recursos más adelante.

En las siguientes secciones, se explica qué debes tener en cuenta cuando planifiques la cuota.

Anticipar el uso total de todos los almacenes de datos y clientes

Comprende tu uso total en todos los almacenes de datos de la API de Cloud Healthcare y el uso total de todos los clientes que realizan solicitudes a tu proyecto deGoogle Cloud .

  • Algunos Google Cloud proyectos implementan varios casos de uso de la API de Cloud Healthcare. Por ejemplo, tu proyecto Google Cloud podría usar varios conjuntos de datos y almacenes de datos de la API de Cloud Healthcare para diferentes tipos de datos, lo que aumentaría tu uso total de la cuota.
  • Las cuotas se aplican por proyecto y por región deGoogle Cloud. Asegúrate de tener mediciones precisas de la cuota requerida en varias regiones. Si tienes varios proyectos Google Cloud , es posible que necesites mediciones más precisas en todos ellos. Para obtener más información sobre la planificación de la cuota por región, consulta Anticipa el uso por región.
  • La API de Cloud Healthcare no balancea la cuota de carga entre clientes, conjuntos de datos ni almacenes de datos. El cliente debe determinar si implementará un esquema de priorización para garantizar que el tráfico más crítico no encuentre errores de 429 RESOURCE_EXHAUSTED.

Anticipa el uso por región

La API de Cloud Healthcare mide las cuotas por proyecto y por región.Google CloudLas cuotas suelen medirse por minuto, lo que permite que los pequeños aumentos repentinos de solicitudes por segundo se equilibren en una escala por minuto.

Si tu proyecto usa varias regiones, puedes establecer cuotas por región. Google Cloud

Si tu conjunto de datos de la API de Cloud Healthcare se encuentra en la ubicación multirregional us y quieres solicitar una cuota adicional, indica en tu solicitud de cuota que esta es para la "metaregión de EE.UU.". La ubicación multirregional de us consta de las siguientes subregiones:

  • us-central1
  • us-east1
  • us-west1

Si ya tienes tráfico de la API de Cloud Healthcare que usa cuota en cualquiera de las subregiones de us-, asegúrate de tener en cuenta el tráfico existente en esas subregiones cuando realices una solicitud de aumento de cuota para la región múltiple de us. Por ejemplo, si tienes conjuntos de datos en us-central1 y us, y solicitas un aumento de la cuota en us, especifica en tu solicitud que tienes conjuntos de datos en us-central1.

Favorece las transacciones de bajo volumen de forma constante

En la siguiente situación, se explica la importancia de enviar cantidades más pequeñas de tráfico de forma constante en lugar de enviar transacciones de gran volumen con un intervalo más largo entre ellas.

El volumen de tráfico se calcula con la fórmula request payload * time = traffic volume. Una transacción de gran volumen es una o más solicitudes a la API de Cloud Healthcare en un intervalo corto que contienen una carga útil grande. También se puede considerar que una serie de solicitudes es de gran volumen si se envían muchas solicitudes en un intervalo corto, independientemente del tamaño de la carga útil.

Supongamos que un cliente recopila transacciones de gran volumen y las envía a la API de Cloud Healthcare en ráfagas cada cinco minutos. Ocurre lo siguiente:

  1. La ráfaga inicial de tráfico consume cuota en el primer minuto (depende de los cambios de minuto) hasta que se agota toda la cuota.
  2. El tráfico en ráfagas restante recibe errores 429 RESOURCE_EXHAUSTED. Si se configura, todas las solicitudes afectadas experimentarán una retirada exponencial.
  3. Un porcentaje de las solicitudes que encontraron la retirada exponencial inicial se reprograman para volver a intentarse en el próximo minuto. Algunas solicitudes se intentan varias veces en un minuto y, luego, se vuelven a intentar al minuto siguiente.
  4. Si el volumen de solicitudes es lo suficientemente alto, es posible que las solicitudes reintentadas vuelvan a encontrar errores 429 RESOURCE_EXHAUSTED y una retirada exponencial. Es posible que ciertos picos de tráfico experimenten una retirada exponencial en diferentes momentos, y los intentos de volver a enviar tráfico podrían converger en el mismo minuto en el futuro.
  5. Si el volumen de solicitudes sigue siendo alto, se reintentará parte del tráfico cuando comience la siguiente ráfaga de tráfico. El problema se agrava porque se agrega más tráfico a la lista de solicitudes pendientes existente. Es posible que tu aplicación tenga dificultades para mantener el backlog de solicitudes y enviarlas de forma coherente a la API de Cloud Healthcare.

Este caso muestra la importancia de conocer el volumen de tu tráfico por minuto. Implementa tu volumen de tráfico y retiradas para evitar la congestión de la red y asegurarte de que tu aplicación no encuentre muchas fallas que requieran reintentos.

Revisa las cuotas de DICOM y FHIR

Para ver las cuotas de la API de Cloud Healthcare asociadas con los almacenes y las operaciones de FHIR y DICOM, consulta Límites de cuotas.