En esta página se describen las prácticas recomendadas para gestionar la cuota de la API Cloud Healthcare. Usa esta página si tu proyecto tiene o puede tener un gran volumen de tráfico y necesitas más cuota de la que proporciona la API Cloud Healthcare de forma predeterminada. Google Cloud
Cuotas predeterminadas de la API de Cloud Healthcare
Las cuotas predeterminadas de la API Cloud Healthcare no están diseñadas para todos los casos prácticos, sobre todo si tu Google Cloud proyecto Google Cloud tiene un gran volumen de tráfico. La API Cloud Healthcare no aumenta la cuota automáticamente. Debes planificar y monitorizar el uso de tu cuota.
Prácticas recomendadas para monitorizar y ver la cuota
Hay varios métodos para consultar el uso de tu cuota. Cuando estime y consulte la cuota de la API Cloud Healthcare, le recomendamos que utilice el modelo de cuota de servicio. El modelo te permite evaluar con precisión la cuota disponible que tienes en función de los siguientes criterios:
- Indica si hay una anulación de administrador. Una cuenta principal a la que se le haya concedido el rol Administrador de cuotas en una organización puede aplicar una anulación de administrador a la cuota deGoogle Cloud proyectos de la organización. Una anulación de administrador prevalece sobre los límites predeterminados y las anulaciones de productores.
Indica si hay una anulación del productor. El propietario de un servicio concede una anulación de productor a un consumidor de un servicio. Google Cloud es el propietario del servicio de la API Cloud Healthcare. Cualquier anulación de cuota que Google Cloud proporcione es una anulación de productor.
Indica si hay una anulación del consumidor. Un usuario que envía solicitudes a la API de Cloud Healthcare es un consumidor del servicio de la API de Cloud Healthcare. Puedes aplicar anulaciones de consumidor en diversas situaciones, como limitar las cuotas de tu proyectoGoogle Cloud para controlar los costes y evitar que se supere tu presupuesto.
Si tienes alguna de estas anulaciones activada, puedes calcular tu límite de cuota de consumidor para obtener una evaluación precisa de la cuota disponible.
Prácticas recomendadas para solicitar un aumento de cuota
Google Cloud tiene procedimientos para solicitar un valor de cuota superior. Para saber cómo se procesan las solicitudes de ajuste de cuota, consulta Información sobre los ajustes de cuota.
Antes de solicitar cuota adicional, asegúrate de haber implementado lo siguiente:
Estas implementaciones pueden reducir la cantidad de cuota que necesitas por los siguientes motivos:
- Ambas implementaciones distribuyen los picos de carga a lo largo de varias horas o minutos, en lugar de segundos.
- Ambas implementaciones hacen un uso eficiente de la cuota durante un periodo de 24 horas. Si las solicitudes que superan significativamente la cuota predeterminada son constantes durante un periodo de 24 horas, se pueden asignar mayores grupos de recursos al servicio de la API Cloud Healthcare. La asignación adicional de recursos solo se realiza bajo petición y se determina en función de cada caso.
- Si el uso de recursos es constante, será más fácil para Google Cloud entender tus requisitos de cuota y proporcionarte la que necesites.
Para gestionar la capacidad y las cuotas de forma eficaz, debe conocer los requisitos de capacidad de su organización. Si estás planificando tus requisitos de capacidad y crees que necesitarás un aumento de cuota considerable cuando tu proyecto esté en producción, solicita un aumento al Google Cloud equipo de Asistencia. Google Cloud El equipo de Asistencia puede ayudarte a asignar y aumentar la cuota durante las fases de prueba y lanzamiento de tu Google Cloud proyecto.
No es necesario que tengas un servicio de atención al cliente de pago para solicitar un aumento de cuota. Algunas solicitudes de aumento de cuota se completan en un plazo de 2 a 3 días hábiles, pero te recomendamos que preveas un plazo mayor. Si el aumento de cuota es considerable, la solicitud puede tardar 10 días hábiles o más en completarse. Como parte de la planificación, debes asignar tiempo para responder al equipo de Asistencia y resolver cualquier duda o problema abierto sobre la solicitud. Si te aseguras de que tu solicitud inicial de aumento de cuota sea lo suficientemente detallada, podrás reducir el tiempo que se tarda en tramitarla.
Prácticas recomendadas para anticipar las necesidades de cuota
Antes de que tu Google Cloud proyecto pase a producción, anticipa y planifica la cantidad de cuota que necesitarás. Si planificas tus requisitos de cuota, evitarás que se limite de forma inesperada tu consumo de recursos más adelante.
En las siguientes secciones se explica qué debes tener en cuenta al planificar las cuotas.
Prever el uso total de todos los almacenes de datos y clientes
Consulta el uso total de todos tus almacenes de datos de la API Cloud Healthcare y el uso total de todos los clientes que envían solicitudes a tuGoogle Cloud proyecto.
- Algunos Google Cloud proyectos implementan varios casos prácticos de la API Cloud Healthcare. Por ejemplo, tu Google Cloud proyecto puede usar varios conjuntos de datos y almacenes de datos de la API Cloud Healthcare para diferentes tipos de datos, lo que aumentará el uso total de tu cuota.
- Las cuotas se aplican porGoogle Cloudproyecto y por región. Asegúrese de que tiene mediciones precisas de la cuota necesaria en varias regiones. Si tienes varios proyectos, puede que necesites mediciones más precisas en todos ellos. Google Cloud Para obtener más información sobre cómo planificar la cuota por región, consulta Anticipar el uso por región.
- La API Cloud Healthcare no equilibra la carga de la cuota entre clientes, conjuntos de datos o almacenes de datos. El cliente debe determinar si implementa un esquema de priorización para asegurarse de que el tráfico más crítico no se encuentre con errores
429 RESOURCE_EXHAUSTED
.
Prever el uso por región
La API de Cloud Healthcare mide las cuotas por proyecto y por región.Google CloudLas cuotas se suelen medir por minuto, lo que permite que los pequeños picos de solicitudes por segundo se equilibren a escala por minuto.
Si tu Google Cloud proyecto usa varias regiones, puedes definir cuotas por región.
Si tu conjunto de datos de la API Cloud Healthcare se encuentra en la ubicación multirregional us
y quieres solicitar cuota adicional, indica en tu solicitud que la cuota es para la "metarregión de EE. UU.". La us
ubicación multirregional consta de las siguientes subregiones:
us-central1
us-east1
us-west1
Si ya tienes tráfico de la API Cloud Healthcare que usa cuota en alguna de las us-
subregiones, ten en cuenta el tráfico de esas subregiones al enviar una solicitud de aumento de cuota para la multirregión us
.
Por ejemplo, si tiene conjuntos de datos en us-central1
y us
, y solicita un aumento de cuota en us
, especifique en su solicitud que tiene conjuntos de datos en us-central1
.
Favorecer las transacciones de bajo volumen de forma constante
En la siguiente situación se explica la importancia de enviar cantidades de tráfico más pequeñas de forma constante en lugar de enviar transacciones de gran volumen con un intervalo más largo entre transacciones.
El volumen de tráfico se calcula mediante la fórmula request payload * time = traffic volume
.
Una transacción de gran volumen es una o varias solicitudes a la API Cloud Healthcare en un intervalo corto que contienen una carga útil grande.
También se puede considerar que una serie de solicitudes tiene un volumen alto si se envían muchas solicitudes en un intervalo corto, independientemente del tamaño de la carga útil.
Supongamos que un cliente recoge transacciones de gran volumen y las envía a la API Cloud Healthcare en ráfagas cada cinco minutos. Ocurre lo siguiente:
- El primer pico de tráfico consume cuota en el primer minuto (en función de los cambios de minuto) hasta que se agota toda la cuota.
- El tráfico de ráfaga restante recibe errores
429 RESOURCE_EXHAUSTED
. Si se configura, todas las solicitudes afectadas experimentarán un tiempo de espera exponencial. - Un porcentaje de las solicitudes que han tenido un tiempo de espera exponencial inicial se reprograman para volver a intentarse en el minuto siguiente. Algunas solicitudes se intentan varias veces en un minuto y, después, se vuelven a intentar al minuto siguiente.
- Si el volumen de solicitudes es lo suficientemente alto, las solicitudes reintentadas pueden encontrar errores
429 RESOURCE_EXHAUSTED
y volver a aplicar el retroceso exponencial. Es posible que algunas ráfagas de tráfico experimenten un tiempo de espera exponencial en momentos diferentes y que los intentos de enviar tráfico de nuevo converjan en el mismo minuto en el futuro. - Si el volumen de solicitudes sigue siendo alto, se vuelve a intentar enviar parte del tráfico cuando empieza la siguiente ráfaga. El problema se agrava porque se añade más tráfico a la cartera de solicitudes pendientes. Es posible que tu aplicación tenga dificultades para mantener el registro de solicitudes pendientes y enviarlas de forma coherente a la API Cloud Healthcare.
En este caso, se muestra la importancia de conocer el volumen de tráfico por minuto. Implementa el volumen de tráfico y los retiros exponenciales para evitar la congestión de la red y asegurarte de que tu aplicación no sufra muchos errores que requieran reintentos.
Consultar las cuotas de DICOM y FHIR
Para ver las cuotas de la API Cloud Healthcare asociadas a los almacenes y las operaciones de FHIR y DICOM, consulta Límites de cuota.