Nesta página, descrevemos as práticas recomendadas para gerenciar a cota da API Cloud Healthcare. Use esta página se o projeto Google Cloud tiver ou puder ter um grande volume de tráfego e você precisar de mais cota do que a API Cloud Healthcare oferece por padrão.
Cotas padrão da API Cloud Healthcare
As cotas padrão da API Cloud Healthcare não foram projetadas para todos os casos de uso, principalmente se o Google Cloud projeto tiver um grande volume de tráfego. A API Cloud Healthcare não aumenta a cota automaticamente. Você precisa planejar e monitorar o uso da cota.
Práticas recomendadas para monitorar e visualizar a cota
Há vários métodos para ver o uso da cota. Ao estimar e visualizar a cota da API Cloud Healthcare, recomendamos usar o modelo de cota de serviço. O modelo permite avaliar com precisão a cota disponível com base nos seguintes critérios:
- Se há uma substituição de administrador. Um principal com o papel de Administrador de cotas em uma organização pode aplicar uma modificação de administrador à cota em projetosGoogle Cloud na organização. Uma modificação de administrador substitui os limites padrão e as modificações de produtor.
Se uma substituição de produtor está presente. O proprietário de um serviço concede uma modificação de produtor a um consumidor de um serviço. Google Cloud é o proprietário do serviço da API Cloud Healthcare. Qualquer substituição de cota fornecida pelo Google Cloud é uma substituição de produtor.
Se uma substituição de consumidor está presente. Alguém que faz solicitações para a API Cloud Healthcare é um consumidor do serviço da API Cloud Healthcare. É possível aplicar substituições do consumidor em várias situações, como limitar cotas no seu projetoGoogle Cloud como uma medida de controle de custos para evitar exceder o orçamento.
Se você tiver alguma dessas substituições em vigor, calcule seu limite de cota de consumidor para ter uma avaliação precisa da cota disponível.
Práticas recomendadas para solicitar cota extra
Google Cloud tem procedimentos para solicitar um valor de cota maior. Para saber como as solicitações de ajuste de cota são processadas, consulte Sobre ajustes de cota.
Antes de solicitar mais cota, verifique se você implementou os dois itens a seguir:
Essas implementações podem reduzir a quantidade de cota necessária pelos seguintes motivos:
- As duas implementações distribuem picos de carga por várias horas ou minutos, em vez de segundos.
- As duas implementações usam a cota de maneira eficiente em um período de 24 horas. Se as solicitações que excedem significativamente a cota padrão forem consistentes em um período de 24 horas, pools maiores de recursos poderão ser alocados para o serviço da API Cloud Healthcare. A alocação adicional de recursos é feita apenas mediante solicitação e é determinada caso a caso.
- O uso consistente de recursos facilita para o Google Cloud entender seus requisitos de cota e fornecer a cota necessária.
Para gerenciar sua capacidade e cota com eficiência, você precisa conhecer os requisitos de capacidade da sua organização. Se você estiver planejando seus requisitos de capacidade e achar que vai precisar de um grande aumento de cota quando seu projeto Google Cloud estiver em produção, solicite um aumento do Google Cloud atendimento ao cliente. O atendimento ao cliente pode ajudar você a alocar e aumentar a cota durante as fases de teste e lançamento do seu projeto Google Cloud .
Você não precisa ter um serviço pago de atendimento ao cliente para solicitar um aumento de cota. Algumas solicitações de aumento de cota são concluídas em 2 a 3 dias úteis, mas recomendamos que você planeje um período maior. Se o aumento for grande, o processo pode levar 10 dias úteis ou mais. Parte do seu planejamento precisa envolver a alocação de tempo para responder ao atendimento ao cliente e resolver dúvidas ou problemas em aberto sobre a solicitação. Se você garantir que sua solicitação inicial de aumento de cota seja suficientemente detalhada, poderá reduzir o tempo gasto esperando que ela seja atendida.
Práticas recomendadas para antecipar necessidades de cota
Antes que seu projeto Google Cloud entre em produção, preveja e planeje a quantidade de cota necessária. Planejar os requisitos de cota evita a limitação inesperada do consumo de recursos mais tarde.
As seções a seguir explicam o que considerar ao planejar a cota.
Antecipar o uso total de todos os armazenamentos de dados e clientes
Entenda o uso total em todos os armazenamentos de dados da API Cloud Healthcare e o uso total de todos os clientes que fazem solicitações ao seu projetoGoogle Cloud .
- Alguns projetos Google Cloud implementam vários casos de uso da API Cloud Healthcare. Por exemplo, seu projeto Google Cloud pode usar vários conjuntos de dados e armazenamentos de dados da API Cloud Healthcare para diferentes tipos de dados, aumentando assim o uso total da cota.
- As cotas são aplicadas por projeto doGoogle Cloude por região. Verifique se você tem medições precisas da cota necessária em várias regiões. Se você tiver vários projetos Google Cloud , talvez precise de medições mais precisas em todos eles. Para mais informações sobre o planejamento da cota por região, consulte Prever o uso por região.
- A API Cloud Healthcare não faz balanceamento de carga da cota entre clientes, conjuntos de dados ou armazenamentos de dados. O cliente precisa determinar se vai implementar um esquema de priorização para garantir que o tráfego mais crítico não encontre erros de
429 RESOURCE_EXHAUSTED
.
Antecipar o uso por região
A API Cloud Healthcare mede as cotas por projetoGoogle Cloude por região. As cotas geralmente são medidas por minuto, o que permite que pequenos picos de solicitações por segundo se equilibrem em uma escala por minuto.
Se o Google Cloud projeto usa várias regiões, é possível definir cotas por região.
Se o conjunto de dados da API Cloud Healthcare estiver no local multirregional us
e você quiser solicitar mais cota, informe na solicitação que a cota é para a "metarregião dos EUA". O local multirregional us
consiste nas seguintes sub-regiões:
us-central1
us-east1
us-west1
Se você já tiver tráfego da API Cloud Healthcare usando cota em qualquer uma das sub-regiões us-
, considere o tráfego atual dessas sub-regiões ao fazer uma solicitação de aumento de cota para a multirregião us
.
Por exemplo, se você tiver conjuntos de dados em us-central1
e us
e solicitar um aumento de cota em us
, especifique na solicitação que você tem conjuntos de dados em us-central1
.
Priorize transações de baixo volume de forma consistente
O cenário a seguir explica a importância de enviar quantidades menores de tráfego de forma consistente em vez de enviar transações de alto volume com um intervalo maior entre elas.
O volume de tráfego é calculado usando a fórmula request payload * time = traffic volume
.
Uma transação de alto volume é uma ou mais solicitações à API Cloud Healthcare em um curto intervalo que contêm um payload grande.
Uma série de solicitações também pode ser considerada de alto volume se houver muitas solicitações enviadas em um curto intervalo, independente do tamanho do payload.
Suponha que um cliente colete transações de alto volume e as envie para a API Cloud Healthcare em um burst a cada cinco minutos. O seguinte acontece:
- O pico inicial de tráfego consome a cota no primeiro minuto (dependendo das substituições de minuto) até que toda a cota seja esgotada.
- O restante do tráfego de burst recebe erros
429 RESOURCE_EXHAUSTED
. Se configurado, todas as solicitações afetadas vão encontrar espera exponencial. - Uma porcentagem de solicitações que encontraram a espera exponencial inicial são reagendadas para serem tentadas novamente no próximo minuto. Algumas solicitações são tentadas várias vezes em um único minuto e depois são repetidas no minuto seguinte.
- Se o volume de solicitações for alto o suficiente, as solicitações repetidas poderão encontrar
erros
429 RESOURCE_EXHAUSTED
e espera exponencial novamente. Alguns picos de tráfego podem encontrar espera exponencial em momentos diferentes, e as tentativas de enviar tráfego novamente podem convergir no mesmo minuto no futuro. - Se o volume de solicitações ainda estiver alto, parte do tráfego será repetida quando o próximo pico de tráfego começar. O problema se agrava porque mais tráfego é adicionado ao backlog de solicitações. Seu aplicativo pode ter dificuldade em manter o backlog de solicitações e enviá-las de forma consistente para a API Cloud Healthcare.
Esse cenário mostra a importância de saber o volume do seu tráfego por minuto. Implemente seu volume de tráfego e espera para evitar congestionamento da rede e garantir que o aplicativo não encontre muitas falhas que exijam novas tentativas.
Revisar cotas de DICOM e FHIR
Para conferir as cotas da API Cloud Healthcare associadas a armazenamentos e operações FHIR e DICOM, consulte Limites de cota.