Configurar serviços do Cloud Run

Esta página oferece uma visão geral das opções de configuração para serviços do Cloud Run.

Evitar inicializações a frio e reduzir a latência

É possível evitar a inicialização a frio do aplicativo e reduzir a latência dele definindo um número mínimo de instâncias. Observe que definir um número mínimo de instâncias gera custos. Consulte Definir instâncias mínimas para serviços para saber mais.

Capacidade

É possível controlar a quantidade de memória, CPU e concorrência máxima que um serviço pode usar.

Use as configurações de faturamento para controlar como você vai ser cobrado, seja por solicitação e somente quando a instância processar uma solicitação ou durante todo o ciclo de vida da instância.

Variáveis de ambiente

É possível criar pares de chave-valor para uso com seu serviço do Cloud Run. Consulte Configurar variáveis de ambiente para serviços para saber mais.

Ambiente de execução

O Cloud Run tem dois ambientes de execução. Saiba mais sobre as diferenças entre os dois ambientes de execução.

GPU

Se você precisar hospedar cargas de trabalho de IA, como modelos de inferência e treinamento de modelos, é possível configurar os serviços do Cloud Run com ou sem GPU.

Proteger contra altos níveis de solicitação

É possível controlar quantas instâncias o serviço do Cloud Run cria para atender a solicitações definindo instâncias máximas e instâncias mínimas. Isso pode ajudar a reduzir custos e proteger contra níveis de solicitação anormalmente altos.

Verificações de integridade

O Cloud Run permite configurar dois tipos de sondagens de verificação de integridade. Uma das sondagens determina quando os contêineres estão prontos para aceitar tráfego, e a outra sondagem determina se o contêiner precisa ser reiniciado. Saiba mais sobre as verificações de integridade de contêineres.

Escalonamento

Por padrão, o Cloud Run escalona automaticamente para um número máximo especificado ou padrão de instâncias, dependendo do tráfego e da utilização da CPU. No entanto, em alguns casos de uso, talvez você queira definir um número específico de instâncias usando o escalonamento manual.

Secrets

Use o Secret Manager com o Cloud Run para armazenar chaves de API, senhas e outras informações confidenciais com segurança. Consulte Configurar segredos para saber mais.

Identidade do serviço

A identidade do serviço do Cloud Run é a conta de serviço usada como a conta autenticada para acessar as APIsGoogle Cloud do contêiner da instância do Cloud Run. Recomendamos que você crie uma conta de serviço e determine o conjunto mínimo de permissões que ela precisa para acessar recursos Google Cloud específicos.

Tempo limite

É possível definir um tempo limite de solicitação do Cloud Run que especifica o tempo em que uma resposta precisa ser retornada.

Recomendações

Consulte Otimizar com o recomendador para saber mais sobre as otimizações fornecidas pelo recomendador no Cloud Run.

Divisão de tráfego

Sempre que você implanta ou reimplanta um serviço, uma nova revisão do serviço subjacente do Cloud Run é criada automaticamente. Consulte Afinidade de sessão e divisão de tráfego para mais detalhes.

Serviços de tag

As tags são pares de chave-valor que podem ser aplicadas aos recursos para controle de acesso detalhado usando o console do Cloud Run.

Os administradores de tags criam tags para recursos no Google Cloud no nível da organização ou do projeto. As tags fornecem uma maneira de permitir ou negar políticas condicionalmente se um recurso tiver uma tag específica. Para saber mais, consulte Serviços de tag.

Montagens de volumes

As montagens de volume do Cloud Run permitem acessar dados compartilhados armazenados em um sistema de arquivos local, como um bucket de armazenamento ou conteúdo do servidor de arquivos, no contêiner. É possível montar um bucket do Cloud Storage, um compartilhamento NFS como uma instância do Filestore, um sistema de arquivos em memória fornecido pelo Cloud Run ou sistemas de arquivos de rede NBD, 9P, CIFS/Samba e Ceph.