Saiba como definir o número máximo de solicitações que podem ser processadas simultaneamente por uma determinada instância de contêiner no Knative serving. Saiba mais sobre simultaneidade.
Qualquer mudança na configuração leva à criação de uma nova revisão. As próximas revisões também recebem automaticamente essa configuração, a menos que você faça atualizações explícitas para alterá-la.
É possível definir as configurações de simultaneidade usando o console Google Cloud ou a Google Cloud CLI ao implantar um novo serviço ou atualizar um serviço e implantar uma revisão:
Console
Acesse o Knative serving no Google Cloud console:
Clique em Criar serviço se estiver configurando um novo serviço em que fará uma implantação. Se você estiver configurando um serviço atual, clique nele e em Editar e implantar uma nova revisão.
Em Configurações avançadas, clique em Contêiner.
Defina o valor de simultaneidade que você quer na caixa de texto Máximo de solicitações por contêiner:
Clique em Avançar para acessar a próxima seção.
Na seção Configurar como este serviço é acionado, selecione qual conectividade você quer usar para invocar o serviço.
Clique em Criar para implantar a imagem no Knative serving e aguarde até que a implantação seja concluída.
Linha de comando
Para serviços existentes, defina o número máximo de solicitações simultâneas executando o comando
gcloud run services updatecom o parâmetro:--concurrencygcloud run services update SERVICE --concurrency CONCURRENCY
Substitua:
- SERVICE pelo nome do serviço;
- CONCURRENCY pelo número máximo de
solicitações simultâneas por instância de contêiner. Especifique
defaultpara limpar as configurações de simultaneidade:--concurrency default.
Para novos serviços, defina o número máximo de solicitações simultâneas executando o comando
gcloud run deploycom o parâmetro--concurrency:gcloud run deploy SERVICE --image=IMAGE_URL --concurrency CONCURRENCY
Substitua:
- SERVICE pelo nome do serviço;
- IMAGE_URL por uma referência à imagem de contêiner. Por
exemplo,
gcr.io/cloudrun/hello; - CONCURRENCY pelo número máximo de
solicitações simultâneas por instância de contêiner. Especifique
defaultpara limpar as configurações de simultaneidade:--concurrency default.
YAML
Faça o download da configuração de um serviço existente para um
arquivo YAML com o comando gcloud run services describe usando a
sinalização --format=export.
Em seguida, modifique o arquivo YAML e implante
essas alterações com o comando gcloud run services replace.
Modifique apenas os atributos especificados.
Faça o download da configuração do serviço em um arquivo chamado
service.yamlno espaço de trabalho local:gcloud run services describe SERVICE --format export > service.yaml
Substitua SERVICE pelo nome do seu serviço do Knative serving.
No seu arquivo local, atualize o atributo
containerConcurrency:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containerConcurrency: CONCURRENCY
Substitua:
- SERVICE pelo nome do serviço do Knative serving
- CONCURRENCY pelo número máximo de solicitações
simultâneas por instância de contêiner. Especifique
defaultpara limpar as configurações de simultaneidade:--concurrency default.
Substitua o serviço pela nova configuração usando o seguinte comando:
gcloud run services replace service.yaml