Parâmetros de configuração da API On-Prem

A solução Speech-to-Text On-Prem expõe alguns parâmetros de configuração. Os parâmetros abaixo são expostos nas instalações da CLI e do inicializador de aplicativos do Marketplace.

Nome do parâmetro	Descrição
Nome	O nome do aplicativo. A string "speech" é um padrão seguro. Esse valor é chamado de $NAME.
Namespace	O namespace em que o aplicativo será implantado. A string "speech" é um padrão seguro. Esse valor é chamado de $NAMESPACE.
Réplicas	O número de réplicas que você quer que a solução execute (o padrão é 3). Isso permite escalonar o aplicativo horizontalmente. Esse valor é chamado de $REPLICAS.
CPUs por pod	Quantidade de CPUs a ser alocada para cada pod que executa o binário da Speech-to-Text. Recomendamos usar pelo menos duas CPUs, que é o padrão. Esse valor é chamado de $CPU. Se você especificar mais CPUs do que as disponíveis no cluster, o aplicativo vai emitir erros como Sem disponibilidade mínima ou Erros de pod: não programável.
Memória por pod	Quantidade de RAM a ser alocada para cada pod que executa o binário da Speech-to-Text. Recomendamos usar pelo menos 1 GiB, que é o padrão. Esse valor é chamado de $MEMORY. Se você especificar mais memória do que há disponível no cluster, o aplicativo vai emitir erros como Sem disponibilidade mínima ou Erros de pod: não programável.
O ID do projeto do Google Cloud Platform para exportar as métricas	(Opcional) É possível especificar um ID de projeto do Google Cloud Platform para que o servidor da On-Prem possa exportar métricas para o Stackdriver nesse projeto do Google Cloud Platform. Use o mesmo projeto do Google Cloud Platform em que o servidor da On-Prem será executado. Se você fornecer um projeto diferente, verifique se a conta de serviço que executa o servidor da On-Prem tem permissão para enviar métricas para esse projeto. Se esse campo estiver vazio, nenhuma métrica vai ser enviada. Esse valor é chamado de $METRIC_PROJECT.
Instalar objetos do Istio para balanceamento de carga	(Opcional) É possível especificar se os objetos do Istio serão instalados ou não para o balanceamento de carga gRPC. Se esta opção estiver marcada, as solicitações gRPC recebidas serão distribuídas entre diferentes pods para disponibilização. Você já precisa ter o Istio no cluster. Caso contrário, a instalação falhará. Esse valor é chamado de $ENABLE_ISTIO. Consulte o guia de início rápido antes de começar para saber como instalar e configurar o Istio.
IP público	(Opcional) É possível fornecer um endereço IP público neste campo para que a solução possa ser acessada publicamente. Isso só se aplica quando o cluster aceita IPs públicos e você alocou um IP para a região em que ele está sendo executado. Se você não fornecer um IP público, precisará configurar a rede por conta própria. Esse valor é chamado de $PUBLIC_IP. Esse IP público pode ser acessado na Internet.
Modelo 1	Especifique o primeiro idioma para que o servidor da On-Prem atenda às solicitações de ASR recebidas. Esse valor é chamado de $MODEL1.
Modelo 2	Especifique o segundo idioma para que o servidor da On-Prem atenda às solicitações de ASR recebidas. Se você não precisar de um segundo idioma, escolha Nenhum. Esse valor é chamado de $MODEL2.
Modelo 3	Especifique o terceiro idioma para que o servidor da On-Prem atenda às solicitações de ASR recebidas. Se você não precisar de um terceiro idioma, escolha Nenhum. Esse valor é chamado de $MODEL3.
Nome do secret	(Opcional para o GKE e obrigatório para o GKE On-Prem e outras nuvens híbridas) É necessário ter uma conta de serviço do Google para autenticação que esteja na lista de permissões do projeto do Google Cloud Platform para que os pods do K8s nos clusters do GKE On-Prem consultem os serviços do Google Cloud. Essa conta de serviço precisa ter pelo menos a permissão de Leitor do projeto. Faça o download de uma chave para a conta de serviço do Google e coloque-a em um secret no mesmo namespace do aplicativo. O arquivo precisa ter o nome key.json. Esse valor é chamado de $GSA_SECRET. Consulte a documentação do Kubernetes para saber mais.