A solução Speech-to-Text On-Prem expõe alguns parâmetros de configuração. Os parâmetros abaixo são expostos nas instalações da CLI e do inicializador de aplicativos do Marketplace.
Nome do parâmetro | Descrição |
---|---|
Nome | O nome do aplicativo. A string "speech" é um padrão seguro. Esse valor é chamado de $NAME. |
Namespace | O namespace em que o aplicativo será implantado. A string "speech" é um padrão seguro. Esse valor é chamado de $NAMESPACE. |
Réplicas | O número de réplicas que você quer que a solução execute (o padrão é 3). Isso permite escalonar o aplicativo horizontalmente. Esse valor é chamado de $REPLICAS. |
CPUs por pod | Quantas CPUs alocar a cada pod que executa o binário de conversão de voz em texto. O padrão é 2 e pelo menos 2 são recomendados. Esse valor é chamado de $CPU. Se você especificar mais CPUs do que as que estão disponíveis no cluster, o aplicativo emitirá erros como "Não tem disponibilidade mínima" ou "Erros de pod: não programáveis". |
Memória por pod | Quantidade de RAM a ser alocada para cada pod que executa o binário de conversão de voz em texto. O padrão é 1Gi, e pelo menos 1 Gi é recomendado. Esse valor é chamado de $MEMORY. Se você especificar mais memória do que há disponível no cluster, o aplicativo emitirá erros como "Não tem disponibilidade mínima" ou "Erros de pod: não programáveis". |
O ID do projeto do Google Cloud Platform para exportar métricas | (Opcional) É possível especificar um ID de projeto do Google Cloud Platform para que o servidor da On-Prem possa exportar métricas para o Stackdriver nesse projeto do Google Cloud Platform. Use o mesmo projeto do Google Cloud Platform em que o servidor da On-Prem será executado. Se você fornecer um projeto diferente, verifique se a conta de serviço que executa o servidor local tem permissão para enviar métricas para esse projeto. Se esse campo estiver vazio, nenhuma métrica será enviada. Esse valor é chamado de $METRIC_PROJECT. |
Instalar objetos do Istio para balanceamento de carga | (Opcional) É possível especificar se os objetos do Istio serão instalados ou não para o balanceamento de carga gRPC. Se esta opção estiver marcada, as solicitações gRPC recebidas serão distribuídas para diferentes pods disponibilizarem. Você precisa ter o Istio já instalado no cluster. Caso contrário, a instalação falhará. Esse valor é chamado de $ENABLE_ISTIO. Consulte o guia de início rápido antes de começar para mais informações sobre como instalar e configurar o Istio. |
IP público | (Opcional) É possível fornecer um endereço IP público neste campo para que a solução possa ser acessada publicamente. Isso só se aplica se o cluster for compatível com IPs públicos e você tiver alocado um para a região em que seu cluster está sendo executado. Se você não fornecer um IP público, precisará configurar sua rede por conta própria. Esse valor é chamado de $PUBLIC_IP. Esse IP público pode ser acessado na Internet. |
Modelo 1 | Especifique o primeiro idioma para que o servidor local atenda às solicitações de ASR recebidas. Esse valor é chamado de $MODEL1. |
Modelo 2 | Especifique o segundo idioma para que o servidor local atenda às solicitações de ASR recebidas. Se você não precisar de um segundo idioma, poderá escolher "Nenhum". Esse valor é chamado de $MODEL2. |
Modelo 3 | Especifique o terceiro idioma para que o servidor local atenda às solicitações de ASR recebidas. Se você não precisar de um terceiro idioma, poderá escolher "Nenhum". Esse valor é chamado de $MODEL3. |
Nome da chave secreta | (Opcional para GKE, obrigatório para GKE On-Prem e outras nuvens híbridas.) É necessário ter uma conta de serviço do Google da lista de permissões do projeto do Google Cloud Platform para autenticação para que os pods k8s nos clusters GKE On-Prem consultem os serviços do Google Cloud. Essa conta de serviço precisa ter pelo menos a permissão de leitor do projeto. Faça o download de uma chave para a conta de serviço do Google e coloque-a em um secret no mesmo namespace do aplicativo. O arquivo precisa ser nomeado como key.json. Esse valor é chamado de $GSA_SECRET. Consulte a documentação do Kubernetes para mais detalhes. |