Parametri di configurazione dell'API on-prem

La soluzione Speech-to-Text on-prem espone alcuni parametri di configurazione. I parametri riportati di seguito sono esposti sia nelle installazioni della CLI sia in quelle del programma di avvio app del marketplace.

Nome parametro Descrizione
Nome Il nome dell'applicazione. La stringa "speech" è un'impostazione predefinita sicura. Questo valore è indicato come $NAME.
Spazio dei nomi Lo spazio dei nomi in cui è stato eseguito il deployment dell'applicazione. La stringa "speech" è un'impostazione predefinita sicura. Questo valore è denominato $NAMESPACE.
Repliche Il numero di repliche che vuoi che la soluzione esegua (il valore predefinito è 3). In questo modo puoi scalare l'applicazione orizzontalmente. Questo valore è indicato come $REPLICAS.
CPU per pod Il numero di CPU da allocare a ogni pod che esegue il file binario Speech-to-Text. Il valore predefinito è 2 e sono consigliati almeno 2. Questo valore è indicato come $CPU. Se specifichi più CPU di quelle disponibili nel cluster, l'app genera errori come "Non ha disponibilità minima" o "Errori del pod: non pianificabile".
Memoria per pod La quantità di RAM da allocare a ogni pod che esegue il file binario Speech-to-Text. Il valore predefinito è 1 Gi e consigliamo di impostare almeno 1 Gi. Questo valore è denominato $MEMORY. Se specifichi una quantità di memoria superiore a quella disponibile nel cluster, l'app genera errori come "Non ha disponibilità minima" o "Errori del pod: non pianificabile".
L'ID progetto della piattaforma Google Cloud in cui esportare le metriche (Facoltativo) Puoi specificare un ID progetto Google Cloud Platform in modo che il server on-premise possa esportare le metriche in Stackdriver in quel progetto Google Cloud Platform. Utilizza lo stesso progetto Google Cloud Platform in cui verrà eseguito il server on-premise. Se fornisci un progetto diverso, assicurati che l'account di servizio che esegue il server on-premise abbia l'autorizzazione per inviare le metriche a quel progetto. Se questo campo è vuoto, non verranno inviate metriche. Questo valore è indicato come $METRIC_PROJECT.
Installa gli oggetti Istio per il bilanciamento del carico (Facoltativo) Puoi specificare se installare o meno gli oggetti Istio per il bilanciamento del carico gRPC. Se questa opzione è selezionata, le richieste gRPC in entrata verranno distribuite a pod diversi per la pubblicazione. Istio deve essere già installato nel cluster, altrimenti l'installazione non andrà a buon fine. Questo valore è indicato come $ENABLE_ISTIO. Per ulteriori informazioni sull'installazione e sulla configurazione di Istio, consulta la guida rapida Prima di iniziare.
IP pubblico (Facoltativo) In questo campo puoi fornire un indirizzo IP pubblico per rendere la tua soluzione raggiungibile pubblicamente. Questo vale solo se il cluster supporta gli IP pubblici e ne hai allocato uno alla regione in cui è in esecuzione. Se non fornisci un IP pubblico, dovrai configurare la rete autonomamente. Questo valore è indicato come $PUBLIC_IP. Tieni presente che questo IP pubblico è accessibile su internet.
Modello 1 Devi specificare la prima lingua per consentire al server on-premise di gestire le richieste ASR in arrivo. Questo valore è indicato come $MODEL1.
Modello 2 Devi specificare la seconda lingua per consentire al server on-premise di gestire le richieste ASR in entrata. Se non hai bisogno di una seconda lingua, puoi scegliere Nessuna. Questo valore è indicato come $MODEL2.
Modello 3 Devi specificare la terza lingua per consentire al server on-premise di gestire le richieste ASR in entrata. Se non hai bisogno di una terza lingua, puoi scegliere Nessuna. Questo valore è indicato come $MODEL3.
Nome secret (Facoltativo per GKE, obbligatorio per GKE On-Prem e altri cloud ibridi) Per l'autenticazione è necessario un account di servizio Google della lista consentita del progetto Google Cloud Platform affinché i pod k8s all'interno dei cluster GKE on-premise possano eseguire query sui servizi Google Cloud. Questo account di servizio deve disporre almeno dell'autorizzazione Visualizzatore progetto. Scarica una chiave per l'account di servizio Google e inseriscila in un secret nello stesso spazio dei nomi dell'applicazione. Il nome del file deve essere key.json. Questo valore è indicato come $GSA_SECRET. Per ulteriori dettagli, consulta la documentazione di Kubernetes.