La soluzione Speech-to-Text on-prem espone alcuni parametri di configurazione. I parametri riportati di seguito sono esposti sia nelle installazioni della CLI sia in quelle del programma di avvio app del marketplace.
Nome parametro | Descrizione |
---|---|
Nome | Il nome dell'applicazione. La stringa "speech" è un'impostazione predefinita sicura. Questo valore è indicato come $NAME. |
Spazio dei nomi | Lo spazio dei nomi in cui è stato eseguito il deployment dell'applicazione. La stringa "speech" è un'impostazione predefinita sicura. Questo valore è denominato $NAMESPACE. |
Repliche | Il numero di repliche che vuoi che la soluzione esegua (il valore predefinito è 3). In questo modo puoi scalare l'applicazione orizzontalmente. Questo valore è indicato come $REPLICAS. |
CPU per pod | Il numero di CPU da allocare a ogni pod che esegue il file binario Speech-to-Text. Il valore predefinito è 2 e sono consigliati almeno 2. Questo valore è indicato come $CPU. Se specifichi più CPU di quelle disponibili nel cluster, l'app genera errori come "Non ha disponibilità minima" o "Errori del pod: non pianificabile". |
Memoria per pod | La quantità di RAM da allocare a ogni pod che esegue il file binario Speech-to-Text. Il valore predefinito è 1 Gi e consigliamo di impostare almeno 1 Gi. Questo valore è denominato $MEMORY. Se specifichi una quantità di memoria superiore a quella disponibile nel cluster, l'app genera errori come "Non ha disponibilità minima" o "Errori del pod: non pianificabile". |
L'ID progetto della piattaforma Google Cloud in cui esportare le metriche | (Facoltativo) Puoi specificare un ID progetto Google Cloud Platform in modo che il server on-premise possa esportare le metriche in Stackdriver in quel progetto Google Cloud Platform. Utilizza lo stesso progetto Google Cloud Platform in cui verrà eseguito il server on-premise. Se fornisci un progetto diverso, assicurati che l'account di servizio che esegue il server on-premise abbia l'autorizzazione per inviare le metriche a quel progetto. Se questo campo è vuoto, non verranno inviate metriche. Questo valore è indicato come $METRIC_PROJECT. |
Installa gli oggetti Istio per il bilanciamento del carico | (Facoltativo) Puoi specificare se installare o meno gli oggetti Istio per il bilanciamento del carico gRPC. Se questa opzione è selezionata, le richieste gRPC in entrata verranno distribuite a pod diversi per la pubblicazione. Istio deve essere già installato nel cluster, altrimenti l'installazione non andrà a buon fine. Questo valore è indicato come $ENABLE_ISTIO. Per ulteriori informazioni sull'installazione e sulla configurazione di Istio, consulta la guida rapida Prima di iniziare. |
IP pubblico | (Facoltativo) In questo campo puoi fornire un indirizzo IP pubblico per rendere la tua soluzione raggiungibile pubblicamente. Questo vale solo se il cluster supporta gli IP pubblici e ne hai allocato uno alla regione in cui è in esecuzione. Se non fornisci un IP pubblico, dovrai configurare la rete autonomamente. Questo valore è indicato come $PUBLIC_IP. Tieni presente che questo IP pubblico è accessibile su internet. |
Modello 1 | Devi specificare la prima lingua per consentire al server on-premise di gestire le richieste ASR in arrivo. Questo valore è indicato come $MODEL1. |
Modello 2 | Devi specificare la seconda lingua per consentire al server on-premise di gestire le richieste ASR in entrata. Se non hai bisogno di una seconda lingua, puoi scegliere Nessuna. Questo valore è indicato come $MODEL2. |
Modello 3 | Devi specificare la terza lingua per consentire al server on-premise di gestire le richieste ASR in entrata. Se non hai bisogno di una terza lingua, puoi scegliere Nessuna. Questo valore è indicato come $MODEL3. |
Nome secret | (Facoltativo per GKE, obbligatorio per GKE On-Prem e altri cloud ibridi) Per l'autenticazione è necessario un account di servizio Google della lista consentita del progetto Google Cloud Platform affinché i pod k8s all'interno dei cluster GKE on-premise possano eseguire query sui servizi Google Cloud. Questo account di servizio deve disporre almeno dell'autorizzazione Visualizzatore progetto. Scarica una chiave per l'account di servizio Google e inseriscila in un secret nello stesso spazio dei nomi dell'applicazione. Il nome del file deve essere key.json. Questo valore è indicato come $GSA_SECRET. Per ulteriori dettagli, consulta la documentazione di Kubernetes. |