Questa procedura riguarda l'upgrade dalla versione 1.11.x di Apigee hybrid alla versione 1.12.3 di Apigee hybrid.
Modifiche rispetto ad Apigee hybrid 1.11
La versione 1.12 di Apigee hybrid introduce le seguenti modifiche che influiscono sul processo di upgrade. Per un elenco completo delle funzionalità nella versione 1.12, consulta le note di rilascio della versione ibrida 1.12.0.
- Cassandra 4.x: a partire dalla versione 1.12, Apigee Hybrid utilizza Cassandra versione 4 e successive.
-
apigeectl
Ritiro: a partire dalla versione 1.12, Apigee hybrid supporta solo Helm per l'installazione e la gestione dell'installazione ibrida. -
È ora disponibile una nuova suite di metriche per il monitoraggio dei proxy e degli endpoint target di Apigee. Per la versione ibrida 1.12, le risorse monitorate
ProxyV2
eTargetV2
non saranno più in uso per impostazione predefinita. Tutte le metriche proxy e target verranno pubblicate nelle risorse monitorateProxy
eTarget
.Per continuare a emettere metriche per le risorse monitorate
ProxyV2
eTargetV2
, impostametrics.disablePrometheusPipeline
sutrue
inoverrides.yaml
.Se hai configurato avvisi basati su metriche, verifica di utilizzare le metriche corrette per l'installazione ibrida. Per ulteriori informazioni, consulta Avvisi basati su metriche.
Considerazioni prima di iniziare un upgrade alla versione 1.12
L'upgrade dalla versione 1.11 di Apigee hybrid alla versione 1.12 include un upgrade del database Cassandra dalla versione 3.11.x alla versione 4.x. Sebbene l'upgrade di Cassandra venga gestito nell'ambito della procedura di upgrade di Apigee hybrid, tieni presenti le seguenti considerazioni:
- L'upgrade della versione di Cassandra verrà eseguito in background e su un pod (o un nodo Cassandra) alla volta, quindi pianifica una capacità ridotta del database durante l'upgrade.
- Scala la capacità di Cassandra e assicurati che l'utilizzo del disco sia vicino o inferiore al 50% prima di iniziare l'upgrade.
- Convalida e testa le procedure di backup e ripristino di Cassandra.
- Esegui il backup dei dati di Cassandra nell'installazione ibrida della versione 1.11 prima di iniziare l'upgrade e convalida i backup.
- L'upgrade di
apigee-datastore
comporterà un aumento temporaneo del consumo della CPU a causa delle attività di post-upgrade eseguite daCassandra
- Una volta eseguito l'upgrade del componente
apigee-datastore
(Cassandra), non puoi eseguire il rollback alla versione precedente. Esistono due scenari per eseguire il rollback di un upgrade alla versione 1.12 ibrida dopo l'upgrade del componenteapigee-datastore
:- Se il componente
apigee-datastore
è in uno stato buono, ma altri componenti necessitano di un rollback, puoi eseguire il rollback di questi ultimi singolarmente. - Se il componente
apigee-datastore
è in uno stato non valido, devi eseguire il ripristino da un backup della versione 1.11 in un'installazione della versione 1.11.
- Se il componente
Considerazioni prima di eseguire l'upgrade di un'installazione in una singola regione
Se devi eseguire il rollback a una versione precedente di Apigee Hybrid, la procedura potrebbe richiedere un tempo di riposo. Pertanto, se stai eseguendo l'upgrade di un'installazione con una sola regione, ti consigliamo di creare una seconda regione ed eseguire l'upgrade di una sola regione alla volta nella seguente sequenza:
- Aggiungi una seconda regione all'installazione esistente utilizzando la stessa versione ibrida. Consulta Deployment in più regioni nella documentazione della versione 1.11.
- Esegui il backup e convalida i dati della prima regione prima di iniziare un upgrade. Consulta la panoramica del backup di Cassandra nella documentazione della versione 1.11.
- Esegui l'upgrade della regione appena aggiunta a hybrid 1.12.
- Sposta il traffico nella nuova regione e convalidalo.
- Una volta convalidata, esegui l'upgrade della regione precedente con la versione ibrida 1.12.
- Ripristina tutto il traffico nella regione precedente e convalidalo.
- Esegui la dismissione della nuova regione.
Considerazioni prima di eseguire l'upgrade di un'installazione multiregione
Apigee consiglia la seguente sequenza per eseguire l'upgrade di un'installazione multiregione:
- Esegui il backup e convalida i dati di ogni regione prima di iniziare l'upgrade.
- Esegui l'upgrade della versione ibrida in una regione e assicurati che tutti i pod siano in stato di esecuzione per convalidare l'upgrade.
- Convalida il traffico nella regione di cui è stato eseguito l'upgrade.
- Esegui l'upgrade di ogni regione successiva solo dopo aver convalidato il traffico nella regione precedente.
- In caso di potenziale necessità di eseguire il rollback di un upgrade in un deployment multiregione, preparati a rimuovere il traffico dalle regioni in cui si sono verificati errori, valuta la possibilità di aggiungere sufficiente capacità nella regione in cui verrà reindirizzato il traffico per gestire il traffico per entrambe le regioni.
Prerequisiti
Prima di eseguire l'upgrade alla versione ibrida 1.12, assicurati che la tua installazione soddisfi i seguenti requisiti:
- Un'installazione di Apigee hybrid versione 1.11 gestita con Helm.
- Se gestisci l'installazione ibrida con
apigeectl
, devi prima eseguire la migrazione dei cluster alla gestione di Helm. Consulta Eseguire la migrazione di Apigee hybrid a Helm da apigeectl nella documentazione di hybrid v1.11. - Se la tua installazione ibrida esegue una versione precedente alla 1.11, devi eseguire l'upgrade alla versione 1.11 prima di eseguire l'upgrade alla 1.12. consulta Eseguire l'upgrade di Apigee hybrid alla versione 1.11.
- Se gestisci l'installazione ibrida con
- Versione Helm v3.14.2 o successive.
kubectl
versione 1.27, 1.28 o 1.29 (consigliata).- Versione cert-manager 1.13.0. Se necessario, esegui l'upgrade di cert-manager nella sezione Prepararsi all'upgrade alla versione di seguito.
Limitazioni
Tieni presente le seguenti limitazioni quando pianifichi l'upgrade dalla versione 1.11 di Apigee hybrid alla versione 1.12. La pianificazione può aiutarti a ridurre la necessità di tempi di inattività se devi eseguire il rollback o il ripristino dopo l'upgrade.
- I backup di Hybrid 1.12 non possono essere ripristinati in Hybrid 1.11 e viceversa a causa dell'incompatibilità tra le due versioni.
- Non puoi scalare i pod del datastore durante l'upgrade alla versione 1.12. Soddisfa le tue esigenze di scalabilità in tutte le regioni prima di iniziare l'upgrade dell'installazione ibrida.
- In un'installazione ibrida in una singola regione, non puoi eseguire il rollback del componente del datastore al termine del processo di upgrade del datastore. Non puoi eseguire il rollback di un datastore Cassandra 4.x a un datastore Cassandra 3.x. Per farlo, dovrai ripristinare i dati di Cassandra 3.x dal backup più recente (dall'installazione della versione ibrida 1.11).
- L'eliminazione o l'aggiunta di una regione non è supportata durante l'upgrade. In un upgrade multiregione, devi completare l'upgrade di tutte le regioni prima di poter aggiungere o eliminare regioni.
Panoramica dell'upgrade alla versione 1.12.3
Le procedure per l'upgrade di Apigee hybrid sono organizzate nelle seguenti sezioni:
Prepararsi all'upgrade alla versione 1.12
Esegui il backup di Cassandra
- Esegui il backup del database Cassandra in tutte le regioni applicabili e convalida i dati nell'installazione ibrida della versione 1.11 prima di iniziare l'upgrade. Consulta Monitoraggio dei backup nella documentazione della versione 1.11.
- Riavviare tutti i pod Cassandra nel cluster prima di avviare la procedura di upgrade, in modo che eventuali problemi in sospeso possano emergere.
Per riavviare e testare i pod Cassandra, elimina ogni pod singolarmente, uno alla volta, quindi verifica che venga ripristinato in uno stato di esecuzione e che il test di idoneità venga superato:
-
Elenca i pod Cassandra:
kubectl get pods -n APIGEE_NAMESPACE -l app=apigee-cassandra
Ad esempio:
kubectl get pods -n apigee -l app=apigee-cassandra
NAME READY STATUS RESTARTS AGE apigee-cassandra-default-0 1/1 Running 0 2h apigee-cassandra-default-1 1/1 Running 0 2h apigee-cassandra-default-2 1/1 Running 0 2h . . . -
Elimina un pod:
kubectl delete pod -n APIGEE_NAMESPACE CASSANDRA_POD_NAME
Ad esempio:
kubectl delete pod -n apigee apigee-cassandra-default-0
-
Controlla lo stato elencando di nuovo i pod Cassandra:
kubectl get pods -n APIGEE_NAMESPACE -l app=apigee-cassandra
Ad esempio:
kubectl get pods -n apigee -l app=apigee-cassandra
NAME READY STATUS RESTARTS AGE apigee-cassandra-default-0 1/1 Running 0 16s apigee-cassandra-default-1 1/1 Running 0 2h apigee-cassandra-default-2 1/1 Running 0 2h . . .
-
Elenca i pod Cassandra:
- Applica di nuovo l'ultimo file di override noto per assicurarti che non siano state apportate modifiche in modo da poter utilizzare la stessa configurazione per eseguire l'upgrade alla versione ibrida 1.12.
- Assicurati che tutti i nodi Cassandra in tutte le regioni siano nello stato
UN
(Up / Normale). Se un nodo Cassandra è in uno stato diverso, risolvi il problema prima di iniziare l'upgrade.Puoi convalidare lo stato dei nodi Cassandra con i seguenti comandi:
- Elenca i pod Cassandra:
kubectl get pods -n APIGEE_NAMESPACE -l app=apigee-cassandra
Ad esempio:
kubectl get pods -n apigee -l app=apigee-cassandra
NAME READY STATUS RESTARTS AGE apigee-cassandra-default-0 1/1 Running 0 2h apigee-cassandra-default-1 1/1 Running 0 2h apigee-cassandra-default-2 1/1 Running 0 2h apigee-cassandra-default-3 1/1 Running 0 16m apigee-cassandra-default-4 1/1 Running 0 14m apigee-cassandra-default-5 1/1 Running 0 13m apigee-cassandra-default-6 1/1 Running 0 9m apigee-cassandra-default-7 1/1 Running 0 9m apigee-cassandra-default-8 1/1 Running 0 8m - Controlla lo stato dei nodi per ogni pod Cassandra con il comando
kubectl nodetool status
kubectl -n APIGEE_NAMESPACE exec -it CASSANDRA_POD_NAME nodetool status
Ad esempio:
kubectl -n apigee exec -it apigee-cassandra-default-0 nodetool status
Datacenter: us-east1 ==================== Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 10.16.2.6 690.17 KiB 256 48.8% b02089d1-0521-42e1-bbed-900656a58b68 ra-1 UN 10.16.4.6 705.55 KiB 256 51.6% dc6b7faf-6866-4044-9ac9-1269ebd85dab ra-1 UN 10.16.11.11 674.36 KiB 256 48.3% c7906366-6c98-4ff6-a4fd-17c596c33cf7 ra-1 UN 10.16.1.11 697.03 KiB 256 49.8% ddf221aa-80aa-497d-b73f-67e576ff1a23 ra-1 UN 10.16.5.13 703.64 KiB 256 50.9% 2f01ac42-4b6a-4f9e-a4eb-4734c24def95 ra-1 UN 10.16.8.15 700.42 KiB 256 50.6% a27f93af-f8a0-4c88-839f-2d653596efc2 ra-1 UN 10.16.11.3 697.03 KiB 256 49.8% dad221ff-dad1-de33-2cd3-f1.672367e6f ra-1 UN 10.16.14.16 704.04 KiB 256 50.9% 1feed042-a4b6-24ab-49a1-24d4cef95473 ra-1 UN 10.16.16.1 699.82 KiB 256 50.6% beef93af-fee0-8e9d-8bbf-efc22d653596 ra-1
- Elenca i pod Cassandra:
Esegui il backup delle directory di installazione ibride
- Queste istruzioni utilizzano la variabile di ambiente APIGEE_HELM_CHARTS_HOME per la directory nel file system in cui hai installato i grafici Helm. Se necessario, cambia directory
in questa directory e definisci la variabile con il seguente comando:
Linux
export APIGEE_HELM_CHARTS_HOME=$PWD
echo $APIGEE_HELM_CHARTS_HOME
Mac OS
export APIGEE_HELM_CHARTS_HOME=$PWD
echo $APIGEE_HELM_CHARTS_HOME
Windows
set APIGEE_HELM_CHARTS_HOME=%CD%
echo %APIGEE_HELM_CHARTS_HOME%
- Crea una copia di backup della directory
$APIGEE_HELM_CHARTS_HOME/
della versione 1.11. Puoi utilizzare qualsiasi processo di backup. Ad esempio, puoi creare un filetar
dell'intera directory con:tar -czvf $APIGEE_HELM_CHARTS_HOME/../apigee-helm-charts-v1.11-backup.tar.gz $APIGEE_HELM_CHARTS_HOME
- Esegui il backup del database Cassandra seguendo le istruzioni riportate in Backup e recupero di Cassandra.
- Se utilizzi file di certificati di servizio (
.json
) nelle tue override per autenticare gli account di servizio, assicurati che i file di certificati degli account di servizio si trovino nella directory del grafico Helm corretta. I grafici Helm non possono leggere i file esterni a ogni directory del grafico.Questo passaggio non è necessario se utilizzi i secret Kubernetes o Workload Identity per autenticare gli account di servizio.
La tabella seguente mostra la destinazione di ciascun file dell'account di servizio, a seconda del tipo di installazione:
Produzione
Service account Nome file predefinito Directory dei grafici Helm apigee-cassandra
PROJECT_ID-apigee-cassandra.json
$APIGEE_HELM_CHARTS_HOME/apigee-datastore/
apigee-logger
PROJECT_ID-apigee-logger.json
$APIGEE_HELM_CHARTS_HOME/apigee-telemetry/
apigee-mart
PROJECT_ID-apigee-mart.json
$APIGEE_HELM_CHARTS_HOME/apigee-org/
apigee-metrics
PROJECT_ID-apigee-metrics.json
$APIGEE_HELM_CHARTS_HOME/apigee-telemetry/
apigee-runtime
PROJECT_ID-apigee-runtime.json
$APIGEE_HELM_CHARTS_HOME/apigee-env
apigee-synchronizer
PROJECT_ID-apigee-synchronizer.json
$APIGEE_HELM_CHARTS_HOME/apigee-env/
apigee-udca
PROJECT_ID-apigee-udca.json
$APIGEE_HELM_CHARTS_HOME/apigee-org/
apigee-watcher
PROJECT_ID-apigee-watcher.json
$APIGEE_HELM_CHARTS_HOME/apigee-org/
Non prod
Crea una copia del file dell'account di servizio
apigee-non-prod
in ciascuna delle seguenti directory:Service account Nome file predefinito Directory dei grafici Helm apigee-non-prod
PROJECT_ID-apigee-non-prod.json
$APIGEE_HELM_CHARTS_HOME/apigee-datastore/
$APIGEE_HELM_CHARTS_HOME/apigee-telemetry/
$APIGEE_HELM_CHARTS_HOME/apigee-org/
$APIGEE_HELM_CHARTS_HOME/apigee-env/
-
Assicurati che i file del certificato e della chiave TLS (
.crt
,.key
e/o.pem
) si trovino nella directory$APIGEE_HELM_CHARTS_HOME/apigee-virtualhost/
.
Esegui l'upgrade della versione di Kubernetes
Controlla la versione della piattaforma Kubernetes e, se necessario, esegui l'upgrade a una versione supportata sia da hybrid 1.11 sia da hybrid 1.12. Se hai bisogno di aiuto, consulta la documentazione della tua piattaforma.
Installa il runtime di hybrid 1.12.3
Prepararsi per l'upgrade dei grafici Helm
- Estrai i grafici Helm di Apigee.
I grafici di Apigee hybrid sono ospitati in Google Artifact Registry:
oci://us-docker.pkg.dev/apigee-release/apigee-hybrid-helm-charts
Utilizzando il comando
pull
, copia tutti i grafici Helm hybrid di Apigee nel tuo spazio di archiviazione locale con il seguente comando:export CHART_REPO=oci://us-docker.pkg.dev/apigee-release/apigee-hybrid-helm-charts
export CHART_VERSION=1.12.3
helm pull $CHART_REPO/apigee-operator --version $CHART_VERSION --untar
helm pull $CHART_REPO/apigee-datastore --version $CHART_VERSION --untar
helm pull $CHART_REPO/apigee-env --version $CHART_VERSION --untar
helm pull $CHART_REPO/apigee-ingress-manager --version $CHART_VERSION --untar
helm pull $CHART_REPO/apigee-org --version $CHART_VERSION --untar
helm pull $CHART_REPO/apigee-redis --version $CHART_VERSION --untar
helm pull $CHART_REPO/apigee-telemetry --version $CHART_VERSION --untar
helm pull $CHART_REPO/apigee-virtualhost --version $CHART_VERSION --untar
- Esegui l'upgrade di cert-manager, se necessario.
Se devi eseguire l'upgrade della versione di cert-manager, installa la nuova versione con il seguente comando:
kubectl apply -f https://github.com/cert-manager/cert-manager/releases/download/v1.13.0/cert-manager.yaml
- Installa i CRD di Apigee aggiornati:
-
Utilizza la funzionalità di prova simulata
kubectl
eseguendo il seguente comando:kubectl apply -k apigee-operator/etc/crds/default/ --server-side --force-conflicts --validate=false --dry-run
-
Dopo la convalida con il comando dry-run, esegui il seguente comando:
kubectl apply -k apigee-operator/etc/crds/default/ --server-side --force-conflicts --validate=false
- Convalida l'installazione con il comando
kubectl get crds
:kubectl get crds | grep apigee
L'output dovrebbe essere simile al seguente:
apigeedatastores.apigee.cloud.google.com 2023-10-09T14:48:30Z apigeedeployments.apigee.cloud.google.com 2023-10-09T14:48:30Z apigeeenvironments.apigee.cloud.google.com 2023-10-09T14:48:31Z apigeeissues.apigee.cloud.google.com 2023-10-09T14:48:31Z apigeeorganizations.apigee.cloud.google.com 2023-10-09T14:48:32Z apigeeredis.apigee.cloud.google.com 2023-10-09T14:48:33Z apigeerouteconfigs.apigee.cloud.google.com 2023-10-09T14:48:33Z apigeeroutes.apigee.cloud.google.com 2023-10-09T14:48:33Z apigeetelemetries.apigee.cloud.google.com 2023-10-09T14:48:34Z cassandradatareplications.apigee.cloud.google.com 2023-10-09T14:48:35Z
-
-
Controlla le etichette sui nodi del cluster. Per impostazione predefinita, Apigee pianifica i pod di dati sui nodi con l'etichetta
cloud.google.com/gke-nodepool=apigee-data
e i pod di runtime vengono pianificati sui nodi con l'etichettacloud.google.com/gke-nodepool=apigee-runtime
. Puoi personalizzare le etichette del pool di nodi nel fileoverrides.yaml
.Per ulteriori informazioni, consulta la pagina Configurare i pool di nodi dedicati.
Installa i grafici Helm di Apigee hybrid
- In caso contrario, vai alla directory
APIGEE_HELM_CHARTS_HOME
. Esegui i seguenti comandi da quella directory. - Esegui l'upgrade di Apigee Operator/Controller:
Prova:
helm upgrade operator apigee-operator/ \ --install \ --create-namespace \ --namespace apigee-system \ -f OVERRIDES_FILE \ --dry-run
Esegui l'upgrade del grafico:
helm upgrade operator apigee-operator/ \ --install \ --create-namespace \ --namespace apigee-system \ -f OVERRIDES_FILE
Verifica l'installazione di Apigee Operator:
helm ls -n apigee-system
NAME NAMESPACE REVISION UPDATED STATUS CHART APP VERSION operator apigee-system 3 2023-06-26 00:42:44.492009 -0800 PST deployed apigee-operator-1.12.3 1.12.3
Verifica che sia attivo e funzionante controllandone la disponibilità:
kubectl -n apigee-system get deploy apigee-controller-manager
NAME READY UP-TO-DATE AVAILABLE AGE apigee-controller-manager 1/1 1 1 7d20h
- Esegui l'upgrade del datastore Apigee:
Prova:
helm upgrade datastore apigee-datastore/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE \ --dry-run
Esegui l'upgrade del grafico:
helm upgrade datastore apigee-datastore/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE
Verifica che
apigeedatastore
sia attivo controllandone lo stato:kubectl -n apigee get apigeedatastore default
NAME STATE AGE default running 2d
- Esegui l'upgrade della telemetria Apigee:
Prova:
helm upgrade telemetry apigee-telemetry/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE \ --dry-run
Esegui l'upgrade del grafico:
helm upgrade telemetry apigee-telemetry/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone lo stato:
kubectl -n apigee get apigeetelemetry apigee-telemetry
NAME STATE AGE apigee-telemetry running 2d
- Esegui l'upgrade di Apigee Redis:
Prova:
helm upgrade redis apigee-redis/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE \ --dry-run
Esegui l'upgrade del grafico:
helm upgrade redis apigee-redis/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone lo stato:
kubectl -n apigee get apigeeredis default
NAME STATE AGE default running 2d
- Esegui l'upgrade di Apigee Ingress Manager:
Prova:
helm upgrade ingress-manager apigee-ingress-manager/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE \ --dry-run
Esegui l'upgrade del grafico:
helm upgrade ingress-manager apigee-ingress-manager/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone la disponibilità:
kubectl -n apigee get deployment apigee-ingressgateway-manager
NAME READY UP-TO-DATE AVAILABLE AGE apigee-ingressgateway-manager 2/2 2 2 2d
- Esegui l'upgrade dell'organizzazione Apigee:
Prova:
helm upgrade ORG_NAME apigee-org/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE \ --dry-run
Esegui l'upgrade del grafico:
helm upgrade ORG_NAME apigee-org/ \ --install \ --namespace APIGEE_NAMESPACE \ -f OVERRIDES_FILE
Verifica che sia attivo controllando lo stato della rispettiva organizzazione:
kubectl -n apigee get apigeeorg
NAME STATE AGE apigee-org1-xxxxx running 2d
- Esegui l'upgrade dell'ambiente.
Devi installare un ambiente alla volta. Specifica l'ambiente con
--set env=
ENV_NAME:Prova:
helm upgrade ENV_RELEASE_NAME apigee-env/ \ --install \ --namespace APIGEE_NAMESPACE \ --set env=ENV_NAME \ -f OVERRIDES_FILE \ --dry-run
- ENV_RELEASE_NAME è il nome con cui hai installato in precedenza il grafico
apigee-env
. In Hybrid v1.10, in genere èapigee-env-ENV_NAME
. In Hybrid versione 1.11 e successive, di solito è ENV_NAME. - ENV_NAME è il nome dell'ambiente di cui stai eseguendo l'upgrade.
- OVERRIDES_FILE è il nuovo file delle sostituzioni per la versione 1.12.3
Esegui l'upgrade del grafico:
helm upgrade ENV_RELEASE_NAME apigee-env/ \ --install \ --namespace APIGEE_NAMESPACE \ --set env=ENV_NAME \ -f OVERRIDES_FILE
Verifica che sia attivo controllando lo stato del rispettivo env:
kubectl -n apigee get apigeeenv
NAME STATE AGE GATEWAYTYPE apigee-org1-dev-xxx running 2d
- ENV_RELEASE_NAME è il nome con cui hai installato in precedenza il grafico
-
Esegui l'upgrade dei gruppi di ambienti (
virtualhosts
).- Devi eseguire l'upgrade di un gruppo di ambienti (virtualhost) alla volta. Specifica il gruppo
di ambienti con
--set envgroup=
ENV_GROUP_NAME. Ripeti i seguenti comandi per ogni gruppo env menzionato nel file overrides.yaml:Prova:
helm upgrade ENV_GROUP_RELEASE_NAME apigee-virtualhost/ \ --install \ --namespace APIGEE_NAMESPACE \ --set envgroup=ENV_GROUP_NAME \ -f OVERRIDES_FILE \ --dry-run
ENV_GROUP_RELEASE_NAME è il nome con cui hai installato in precedenza il grafico
apigee-virtualhost
. In Hybrid v1.10, in genere èapigee-virtualhost-ENV_GROUP_NAME
. In Hybrid versione 1.11 e successive, solitamente è ENV_GROUP_NAME.Esegui l'upgrade del grafico:
helm upgrade ENV_GROUP_RELEASE_NAME apigee-virtualhost/ \ --install \ --namespace APIGEE_NAMESPACE \ --set envgroup=ENV_GROUP_NAME \ -f OVERRIDES_FILE
- Controlla lo stato di ApigeeRoute (AR).
L'installazione del
virtualhosts
crea ApigeeRouteConfig (ARC), che internamente crea ApigeeRoute (AR) quando lo watcher di Apigee estrae i dettagli relativi al gruppo di ambienti dal control plane. Pertanto, verifica che lo stato corrispondente dell'AR sia in esecuzione:kubectl -n apigee get arc
NAME STATE AGE apigee-org1-dev-egroup 2d
kubectl -n apigee get ar
NAME STATE AGE apigee-org1-dev-egroup-xxxxxx running 2d
- Devi eseguire l'upgrade di un gruppo di ambienti (virtualhost) alla volta. Specifica il gruppo
di ambienti con
Eseguire il rollback a una versione precedente
Questa sezione è suddivisa in sezioni a seconda dello stato del componente apigee-datastore
dopo l'upgrade alla versione 1.12 di Apigee hybrid. Esistono procedure per il rollback a livello di singola regione o multi-regione con il componente apigee-datastore
in uno stato buono e procedure per il recupero o il ripristino da un backup quando apigee-datastore
è in uno stato non valido.
Ripristino e rollback di una singola regione
Eseguire il rollback quando apigee-datastore
è in uno stato buono
Questa procedura spiega come eseguire il rollback di ogni componente Apigee hybrid dalla versione 1.12 alla versione 1.11 tranne apigee-datastore
. Il componente apigee-datastore
v1.12 è compatibile con le versioni precedenti dei componenti ibrida v1.11.
Per eseguire il rollback dell'installazione in una singola regione alla versione 1.11:
-
Prima di iniziare il rollback, verifica che tutti i pod siano in stato di esecuzione:
kubectl get pods -n APIGEE_NAMESPACE
kubectl get pods -n apigee-system
-
Convalida il rilascio dei componenti utilizzando Helm:
helm -n APIGEE_NAMESPACE list
helm -n apigee-system list
Ad esempio:
helm -n apigee list NAME NAMESPACE REVISION UPDATED STATUS CHART APP VERSION datastore apigee 2 2024-03-29 17:08:07.917848253 +0000 UTC deployed apigee-datastore-1.12.0 1.12.0 ingress-manager apigee 2 2024-03-29 17:21:02.917333616 +0000 UTC deployed apigee-ingress-manager-1.12.0 1.12.0 redis apigee 2 2024-03-29 17:19:51.143728084 +0000 UTC deployed apigee-redis-1.12.0 1.12.0 telemetry apigee 2 2024-03-29 17:16:09.883885403 +0000 UTC deployed apigee-telemetry-1.12.0 1.12.0 myhybridorg apigee 2 2024-03-29 17:21:50.899855344 +0000 UTC deployed apigee-org-1.12.0 1.12.0
-
Ripristina ogni componente tranne
apigee-datastore
con i seguenti comandi:- Crea la seguente variabile di ambiente:
- PREVIOUS_HELM_CHARTS_HOME: la directory in cui sono installati i grafici Helm di Apigee hybrid precedenti. Questa è la versione a cui esegui il rollback.
- Esegui il rollback dei virtualhost. Ripeti il seguente comando per ogni gruppo di ambienti
indicato nel file delle sostituzioni.
helm upgrade ENV_GROUP_RELEASE_NAME $PREVIOUS_HELM_CHARTS_HOME/apigee-virtualhost/ \ --namespace APIGEE_NAMESPACE \ --atomic \ --set envgroup=ENV_GROUP_NAME \ -f PREVIOUS_OVERRIDES_FILE
ENV_GROUP_RELEASE_NAME è il nome con cui hai installato in precedenza il grafico
apigee-virtualhost
. In Hybrid v1.10, in genere èapigee-virtualhost-ENV_GROUP_NAME
. In Hybrid versione 1.11 e successive, solitamente è ENV_GROUP_NAME. - Esegui il rollback delle env. Ripeti il seguente comando per ogni ambiente menzionato nel file delle sostituzioni.
helm upgrade apigee-env-ENV_NAME $PREVIOUS_HELM_CHARTS_HOME/apigee-env/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ --set env=ENV_NAME \ -f PREVIOUS_OVERRIDES_FILE
ENV_RELEASE_NAME è il nome con cui hai installato in precedenza il grafico
apigee-env
. In Hybrid v1.10, in genere èapigee-env-ENV_NAME
. In Hybrid versione 1.11 e successive, solitamente è ENV_NAME.Verifica che sia attivo controllando lo stato del rispettivo env:
kubectl -n apigee get apigeeenv
NAME STATE AGE GATEWAYTYPE apigee-org1-dev-xxx running 2d
- Esegui il rollback dell'organizzazione:
helm upgrade ORG_NAME $PREVIOUS_HELM_CHARTS_HOME/apigee-org/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica che sia attivo controllando lo stato della rispettiva organizzazione:
kubectl -n apigee get apigeeorg
NAME STATE AGE apigee-org1-xxxxx running 2d
- Esegui il rollback di Ingress Manager:
helm upgrade ingress-manager $PREVIOUS_HELM_CHARTS_HOME/apigee-ingress-manager/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone la disponibilità:
kubectl -n apigee get deployment apigee-ingressgateway-manager
NAME READY UP-TO-DATE AVAILABLE AGE apigee-ingressgateway-manager 2/2 2 2 2d
- Esegui il rollback di Redis:
helm upgrade redis $PREVIOUS_HELM_CHARTS_HOME/apigee-redis/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone lo stato:
kubectl -n apigee get apigeeredis default
NAME STATE AGE default running 2d
- Esegui il rollback di Apigee Telemetry:
helm upgrade telemetry $PREVIOUS_HELM_CHARTS_HOME/apigee-telemetry/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone lo stato:
kubectl -n apigee get apigeetelemetry apigee-telemetry
NAME STATE AGE apigee-telemetry running 2d
- Esegui il rollback di Apigee Controller:
helm upgrade operator $PREVIOUS_HELM_CHARTS_HOME/apigee-operator/ \ --install \ --namespace apigee-system \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica l'installazione di Apigee Operator:
helm ls -n apigee-system
NAME NAMESPACE REVISION UPDATED STATUS CHART APP VERSION operator apigee-system 3 2023-06-26 00:42:44.492009 -0800 PST deployed apigee-operator-1.12.3 1.12.3
Verifica che sia attivo e funzionante controllandone la disponibilità:
kubectl -n apigee-system get deploy apigee-controller-manager
NAME READY UP-TO-DATE AVAILABLE AGE apigee-controller-manager 1/1 1 1 7d20h
- Ripristina i CRD di Apigee hybrid:
kubectl apply -k $PREVIOUS_HELM_CHARTS_HOME/apigee-operator/etc/crds/default/ --server-side --force-conflicts --validate=false
- Crea la seguente variabile di ambiente:
-
Verifica che tutti i pod siano in stato di esecuzione o completamento:
kubectl get pods -n APIGEE_NAMESPACE
kubectl get pods -n apigee-system
-
Convalida il rilascio di tutti i componenti. Tutti i componenti devono essere nella versione precedente
tranne il datastore:
helm -n APIGEE_NAMESPACE list
helm -n apigee-system list
Ad esempio:
helm -n apigee list
NAME NAMESPACE REVISION UPDATED STATUS CHART APP VERSION datastore apigee 2 2024-03-29 18:47:55.979671057 +0000 UTC deployed apigee-datastore-1.12.0 1.12.0 ingress-manager apigee 3 2024-03-14 19:14:57.905700154 +0000 UTC deployed apigee-ingress-manager-1.11.0 1.11.0 redis apigee 3 2024-03-14 19:15:49.406917944 +0000 UTC deployed apigee-redis-1.11.0 1.11.0 telemetry apigee 3 2024-03-14 19:17:04.803421424 +0000 UTC deployed apigee-telemetry-1.11.0 1.11.0 myhybridorg apigee 3 2024-03-14 19:13:17.807673713 +0000 UTC deployed apigee-org-1.11.0 1.11.0
Ripristino quando apigee-datastore
non è in buono stato
Se l'upgrade del componente apigee-datastore
non è andato a buon fine, non puoi eseguire il rollback di apigee-datastore
dalla versione 1.12 alla versione 1.11. Devi invece eseguire il ripristino da un backup di un'installazione della versione 1.11. Utilizza la seguente
sequenza per ripristinare la versione precedente.
- Se non hai un'installazione attiva della versione 1.11 di Apigee hybrid (ad esempio in un'altra regione), crea una nuova installazione della versione 1.11 utilizzando i file di override e dei grafici di cui hai eseguito il backup. Consulta le istruzioni di installazione della versione 1.11 di Apigee hybrid.
- Ripristina la regione della versione 1.11 (o la nuova installazione) dal backup
seguendo le istruzioni riportate in:
- Backup dell'interfaccia Cloud Storage (CSI): backup e ripristino CSI di Cassandra.
- Backup non CSI: ripristino in un'unica regione.
- Verificare il traffico verso l'installazione ripristinata
- (Facoltativo) Rimuovi l'installazione della versione 1.12 seguendo le istruzioni riportate in Disinstallare il runtime di hybrid.
Ripristino e rollback su più regioni
Eseguire il rollback quando apigee-datastore
è in uno stato buono
Questa procedura spiega come eseguire il rollback di ogni componente Apigee hybrid dalla versione 1.12 alla versione 1.11 tranne apigee-datastore
. Il componente apigee-datastore
v1.12 è compatibile con le versioni precedenti dei componenti ibrida v1.11.
-
Prima di iniziare il rollback, verifica che tutti i pod siano in stato di esecuzione:
kubectl get pods -n APIGEE_NAMESPACE
kubectl get pods -n apigee-system
- Assicurati che tutti i nodi Cassandra in tutte le regioni siano nello stato
UN
(Up / Normale). Se un nodo Cassandra è in uno stato diverso, risolvi il problema prima di iniziare la procedura di upgrade.Puoi convalidare lo stato dei nodi Cassandra con i seguenti comandi:
- Elenca i pod Cassandra:
kubectl get pods -n APIGEE_NAMESPACE -l app=apigee-cassandra
Ad esempio:
kubectl get pods -n apigee -l app=apigee-cassandra
NAME READY STATUS RESTARTS AGE apigee-cassandra-default-0 1/1 Running 0 2h apigee-cassandra-default-1 1/1 Running 0 2h apigee-cassandra-default-2 1/1 Running 0 2h apigee-cassandra-default-3 1/1 Running 0 16m apigee-cassandra-default-4 1/1 Running 0 14m apigee-cassandra-default-5 1/1 Running 0 13m apigee-cassandra-default-6 1/1 Running 0 9m apigee-cassandra-default-7 1/1 Running 0 9m apigee-cassandra-default-8 1/1 Running 0 8m - Controlla lo stato dei nodi per ogni pod Cassandra con il comando
kubectl nodetool status
kubectl -n APIGEE_NAMESPACE exec -it CASSANDRA_POD_NAME -- nodetool -u JMX_USER -pw JMX_PASSWORD
Ad esempio:
kubectl -n apigee exec -it apigee-cassandra-default-0 -- nodetool -u jmxuser -pw JMX_PASSWORD status
Datacenter: us-east1 ==================== Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 10.16.2.6 690.17 KiB 256 48.8% b02089d1-0521-42e1-bbed-900656a58b68 ra-1 UN 10.16.4.6 705.55 KiB 256 51.6% dc6b7faf-6866-4044-9ac9-1269ebd85dab ra-1 UN 10.16.11.11 674.36 KiB 256 48.3% c7906366-6c98-4ff6-a4fd-17c596c33cf7 ra-1 UN 10.16.1.11 697.03 KiB 256 49.8% ddf221aa-80aa-497d-b73f-67e576ff1a23 ra-1 UN 10.16.5.13 703.64 KiB 256 50.9% 2f01ac42-4b6a-4f9e-a4eb-4734c24def95 ra-1 UN 10.16.8.15 700.42 KiB 256 50.6% a27f93af-f8a0-4c88-839f-2d653596efc2 ra-1 UN 10.16.11.3 697.03 KiB 256 49.8% dad221ff-dad1-de33-2cd3-f1.672367e6f ra-1 UN 10.16.14.16 704.04 KiB 256 50.9% 1feed042-a4b6-24ab-49a1-24d4cef95473 ra-1 UN 10.16.16.1 699.82 KiB 256 50.6% beef93af-fee0-8e9d-8bbf-efc22d653596 ra-1
Se non tutti i pod Cassandra sono in stato
UN
, segui le istruzioni riportate in Rimuovere i nodi DOWN dal cluster Cassandra. - Elenca i pod Cassandra:
- Vai alla directory in cui sono installati i grafici Helm di Apigee hybrid precedenti
-
Modifica il contesto nella regione di cui è stato eseguito l'upgrade
kubectl config use-context UPGRADED_REGION_CONTEXT
-
Verifica che tutti i pod siano in esecuzione:
kubectl get pods -n APIGEE_NAMESPACE
kubectl get pods -n apigee-system
-
Utilizza il comando helm per assicurarti che sia stato eseguito l'upgrade a Hybrid 1.12 per tutte le release:
helm -n APIGEE_NAMESPACE list
helm -n apigee-system list
Ad esempio:
helm -n apigee list NAME NAMESPACE REVISION UPDATED STATUS CHART APP VERSION datastore apigee 2 2024-03-29 17:08:07.917848253 +0000 UTC deployed apigee-datastore-1.12.0 1.12.0 ingress-manager apigee 2 2024-03-29 17:21:02.917333616 +0000 UTC deployed apigee-ingress-manager-1.12.0 1.12.0 redis apigee 2 2024-03-29 17:19:51.143728084 +0000 UTC deployed apigee-redis-1.12.0 1.12.0 telemetry apigee 2 2024-03-29 17:16:09.883885403 +0000 UTC deployed apigee-telemetry-1.12.0 1.12.0 myhybridorg apigee 2 2024-03-29 17:21:50.899855344 +0000 UTC deployed apigee-org-1.12.0 1.12.0
-
Ripristina ogni componente tranne
apigee-datastore
con i seguenti comandi:- Crea la seguente variabile di ambiente:
- PREVIOUS_HELM_CHARTS_HOME: la directory in cui sono installati i grafici Helm di Apigee hybrid precedenti. Questa è la versione a cui esegui il rollback.
- Esegui il rollback dei virtualhost. Ripeti il seguente comando per ogni gruppo di ambienti
indicato nel file delle sostituzioni.
helm upgrade ENV_GROUP_RELEASE_NAME $PREVIOUS_HELM_CHARTS_HOME/apigee-virtualhost/ \ --namespace APIGEE_NAMESPACE \ --atomic \ --set envgroup=ENV_GROUP_NAME \ -f PREVIOUS_OVERRIDES_FILE
ENV_GROUP_RELEASE_NAME è il nome con cui hai installato in precedenza il grafico
apigee-virtualhost
. In Hybrid v1.10, in genere èapigee-virtualhost-ENV_GROUP_NAME
. In Hybrid versione 1.11 e successive, solitamente è ENV_GROUP_NAME. - Esegui il rollback delle env. Ripeti il seguente comando per ogni ambiente menzionato nel file delle sostituzioni.
helm upgrade apigee-env-ENV_NAME $PREVIOUS_HELM_CHARTS_HOME/apigee-env/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ --set env=ENV_NAME \ -f PREVIOUS_OVERRIDES_FILE
ENV_RELEASE_NAME è il nome con cui hai installato in precedenza il grafico
apigee-env
. In Hybrid v1.10, in genere èapigee-env-ENV_NAME
. In Hybrid versione 1.11 e successive, solitamente è ENV_NAME.Verifica che ogni ambiente sia attivo controllando lo stato del rispettivo ambiente:
kubectl -n apigee get apigeeenv
NAME STATE AGE GATEWAYTYPE apigee-org1-dev-xxx running 2d
- Esegui il rollback dell'organizzazione:
helm upgrade ORG_NAME $PREVIOUS_HELM_CHARTS_HOME/apigee-org/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica che sia attivo controllando lo stato della rispettiva organizzazione:
kubectl -n apigee get apigeeorg
NAME STATE AGE apigee-org1-xxxxx running 2d
- Esegui il rollback di Ingress Manager:
helm upgrade ingress-manager $PREVIOUS_HELM_CHARTS_HOME/apigee-ingress-manager/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone la disponibilità:
kubectl -n apigee get deployment apigee-ingressgateway-manager
NAME READY UP-TO-DATE AVAILABLE AGE apigee-ingressgateway-manager 2/2 2 2 2d
- Esegui il rollback di Redis:
helm upgrade redis $PREVIOUS_HELM_CHARTS_HOME/apigee-redis/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone lo stato:
kubectl -n apigee get apigeeredis default
NAME STATE AGE default running 2d
- Esegui il rollback di Apigee Telemetry:
helm upgrade telemetry $PREVIOUS_HELM_CHARTS_HOME/apigee-telemetry/ \ --install \ --namespace APIGEE_NAMESPACE \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica che sia attivo e funzionante controllandone lo stato:
kubectl -n apigee get apigeetelemetry apigee-telemetry
NAME STATE AGE apigee-telemetry running 2d
- Esegui il rollback di Apigee Controller:
helm upgrade operator $PREVIOUS_HELM_CHARTS_HOME/apigee-operator/ \ --install \ --namespace apigee-system \ --atomic \ -f PREVIOUS_OVERRIDES_FILE
Verifica l'installazione di Apigee Operator:
helm ls -n apigee-system
NAME NAMESPACE REVISION UPDATED STATUS CHART APP VERSION operator apigee-system 3 2023-06-26 00:42:44.492009 -0800 PST deployed apigee-operator-1.12.3 1.12.3
Verifica che sia attivo e funzionante controllandone la disponibilità:
kubectl -n apigee-system get deploy apigee-controller-manager
NAME READY UP-TO-DATE AVAILABLE AGE apigee-controller-manager 1/1 1 1 7d20h
- Ripristina i CRD di Apigee hybrid:
kubectl apply -k $PREVIOUS_HELM_CHARTS_HOME/apigee-operator/etc/crds/default/ --server-side --force-conflicts --validate=false
- Crea la seguente variabile di ambiente:
-
Convalida il rilascio di tutti i componenti. Tutti i componenti devono essere presenti nella versione precedente
tranne
datastore
:helm -n APIGEE_NAMESPACE list
helm -n apigee-system list
Ad esempio:
helm -n apigee list NAME NAMESPACE REVISION UPDATED STATUS CHART APP VERSION datastore apigee 2 2024-03-29 18:47:55.979671057 +0000 UTC deployed apigee-datastore-1.12.0 1.12.0 ingress-manager apigee 3 2024-03-14 19:14:57.905700154 +0000 UTC deployed apigee-ingress-manager-1.11.0 1.11.0 redis apigee 3 2024-03-14 19:15:49.406917944 +0000 UTC deployed apigee-redis-1.11.0 1.11.0 telemetry apigee 3 2024-03-14 19:17:04.803421424 +0000 UTC deployed apigee-telemetry-1.11.0 1.11.0 myhybridorg apigee 3 2024-03-14 19:13:17.807673713 +0000 UTC deployed apigee-org-1.11.0 1.11.0
A questo punto, per tutte le release tranne
datastore
è stato eseguito il rollback alla versione precedente.
Ripristino di un'installazione multiregione a una versione precedente
Recupera la regione in cui l'upgrade non è riuscito in un upgrade multiregione rimuovendo i riferimenti a questa regione dalle installazioni in più regioni. Questo metodo è possibile solo se è presente almeno una regione attiva su Hybrid 1.11. Il datastore della versione 1.12 è compatibile con i componenti della versione 1.11.
Per recuperare le regioni non riuscite da una regione funzionante:
- Reindirizza il traffico API dalle regioni interessate alla regione funzionante. Pianifica la capacità in modo da supportare il traffico deviato dalle regioni in cui si sono verificati errori.
- Esegui la dismissione della regione interessata. Per ogni regione interessata, segui i passaggi descritti in Dismissione di un'area geografica ibrida. Attendi il completamento del ritiro prima di procedere al passaggio successivo.
- Ripulisci la regione con errore seguendo le istruzioni riportate in Ripristinare una regione da un upgrade non riuscito.
- Recupera la regione interessata. Per eseguire il recupero, crea una nuova regione come descritto in Deployment in più regioni su GKE, GKE On-Prem e AKS.
Ripristino di un'installazione multiregionale da un backup con apigee-datastore
in uno stato non valido
Se l'upgrade del componente apigee-datastore
non è andato a buon fine, non puoi eseguire il rollback dalla versione 1.12 alla versione 1.11. Devi invece eseguire il ripristino da un backup di un'installazione della versione 1.11. Utilizza la seguente
sequenza per ripristinare la versione precedente.
- Se non hai un'installazione attiva della versione 1.11 di Apigee hybrid (ad esempio in un'altra regione), crea una nuova installazione della versione 1.11 utilizzando i file di override e dei grafici di cui hai eseguito il backup. Consulta le istruzioni di installazione della versione 1.11 di Apigee hybrid.
- Ripristina la regione della versione 1.11 (o la nuova installazione) dal backup
seguendo le istruzioni riportate in:
- Backup dell'interfaccia Cloud Storage (CSI): backup e ripristino CSI di Cassandra.
- Backup non CSI: Ripristino in più regioni.
- Verificare il traffico verso l'installazione ripristinata
- Per le installazioni multiregione, ricostruisci e ripristina la regione successiva. Segui le istruzioni riportate in Ripristino da un backup in Ripristino in più regioni.
- Rimuovi l'installazione della versione 1.12 seguendo le istruzioni riportate in Disinstallare il runtime di hybrid.
APPENDICE: Ripristinare una regione da un upgrade non riuscito
Rimuovi un data center se l'upgrade da 1.11 a 1.12 non va a buon fine.
-
Convalida lo stato del cluster Cassandra da una regione attiva:
-
Passa al contesto kubectl della regione da rimuovere:
kubectl config use-context CONTEXT_OF_LIVE_REGION
- Elenca i pod Cassandra:
kubectl get pods -n APIGEE_NAMESPACE -l app=apigee-cassandra
Ad esempio:
kubectl get pods -n apigee -l app=apigee-cassandra
NAME READY STATUS RESTARTS AGE apigee-cassandra-default-0 1/1 Running 0 2h apigee-cassandra-default-1 1/1 Running 0 2h apigee-cassandra-default-2 1/1 Running 0 2h -
Esegui in uno dei pod Cassandra:
kubectl exec -it -n CASSANDRA_POD_NAME -- /bin/bash
-
Controlla lo stato del cluster Cassandra:
nodetool -u JMX_USER -pw JMX_PASSWORD status
L'output dovrebbe essere simile al seguente:
Datacenter: dc-1 ================ Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 10.48.12.16 813.84 KiB 256 100.0% a6340ad9-37ba-4ec8-a8c2-f7b7ac931807 ra-1 UN 10.48.14.16 859.89 KiB 256 100.0% 39f03c51-e387-4dac-8360-6d8732e690a7 ra-1 UN 10.48.0.18 888.95 KiB 256 100.0% 0d57df49-52e4-4c01-832d-d9df845ab732 ra-1
-
Descrivi il cluster per verificare di vedere solo gli IP dei pod Cassandra della regione attiva
e tutti con la stessa versione dello schema:
nodetool -u JMX_USER -pw JMX_PASSWORD describecluster
L'output dovrebbe essere simile al seguente:
nodetool -u JMX_USER -pw JMX_PASSWORD describecluster
Schema versions: 4bebf2de-0582-31b4-9c5f-e36f60127e1b: [10.48.14.16, 10.48.12.16, 10.48.0.18]
-
Passa al contesto kubectl della regione da rimuovere:
-
Ripulisci la replica dello spazio chiavi Cassandra:
-
Recupera il job
user-setup
ed eliminalo. Verrà creato immediatamente un nuovo jobuser-setup
.kubectl get jobs -n APIGEE_NAMESPACE
Ad esempio:
kubectl get jobs -n apigee
NAME COMPLETIONS DURATION AGE apigee-cassandra-schema-setup-myhybridorg-8b3e61d 1/1 6m35s 3h5m apigee-cassandra-schema-val-myhybridorg-8b3e61d-28499150 1/1 10s 9m22s apigee-cassandra-user-setup-myhybridorg-8b3e61d 0/1 21s 21skubectl delete jobs USER_SETUP_JOB_NAME -n APIGEE_NAMESPACE
L'output dovrebbe mostrare l'avvio del nuovo job:
kubectl delete jobs apigee-cassandra-user-setup-myhybridorg-8b3e61d -n apigee
apigee-cassandra-user-setup-myhybridorg-8b3e61d-wl92b 0/1 Init:0/1 0 1s - Convalida le impostazioni di replica dello spazio chiavi Cassandra creando un contenitore client seguendo le istruzioni riportate in Creare il contenitore client.
-
Ottieni tutti gli spazi chiavi. Esegui il pod cassandra-client e avvia un client cqlsh:
kubectl exec -it -n APIGEE_NAMESPACE cassandra-client -- /bin/bash
Connettiti al server Cassandra con
ddl user
, in quanto dispone delle autorizzazioni necessarie per eseguire i seguenti comandi:cqlsh apigee-cassandra-default.apigee.svc.cluster.local -u DDL_USER -p DDL_PASSWORD --ssl
Ottieni gli spazi chiavi:
select * from system_schema.keyspaces;
L'output dovrebbe essere simile al seguente, dove
dc-1
è il DC in tempo reale:select * from system_schema.keyspaces;
keyspace_name | durable_writes | replication --------------------------+----------------+-------------------------------------------------------------------------------- kvm_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system_auth | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system_schema | True | {'class': 'org.apache.cassandra.locator.LocalStrategy'} quota_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} cache_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} rtc_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system_distributed | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system | True | {'class': 'org.apache.cassandra.locator.LocalStrategy'} perses | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system_traces | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} kms_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} (11 rows) - Se per qualche motivo il job
user-setup
continua a generare errori e la convalida non va a buon fine, utilizza i seguenti comandi per correggere la replica negli spazi chiavi.kubectl exec -it -n APIGEE_NAMESPACE cassandra-client -- /bin/bash
Connettiti al server Cassandra con
ddl user
, in quanto dispone delle autorizzazioni necessarie per eseguire i seguenti comandi:cqlsh apigee-cassandra-default.apigee.svc.cluster.local -u DDL_USER -p DDL_PASSWORD --ssl
Ottieni gli spazi chiavi:
select * from system_schema.keyspaces;
Utilizza i nomi dello spazio chiavi del comando precedente e sostituiscili nei seguenti esempi
alter keyspace quota_myhybridorg_hybrid WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
alter keyspace kms_myhybridorg_hybrid WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
alter keyspace kvm_myhybridorg_hybrid WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
alter keyspace cache_myhybridorg_hybrid WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
alter keyspace perses_myhybridorg_hybrid WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
alter keyspace rtc_myhybridorg_hybrid WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
alter keyspace system_auth WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
alter keyspace system_distributed WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
alter keyspace system_traces WITH replication = {'class': 'NetworkTopologyStrategy', 'LIVE_DC_NAME':'3'};
- Verifica che tutti gli spazi chiavi vengano replicati nella regione corretta con il seguente comando
cqlsh
:select * from system_schema.keyspaces;
Ad esempio:
select * from system_schema.keyspaces;
keyspace_name | durable_writes | replication -------------------------+----------------+-------------------------------------------------------------------------------- kvm_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system_auth | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system_schema | True | {'class': 'org.apache.cassandra.locator.LocalStrategy'} quota_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} cache_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} rtc_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system_distributed | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system | True | {'class': 'org.apache.cassandra.locator.LocalStrategy'} perses | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} system_traces | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} kms_myhybridorg_hybrid | True | {'class': 'org.apache.cassandra.locator.NetworkTopologyStrategy', 'dc-1': '3'} (11 rows)
-
Recupera il job
A questo punto hai rimosso completamente tutti i riferimenti al DC non attivo dal cluster Cassandra.
APPENDICE: rimuovi i nodi DOWN dal cluster Cassandra
Utilizza questa procedura quando esegui il rollback di un'installazione multiregione e non tutti i pod Cassandra sono in stato Up / Normale (UN
).
-
Esegui in uno dei pod Cassandra:
kubectl exec -it -n CASSANDRA_POD_NAME -- /bin/bash
-
Controlla lo stato del cluster Cassandra:
nodetool -u JMX_USER -pw JMX_PASSWORD status
-
Verifica che il nodo sia effettivamente in stato Down (
DN
). Esegui il comando Exec nel pod Cassandra in una regione in cui il pod Cassandra non riesce ad avviarsi.Datacenter: dc-1 ================ Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 10.48.12.16 1.15 MiB 256 100.0% a6340ad9-37ba-4ec8-a8c2-f7b7ac931807 ra-1 UN 10.48.0.18 1.21 MiB 256 100.0% 0d57df49-52e4-4c01-832d-d9df845ab732 ra-1 UN 10.48.14.16 1.18 MiB 256 100.0% 39f03c51-e387-4dac-8360-6d8732e690a7 ra-1 Datacenter: us-west1 ==================== Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack DN 10.8.4.4 432.42 KiB 256 100.0% cd672398-5c45-4c88-a424-86d757951e53 rc-1 UN 10.8.19.6 5.8 MiB 256 100.0% 84f771f3-3632-4155-b27f-a67125d73bc5 rc-1 UN 10.8.21.5 5.74 MiB 256 100.0% f6f21b70-348d-482d-89fa-14b7147a5042 rc-1
-
Rimuovi il riferimento al nodo down (
DN
). Dall'esempio riportato sopra, rimuoveremo il riferimento all'host10.8.4.4
kubectl exec -it -n apigee apigee-cassandra-default-2 -- /bin/bash nodetool -u JMX_USER -pw JMX_PASSWORD removenode HOST_ID
-
Dopo aver rimosso il riferimento, termina il pod. Il nuovo pod Cassandra dovrebbe essere avviato e unirsi al cluster
kubectl delete pod -n POD_NAME
-
Verifica che il nuovo pod Cassandra sia entrato a far parte del cluster.
Datacenter: dc-1 ================ Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 10.48.12.16 1.16 MiB 256 100.0% a6340ad9-37ba-4ec8-a8c2-f7b7ac931807 ra-1 UN 10.48.0.18 1.22 MiB 256 100.0% 0d57df49-52e4-4c01-832d-d9df845ab732 ra-1 UN 10.48.14.16 1.19 MiB 256 100.0% 39f03c51-e387-4dac-8360-6d8732e690a7 ra-1 Datacenter: us-west1 ==================== Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 10.8.19.6 5.77 MiB 256 100.0% 84f771f3-3632-4155-b27f-a67125d73bc5 rc-1 UN 10.8.4.5 246.99 KiB 256 100.0% 0182e675-eec8-4d68-a465-69211b621601 rc-1 UN 10.8.21.5 5.69 MiB 256 100.0% f6f21b70-348d-482d-89fa-14b7147a5042 rc-1
A questo punto puoi procedere con l'upgrade o il rollback delle regioni rimanenti del cluster.
APPENDICE: risoluzione dei problemi: apigee-datastore
in uno stato bloccato dopo il rollback
Utilizza questa procedura quando hai eseguito il rollback di apigee-datastore
alla versione ibrida 1.11 dopo l'upgrade e il servizio è bloccato.
-
Prima di correggere di nuovo lo stato del controller del datastore, verifica che sia in uno stato
releasing
e che i pod non vengano avviati insieme allo stato del cluster Cassandra.-
Convalida utilizzando il comando Helm che è stato eseguito il rollback del datastore:
helm -n APIGEE_NAMESPACE list
Ad esempio:
helm -n apigee list
NAME NAMESPACE REVISION UPDATED STATUS CHART APP VERSION datastore apigee 3 2024-04-04 22:15:08.792539892 +0000 UTC deployed apigee-datastore-1.11.0 1.11.0 ingress-manager apigee 1 2024-04-02 22:24:27.564184968 +0000 UTC deployed apigee-ingress-manager-1.12.0 1.12.0 redis apigee 1 2024-04-02 22:23:59.938637491 +0000 UTC deployed apigee-redis-1.12.0 1.12.0 telemetry apigee 1 2024-04-02 22:23:39.458134303 +0000 UTC deployed apigee-telemetry-1.12 1.12.0 myhybridorg apigee 1 2024-04-02 23:36:32.614927914 +0000 UTC deployed apigee-org-1.12.0 1.12.0 -
Visualizza lo stato dei pod Cassandra:
kubectl get pods -n APIGEE_NAMESPACE
Ad esempio:
kubectl get pods -n apigee
NAME READY STATUS RESTARTS AGE apigee-cassandra-default-0 1/1 Running 0 2h apigee-cassandra-default-1 1/1 Running 0 2h apigee-cassandra-default-2 0/1 CrashLoopBackOff 4 (13s ago) 2m13s -
Verifica che il controller
apigeeds
sia bloccato nello stato di rilascio:kubectl get apigeeds -n APIGEE_NAMESPACE
Ad esempio:
kubectl get apigeeds -n apigee
NAME STATE AGE default releasing 46h -
Convalida lo stato dei nodi Cassandra (tieni presente che un nodo è in stato
DN
, ovvero bloccato in statoCrashLoopBackOff
):kubectl exec apigee-cassandra-default-0 -n APIGEE_NAMESPACE -- nodetool -u JMX_USER -pw JMX_PASSWORD status
Ad esempio:
kubectl exec apigee-cassandra-default-0 -n apigee -- nodetool -u jmxuser -pw JMX_PASSWORD status
Defaulted container "apigee-cassandra" out of: apigee-cassandra, apigee-cassandra-ulimit-init (init) Datacenter: us-west1 ==================== Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 10.68.7.28 2.12 MiB 256 100.0% 4de9df37-3997-43e7-8b5b-632d1feb14d3 rc-1 UN 10.68.10.29 2.14 MiB 256 100.0% a54e673b-ec63-4c08-af32-ea6c00194452 rc-1 DN 10.68.6.26 5.77 MiB 256 100.0% 0fe8c2f4-40bf-4ba8-887b-9462159cac45 rc-1
-
Convalida utilizzando il comando Helm che è stato eseguito il rollback del datastore:
-
Esegui l'upgrade del data store utilizzando i grafici 1.12.
helm upgrade datastore APIGEE_HELM_1.12.0_HOME/apigee-datastore/ --install --namespace APIGEE_NAMESPACE -f overrides.yaml
-
Verifica che tutti i pod siano
Running
e che il cluster Cassandra sia di nuovo integro.-
Verifica di nuovo che tutti i pod siano
READY
:kubectl get pods -n APIGEE_NAMESPACE
Ad esempio:
kubectl get pods -n apigee
NAME READY STATUS RESTARTS AGE apigee-cassandra-default-0 1/1 Running 0 29h apigee-cassandra-default-1 1/1 Running 0 29h apigee-cassandra-default-2 1/1 Running 0 60m -
Convalida lo stato del cluster Cassandra:
kubectl exec apigee-cassandra-default-0 -n APIGEE_NAMESPACE -- nodetool -u JMX_USER -pw JMX_PASSWORD status
Ad esempio:
kubectl exec apigee-cassandra-default-0 -n apigee -- nodetool -u jmxuser -pw JMX_PASSWORD status
Datacenter: us-west1 ==================== Status=Up/Down |/ State=Normal/Leaving/Joining/Moving -- Address Load Tokens Owns (effective) Host ID Rack UN 10.68.4.15 2.05 MiB 256 100.0% 0fe8c2f4-40bf-4ba8-887b-9462159cac45 rc-1 UN 10.68.7.28 3.84 MiB 256 100.0% 4de9df37-3997-43e7-8b5b-632d1feb14d3 rc-1 UN 10.68.10.29 3.91 MiB 256 100.0% a54e673b-ec63-4c08-af32-ea6c00194452 rc-1 -
Convalida lo stato del controller
apigeeds
:kubectl get apigeeds -n APIGEE_NAMESPACE
Ad esempio:
kubectl get apigeeds -n apigee
NAME STATE AGE default running 2d1h
-
Verifica di nuovo che tutti i pod siano
A questo punto hai corretto il data store, che dovrebbe essere nello stato running
.