Questa pagina è stata tradotta dall'API Cloud Translation.

Automatizza il trasferimento dei dati da Cloud Storage a Parallelstore utilizzando GKE Volume Populator

Autopilot Standard

GKE Volume Populator è disponibile solo su invito. Se vuoi richiedere l'accesso a GKE Volume Populator nel tuo progetto, contatta il tuo rappresentante di vendita. Google Cloud

Questa guida descrive come precaricare grandi quantità di dati da un bucket Cloud Storage a un volume Parallelstore di Google Kubernetes Engine (GKE) durante il provisioning dinamico utilizzando GKE Volume Populator. Per maggiori informazioni, consulta Informazioni su GKE Volume Populator.

Questa guida è pensata per gli esperti di archiviazione che creano e allocano spazio di archiviazione e gestiscono la sicurezza e l'accesso ai dati. Per scoprire di più sui ruoli comuni e sulle attività di esempio a cui facciamo riferimento nei contenuti di Google Cloud , consulta Ruoli utente e attività comuni di GKE.

Limitazioni

La risorsa personalizzata GCPDataSource deve trovarsi nello stesso spazio dei nomi del tuo workload Kubernetes. I volumi con origini dati tra spazi dei nomi non sono supportati.
GKE Volume Populator supporta solo l'associazione Workload Identity Federation for GKE di service account IAM a un service account Kubernetes. La concessione diretta delle autorizzazioni IAM al service account Kubernetes non è supportata.

Prima di iniziare

Prima di iniziare, assicurati di aver eseguito le seguenti operazioni:

Abilita l'API Parallelstore e l'API Google Kubernetes Engine.

Abilita le API

Se vuoi utilizzare Google Cloud CLI per questa attività, installala e poi inizializza gcloud CLI. Se hai già installato gcloud CLI, scarica l'ultima versione eseguendo il comando gcloud components update. Le versioni precedenti di gcloud CLI potrebbero non supportare l'esecuzione dei comandi in questo documento.
Nota: per le installazioni esistenti di gcloud CLI, assicurati di impostare la proprietà compute/region. Se utilizzi principalmente cluster di zona, imposta invece compute/zone. Se imposti una località predefinita, puoi evitare errori in gcloud CLI come il seguente: One of [--zone, --region] must be supplied: Please specify location. Potresti dover specificare la posizione in determinati comandi se la posizione del cluster è diversa da quella predefinita che hai impostato.

Per limitazioni e requisiti, consulta la panoramica del driver CSI Parallelstore.
Crea i bucket Cloud Storage, compilati con i dati che vuoi trasferire.

Requisiti

Per utilizzare GKE Volume Populator, i tuoi cluster devono soddisfare i seguenti requisiti:

Utilizza la versione del cluster GKE 1.31.1-gke.1729000 o successive.
Avere il driver CSI Parallelstore abilitato. GKE abilita il driver CSI per impostazione predefinita nei cluster GKE Autopilot nuovi ed esistenti. Nei cluster Standard nuovi ed esistenti, devi attivare il driver CSI.

prepara l'ambiente

Questa sezione descrive i passaggi per creare i cluster GKE e configurare le autorizzazioni necessarie per utilizzare GKE Volume Populator.

Configura la rete VPC

Devi specificare la stessa rete Virtual Private Cloud (VPC) quando crei l'istanza Parallelstore e le VM Compute Engine client o i cluster GKE. Per consentire a VPC di connettersi privatamente ai servizi senza esporre il traffico a internet pubblico, devi eseguire una configurazione una tantum dell'accesso ai servizi privati (PSA), se non l'hai già fatto. Google Cloud

Per configurare gli annunci di servizio pubblico:

Per configurare il peering di rete per il tuo progetto, configura l'autorizzazione IAM Amministratore rete Compute (roles/compute.networkAdmin).

Per concedere il ruolo, esegui questo comando:
```
gcloud projects add-iam-policy-binding PROJECT_ID \
    --member="user:EMAIL_ADDRESS" \
    --role=roles/compute.networkAdmin
```
Sostituisci EMAIL_ADDRESS con il tuo indirizzo email.

Attiva il service networking:

gcloud services enable servicenetworking.googleapis.com

Crea una rete VPC:
```
gcloud compute networks create NETWORK_NAME \
  --subnet-mode=auto \
  --mtu=8896 \
  --project=PROJECT_ID
```
Sostituisci quanto segue:
- NETWORK_NAME: il nome della rete VPC in cui creerai l'istanza Parallelstore.
- PROJECT_ID: il tuo Google Cloud ID progetto.
Nota: l'impostazione del valore di mtu (unità massima di trasmissione o dimensione del pacchetto IP più grande che può essere trasmesso su questa rete) sul valore massimo consentito di 8896 migliora il rendimento fino al 10% rispetto al valore predefinito di 1460 byte.
Crea un intervallo IP.

L'accesso privato ai servizi richiede un intervallo di indirizzi IP (blocco CIDR) con una lunghezza del prefisso di almeno /24 (256 indirizzi). Parallelstore riserva 64 indirizzi per istanza, il che significa che puoi riutilizzare questo intervallo IP con altri servizi o altre istanze Parallelstore, se necessario.
```
gcloud compute addresses create IP_RANGE_NAME \
  --global \
  --purpose=VPC_PEERING \
  --prefix-length=24 \
  --description="Parallelstore VPC Peering" \
  --network=NETWORK_NAME \
  --project=PROJECT_ID
```
Sostituisci IP_RANGE_NAME con il nome dell'intervallo IP della rete VPC.

Imposta una variabile di ambiente con l'intervallo CIDR associato all'intervallo che hai creato nel passaggio precedente:

CIDR_RANGE=$(
  gcloud compute addresses describe IP_RANGE_NAME \
    --global  \
    --format="value[separator=/](address, prefixLength)" \
    --project=PROJECT_ID \
)

Crea una regola firewall per consentire il traffico TCP dall'intervallo IP che hai creato:
```
gcloud compute firewall-rules create FIREWALL_NAME \
  --allow=tcp \
  --network=NETWORK_NAME \
  --source-ranges=$CIDR_RANGE \
  --project=PROJECT_ID
```
Sostituisci FIREWALL_NAME con il nome della regola firewall per consentire il traffico TCP dall'intervallo IP che hai creato.

Connetti il peering:

gcloud services vpc-peerings connect \
  --network=NETWORK_NAME \
  --ranges=IP_RANGE_NAME \
  --project=PROJECT_ID \
  --service=servicenetworking.googleapis.com

Se riscontri problemi durante la configurazione della rete VPC, consulta la guida per la risoluzione dei problemi di Parallelstore.

Crea il cluster GKE

Ti consigliamo di utilizzare un cluster Autopilot per un'esperienza Kubernetes completamente gestita. Per scegliere la modalità operativa GKE più adatta alle tue esigenze di workload, consulta Scegliere una modalità operativa GKE.

Autopilot

Per creare un cluster GKE utilizzando Autopilot, esegui il seguente comando:

gcloud container clusters create-auto CLUSTER_NAME  \
    --network=NETWORK_NAME  \
    --cluster-version=CLUSTER_VERSION \
    --location=CLUSTER_LOCATION

GKE abilita la federazione delle identità per i carichi di lavoro per GKE e il driver CSI Parallelstore per impostazione predefinita nei cluster Autopilot.

Sostituisci i seguenti valori:

CLUSTER_NAME: il nome del tuo cluster.
CLUSTER_VERSION : il numero di versione di GKE. Devi specificare la versione 1.31.1-gke.1729000 o successive.
NETWORK_NAME: il nome della rete VPC creata per l'istanza Parallelstore. Per saperne di più, consulta Configurare una rete VPC.
CLUSTER_LOCATION: la regione in cui vuoi creare il cluster. Per ottenere prestazioni ottimali, ti consigliamo di creare il cluster in una posizione Parallelstore supportata. Se vuoi creare il cluster in una località Parallelstore non supportata, quando crei uno StorageClass Parallelstore, devi specificare una topologia personalizzata che utilizzi una località Parallelstore supportata, altrimenti il provisioning non andrà a buon fine.

Standard

Crea un cluster Standard con il driver CSI Parallelstore e la federazione delle identità per i carichi di lavoro per GKE abilitata utilizzando il seguente comando:

gcloud container clusters create CLUSTER_NAME \
    --addons=ParallelstoreCsiDriver \
    --cluster-version=CLUSTER_VERSION \
    --workload-pool=PROJECT_ID.svc.id.goog \
    --network=NETWORK_NAME \
    --location=CLUSTER_LOCATION

Sostituisci i seguenti valori:

CLUSTER_NAME: il nome del tuo cluster.
CLUSTER_VERSION: il numero di versione di GKE. Devi specificare la versione 1.31.1-gke.1729000 o successive.
PROJECT_ID: il tuo Google Cloud ID progetto.
NETWORK_NAME: il nome della rete VPC creata per l'istanza Parallelstore. Per scoprire di più, consulta Configurare una rete VPC.
CLUSTER_LOCATION: la regione o la zona in cui vuoi creare il cluster. Per ottenere prestazioni ottimali, ti consigliamo di creare il cluster in una posizione Parallelstore supportata. Se vuoi creare il cluster in una località Parallelstore non supportata, quando crei uno StorageClass Parallelstore, devi specificare una topologia personalizzata che utilizzi una località Parallelstore supportata, altrimenti il provisioning non andrà a buon fine.

Configurare le autorizzazioni necessarie

Per trasferire i dati da un bucket Cloud Storage, devi configurare le autorizzazioni per Workload Identity Federation for GKE.

Crea uno spazio dei nomi Kubernetes:
```
kubectl create namespace NAMESPACE
```
Sostituisci NAMESPACE con lo spazio dei nomi in cui verranno eseguiti i tuoi carichi di lavoro.
Crea un account di servizio Kubernetes.
```
kubectl create serviceaccount KSA_NAME \
    --namespace=NAMESPACE
```
Sostituisci KSA_NAME con il nome del account di servizio Kubernetes utilizzato dal pod per l'autenticazione alle API Google Cloud .

Attenzione: il riutilizzo di questo account di servizio Kubernetes in un workload all'interno dello stesso spazio dei nomi consente al pod di accedere al bucket Cloud Storage. Ti consigliamo di non riutilizzare questo account di servizio per i carichi di lavoro nello spazio dei nomi.
Crea un account di servizio IAM. Puoi anche utilizzare qualsiasi account di servizio IAM esistente in qualsiasi progetto della tua organizzazione:
```
gcloud iam service-accounts create IAM_SA_NAME \
    --project=PROJECT_ID
```
Sostituisci quanto segue:
- IAM_SA_NAME: il nome del account di servizio IAM.
- PROJECT_ID: il tuo Google Cloud ID progetto.

Concedi al tuo account di servizio IAM il ruolo roles/storage.objectViewer in modo che possa accedere al tuo bucket Cloud Storage:

gcloud storage buckets \
    add-iam-policy-binding gs://GCS_BUCKET \
    --member "serviceAccount:IAM_SA_NAME@PROJECT_ID.iam.gserviceaccount.com" \
    --role "roles/storage.objectViewer"

Sostituisci GCS_BUCKET con il nome del tuo bucket Cloud Storage.

Crea il criterio di autorizzazione IAM che concede al service account Kubernetes l'accesso per rappresentare il account di servizio IAM:

gcloud iam service-accounts \
    add-iam-policy-binding IAM_SA_NAME@PROJECT_ID.iam.gserviceaccount.com \
    --role roles/iam.workloadIdentityUser \
    --member "serviceAccount:PROJECT_ID.svc.id.goog[NAMESPACE/KSA_NAME]"

Annota il account di servizio Kubernetes in modo che GKE veda il collegamento tra i service account.

kubectl annotate serviceaccount KSA_NAME \
    --namespace NAMESPACE \
    iam.gke.io/gcp-service-account=IAM_SA_NAME@PROJECT_ID.iam.gserviceaccount.com

Crea l'identità di servizio Parallelstore:

gcloud beta services identity create \
    --service=parallelstore.googleapis.com \
    --project=PROJECT_ID

Per consentire all'identità di servizio Parallelstore di rappresentare il account di servizio IAM, concedi il ruolo roles/iam.serviceAccountTokenCreator all'identità di servizio Parallelstore. Imposta la variabile di ambiente PROJECT_NUMBER in modo da poterla utilizzare nei passaggi successivi.
```
export PROJECT_NUMBER=$(gcloud projects describe PROJECT_ID --format="value(projectNumber)")
gcloud iam service-accounts \
    add-iam-policy-binding "IAM_SA_NAME@PROJECT_ID.iam.gserviceaccount.com" \
    --member=serviceAccount:"service-${PROJECT_NUMBER?}@gcp-sa-parallelstore.iam.gserviceaccount.com" \
    --role=roles/iam.serviceAccountTokenCreator
```
Il valore PROJECT_NUMBER è l'identificatore univoco generato automaticamente per il tuo progetto. Per trovare questo valore, consulta la sezione Creazione e gestione dei progetti.

Per consentire all'identità di servizio Parallelstore di accedere a tutte le risorse a cui può accedere il account di servizio IAM, concedi il ruolo roles/iam.serviceAccountUser all'identità di servizio Parallelstore:

gcloud iam service-accounts \
    add-iam-policy-binding "IAM_SA_NAME@PROJECT_ID.iam.gserviceaccount.com" \
    --member=serviceAccount:"service-${PROJECT_NUMBER?}@gcp-sa-parallelstore.iam.gserviceaccount.com" \
    --role=roles/iam.serviceAccountUser

Per consentire all'identità di servizio GKE di accedere a tutte le risorse a cui può accedere il account di servizio IAM, concedi il ruolo roles/iam.serviceAccountUser all'identità di servizio GKE. Questo passaggio non è necessario se il cluster GKE e ilaccount di serviziot IAM si trovano nello stesso progetto.
```
gcloud iam service-accounts \
    add-iam-policy-binding "IAM_SA_NAME@PROJECT_ID.iam.gserviceaccount.com" \
    --member=serviceAccount:"service-${PROJECT_NUMBER?}@container-engine-robot.iam.gserviceaccount.com" \
    --role=roles/iam.serviceAccountUser
```

Crea un volume Parallelstore con dati precaricati

Le sezioni seguenti descrivono la procedura tipica per creare un volume Parallelstore con dati precaricati da un bucket Cloud Storage utilizzando GKE Volume Populator.

Crea una risorsa GCPDataSource.
Crea una StorageClass Parallelstore.
Crea un oggetto PersistentVolumeClaim per accedere al volume.
(Facoltativo) Visualizza l'avanzamento del trasferimento dei dati.
Crea un workload che utilizzi il volume.

Crea una risorsa `GCPDataSource`

Per utilizzare GKE Volume Populator, crea una risorsa personalizzata GCPDataSource. Questa risorsa definisce le proprietà di archiviazione di origine da utilizzare per il popolamento del volume.

Salva il seguente manifest in un file denominato gcpdatasource.yaml.
```
apiVersion: datalayer.gke.io/v1
kind: GCPDataSource
metadata:
  name: GCP_DATA_SOURCE
  namespace: NAMESPACE
spec:
  cloudStorage:
    serviceAccountName: KSA_NAME
    uri: gs://GCS_BUCKET/
```
Sostituisci i seguenti valori:
- GCP_DATA_SOURCE: il nome della CRD GCPDataSource che contiene un riferimento al tuo bucket Cloud Storage. Per maggiori dettagli, consulta il riferimento CRD GCPDataSource.
- NAMESPACE: lo spazio dei nomi su cui verranno eseguiti i tuoi workload. Il valore dello spazio dei nomi deve corrispondere a quello del tuo workload.
- KSA_NAME: il nome del service account Kubernetes che il pod utilizza per l'autenticazione alle API Google Cloud . Il valore di cloudStorage.serviceAccountName deve essere il service account Kubernetes che hai configurato per Workload Identity Federation for GKE nel passaggio Configura le autorizzazioni necessarie.
- GCS_BUCKET: il nome del bucket Cloud Storage. In alternativa, puoi anche specificare gs://GCS_BUCKET/PATH_INSIDE_BUCKET/ per il campo uri.
Crea la risorsa GCPDataSource eseguendo questo comando:
```
kubectl apply -f gcpdatasource.yaml
```

Crea una StorageClass Parallelstore

Crea una StorageClass per indirizzare il driver CSI Parallelstore al provisioning delle istanze Parallelstore nella stessa regione del cluster GKE. In questo modo si garantisce un rendimento I/O ottimale.

Salva il seguente manifest come parallelstore-class.yaml.

apiVersion: storage.k8s.io/v1
kind: StorageClass
metadata:
  name: parallelstore-class
provisioner: parallelstore.csi.storage.gke.io
volumeBindingMode: Immediate
reclaimPolicy: Delete

Crea StorageClass eseguendo questo comando:

kubectl apply -f parallelstore-class.yaml

Se vuoi creare una StorageClass personalizzata con una topologia specifica, consulta la guida CSI Parallelstore.

Crea un oggetto PersistentVolumeClaim per accedere al volume

Il seguente file manifest mostra un esempio di come creare un PersistentVolumeClaim in modalità di accesso ReadWriteMany che fa riferimento alla StorageClass creata in precedenza.

Salva il seguente manifest in un file denominato volume-populator-pvc.yaml:
```
apiVersion: v1
kind: PersistentVolumeClaim
metadata:
  name: PVC_NAME
  namespace: NAMESPACE
spec:
  accessModes:
  -   ReadWriteMany
  storageClassName: parallelstore-class
  resources:
    requests:
      storage: 12Gi
  dataSourceRef:
    apiGroup: datalayer.gke.io
    kind: GCPDataSource
    name: GCP_DATA_SOURCE
```
Sostituisci i seguenti valori:
- PVC_NAME: il nome di PersistentVolumeClaim in cui vuoi trasferire i dati. PersistentVolumeClaim deve essere supportato da un'istanza Parallelstore.
- NAMESPACE: lo spazio dei nomi in cui verranno eseguiti i tuoi workload. Il valore dello spazio dei nomi deve corrispondere a quello del tuo spazio dei nomi del workload.
- GCP_DATA_SOURCE: il nome della CRD GCPDataSource che contiene un riferimento al tuo bucket Cloud Storage. Per ulteriori dettagli, consulta il riferimento CRD GCPDataSource.
Crea PersistentVolumeClaim eseguendo il seguente comando:
```
kubectl apply -f volume-populator-pvc.yaml
```

GKE non pianificherà il pod del workload finché il provisioning di PersistentVolumeClaim non sarà completato. Per controllare l'avanzamento del trasferimento dei dati, vedi Visualizzare l'avanzamento del trasferimento dei dati. Se riscontri errori durante il provisioning, consulta Risoluzione dei problemi.

(Facoltativo) Visualizzare l'avanzamento del trasferimento dei dati

Questa sezione mostra come monitorare l'avanzamento dei trasferimenti di dati da un bucket Cloud Storage a un volume Parallelstore. Puoi farlo per monitorare lo stato del trasferimento e assicurarti che i dati vengano copiati correttamente. Dovresti eseguire questo comando anche se l'operazione di binding PersistentVolumeClaim richiede troppo tempo.

Verifica lo stato di PersistentVolumeClaim eseguendo il seguente comando:
```
kubectl describe pvc PVC_NAME -n NAMESPACE
```

Controlla il messaggio degli eventi PersistentVolumeClaim per trovare lo stato di avanzamento del trasferimento dei dati. GKE registra i messaggi circa una volta al minuto. L'output è simile al seguente:

Reason                          Message
------                          -------
PopulateOperationStartSuccess   Populate operation started
PopulateOperationStartSuccess   Populate operation started
Provisioning                    External provisioner is provisioning volume for claim "my-namespace/my-pvc"
Provisioning                    Assuming an external populator will provision the volume
ExternalProvisioning            Waiting for a volume to be created either by the external provisioner 'parallelstore.csi.storage.gke.io' or manually by the system administrator. If volume creation is delayed, please verify that the provisioner is running and correctly registered.
PopulateOperationStartSuccess   Populate operation started
PopulatorPVCCreationProgress    objects found 7, objects copied 7, objects skipped 0. bytes found 1000020010, bytes copied 1000020010, bytes skipped 0
PopulateOperationFinished       Populate operation finished
PopulatorFinished               Populator finished

L'operazione di compilazione può richiedere del tempo per iniziare; questa operazione dipende dalle dimensioni del file. Se dopo diversi minuti non vedi alcun avanzamento nel trasferimento dei dati, consulta la sezione Risoluzione dei problemi.

Crea un workload che utilizzi il volume

Questa sezione mostra un esempio di come creare un pod che utilizza la risorsa PersistentVolumeClaim creata in precedenza.

Salva il seguente manifest YAML per il pod come pod.yaml.
```
apiVersion: v1
kind: Pod
metadata:
  name: POD_NAME
  namespace: NAMESPACE
spec:
  volumes:
  -   name: parallelstore-volume
    persistentVolumeClaim:
      claimName: PVC_NAME
  containers:
  -   image: nginx
    name: nginx
    volumeMounts:
    -   name: parallelstore-volume
      mountPath: /mnt/data
```
Sostituisci i seguenti valori:
- POD_NAME: il nome del pod che esegue il tuo workload.
- NAMESPACE: lo spazio dei nomi in cui verranno eseguiti i tuoi workload. Il valore dello spazio dei nomi deve corrispondere a quello del tuo spazio dei nomi del workload.
- PVC_NAME: il nome di PersistentVolumeClaim in cui vuoi trasferire i dati. PersistentVolumeClaim deve essere supportato da un'istanza Parallelstore.
Esegui questo comando per applicare il manifest al cluster:
```
kubectl apply -f pod.yaml
```
Controlla lo stato del pod e attendi che sia RUNNING. La tua PersistentVolumeClaim deve essere associata prima che il workload possa essere eseguito.
```
kubectl describe pod POD_NAME -n NAMESPACE
```
Verifica che i file siano stati trasferiti correttamente e che il tuo workload possa accedervi.
```
kubectl exec -it POD_NAME -n NAMESPACE -c nginx -- /bin/sh
```
Passa alla directory /mnt/data ed esegui ls:
```
cd /mnt/data
ls
```
L'output deve elencare tutti i file esistenti nell'URI del bucket Cloud Storage.

Eliminare un PersistentVolumeClaim durante il provisioning dinamico

Se devi eliminare PersistentVolumeClaim mentre i dati vengono ancora trasferiti durante il provisioning dinamico, hai due opzioni: eliminazione controllata ed eliminazione forzata.

L'eliminazione controllata richiede meno impegno, ma può richiedere più tempo e non tiene conto della configurazione errata dell'utente che impedisce il completamento del trasferimento dei dati. L'eliminazione forzata offre un'alternativa più rapida che consente maggiore flessibilità e controllo. Questa opzione è adatta quando devi riavviare rapidamente o correggere configurazioni errate.

Eliminazione controllata

Utilizza questa opzione di eliminazione per assicurarti che il processo di trasferimento dei dati venga completato prima che GKE elimini le risorse associate.

Elimina il pod del workload, se esiste, eseguendo questo comando:
```
kubectl delete pod POD_NAME -n NAMESPACE
```

Trova il nome di PersistentVolumeClaim temporaneo:

PVC_UID=$(kubectl get pvc PVC_NAME -n NAMESPACE -o yaml | grep uid | awk '{print $2}')
TEMP_PVC=prime-$PVC_UID

echo $TEMP_PVC

Trova il nome di PersistentVolume:

PV_NAME=$(kubectl describe pvc ${TEMP_PVC?} -n gke-managed-volumepopulator | grep "Volume:" | awk '{print $2}')

echo ${PV_NAME?}

Se l'output è vuoto, significa che PersistentVolume non è stato ancora creato.

Elimina PersistentVolumeClaim eseguendo questo comando.
```
kubectl delete pvc PVC_NAME -n NAMESPACE
```
Attendi il completamento del trasferimento dei dati. GKE alla fine eliminerà PersistentVolumeClaim, PersistentVolume e l'istanza Parallelstore.
Verifica che le risorse PersistentVolumeClaim, PersistentVolumeClaim e PersistentVolume temporanee siano eliminate:
```
kubectl get pvc,pv -A | grep -E "${TEMP_PVC?}|PVC_NAME|${PV_NAME?}"
```

Verifica che l'istanza Parallelstore sia eliminata. L'istanza Parallelstore condividerà lo stesso nome di PersistentVolume.

gcloud beta parallelstore instances list \
    --project=PROJECT_ID \
    --location=- | grep ${PV_NAME?}

Eliminazione forzata

Utilizza questa opzione di eliminazione quando devi eliminare un PersistentVolumeClaim e le relative risorse prima del completamento del processo di trasferimento dei dati. Potresti dover utilizzare questa opzione in situazioni in cui il trasferimento dei dati richiede troppo tempo o si sono verificati errori oppure se devi recuperare rapidamente le risorse.

Elimina il pod del workload, se esiste:

kubectl delete pod POD_NAME -n NAMESPACE

Aggiorna il PersistentVolume reclaim policy a Delete. Questa impostazione garantisce che PersistentVolume, insieme allo spazio di archiviazione sottostante, venga eliminato automaticamente quando viene eliminato PersistentVolumeClaim associato.

Salta il comando seguente se si verifica una delle seguenti condizioni:
- Non vuoi eliminare PersistentVolume o lo spazio di archiviazione sottostante.
- La tua attuale policy di recupero è Retain e vuoi conservare lo spazio di archiviazione sottostante. Pulisci manualmente PersistentVolume e l'istanza di archiviazione in base alle necessità.
- Il seguente comando echo $PV_NAME restituisce una stringa vuota, il che significa che PersistentVolume non è ancora stato creato.
```
PV_NAME=$(kubectl describe pvc $TEMP_PVC -n gke-managed-volumepopulator | grep "Volume:" | awk '{print $2}')

echo $PV_NAME

kubectl patch pv $PV_NAME -p '{"spec":{"persistentVolumeReclaimPolicy":"Delete"}}'
```

Trova il nome di PersistentVolumeClaim temporaneo e imposta la variabile di ambiente per un passaggio successivo:

PVC_UID=$(kubectl get pvc PVC_NAME -n NAMESPACE -o yaml | grep uid | awk '{print $2}')

TEMP_PVC=prime-$PVC_UID

echo $TEMP_PVC

Elimina PersistentVolumeClaim eseguendo questo comando. Il finalizzatore bloccherà l'operazione di eliminazione. Premi Ctrl+C, poi vai al passaggio successivo.
```
kubectl delete pvc PVC_NAME -n NAMESPACE
```
Rimuovi il finalizer datalayer.gke.io/populate-target-protection da PersistentVolumeClaim. Questo passaggio è necessario dopo l'eliminazione di PersistentVolumeClaim. In caso contrario, gke-volume-populator aggiunge di nuovo il finalizer a PersistentVolumeClaim.
```
kubectl get pvc PVC_NAME -n NAMESPACE -o=json | \
jq '.metadata.finalizers = null' | kubectl apply -f -
```
Elimina PersistentVolumeClaim temporaneo nello spazio dei nomi gke-managed-volumepopulator.
```
kubectl delete pvc $TEMP_PVC -n gke-managed-volumepopulator
```
Verifica che le risorse PersistentVolumeClaim, PersistentVolumeClaim e PersistentVolume temporanee siano eliminate:
```
kubectl get pvc,pv -A | grep -E "${TEMP_PVC?}|PVC_NAME|${PV_NAME?}"
```

Verifica che l'istanza Parallelstore sia eliminata. L'istanza Parallelstore condividerà lo stesso nome di PersistentVolume.

gcloud beta parallelstore instances list \
    --project=PROJECT_ID \
    --location=- | grep ${PV_NAME?}

Risoluzione dei problemi

Questa sezione mostra come risolvere i problemi relativi a GKE Volume Populator.

Prima di procedere, esegui il comando seguente per verificare la presenza di avvisi relativi all'evento PersistentVolumeClaim:

kubectl describe pvc PVC_NAME -n NAMESPACE

Errore: `An internal error has occurred`

Se si verifica il seguente errore, significa che si è verificato un errore interno dell'API Parallelstore.

Warning  PopulateOperationStartError  gkevolumepopulator-populator  Failed to start populate operation: populate data for PVC "xxx". Import data failed, error: rpc error: code = Internal desc = An internal error has occurred ("xxx")

Per risolvere il problema, segui questi passaggi per raccogliere i dati per l'assistenza:

Esegui i seguenti comandi per ottenere il nome di PersistentVolumeClaim temporaneo, sostituendo i segnaposto con i nomi effettivi:

PVC_UID=$(kubectl get pvc PVC_NAME -n NAMESPACE -o yaml | grep uid | awk '{print $2}')

TEMP_PVC=prime-${PVC_UID?}

echo ${TEMP_PVC?}

Esegui questo comando per ottenere il nome del volume:

PV_NAME=$(kubectl describe pvc ${TEMP_PVC?} -n gke-managed-volumepopulator | grep "Volume:" | awk '{print $2}')

Contatta il team di assistenza comunicando il messaggio di errore, il nome del progetto e il nome del volume.

Problemi di autorizzazione

Se durante il popolamento del volume si verificano errori come i seguenti, significa che GKE ha riscontrato un problema di autorizzazioni:

Il bucket Cloud Storage non esiste: PopulateOperationStartError con code = PermissionDenied
Autorizzazioni mancanti per il bucket Cloud Storage o i service account: PopulateOperationFailed con "code: "xxx" message:"Verify if bucket "xxx" exists and grant access".
Service account non trovato: PopulateOperationStartError con code = Unauthenticated.

Per risolvere questi errori, verifica quanto segue:

Accesso al bucket Cloud Storage: verifica che il bucket esista e che il account di servizio disponga di roles/storage.objectViewer permission.
Service account: verifica che esistano sia il account di servizio Kubernetes sia il account di servizio IAM e che siano collegati correttamente.
Service account Parallelstore: assicurati che il account di servizio Parallelstore esista e disponga delle autorizzazioni necessarie (roles/iam.serviceAccountTokenCreator e roles/iam.serviceAccountUser sull'account IAM).

Per i passaggi dettagliati e i comandi di verifica, consulta Configurare le autorizzazioni necessarie. Se gli errori persistono, contatta l'assistenza e fornisci il messaggio di errore, il nome del progetto e il nome del bucket Cloud Storage.

Errori di argomento non valido

Se riscontri errori InvalidArgument, significa che probabilmente hai fornito valori errati nella risorsa GCPDataSource o in PersistentVolumeClaim. Il log degli errori indicherà i campi esatti contenenti i dati non validi. Controlla l'URI del bucket Cloud Storage e altri campi pertinenti per verificarne l'accuratezza.

Verifica che il provisioning di PersistentVolumeClaim sia stato completato

GKE Volume Populator utilizza un oggetto PersistentVolumeClaim temporaneo nello spazio dei nomi gke-managed-volumepopulator per il provisioning del volume.

Il PersistentVolumeClaim temporaneo è essenzialmente uno snapshot del tuo PersistentVolumeClaim ancora in transito (in attesa che i dati vengano caricati completamente). Il suo nome ha il formato prime-YOUR_PVC_UID.

Per controllare lo stato:

Esegui questi comandi:

PVC_UID=$(kubectl get pvc PVC_NAME -n NAMESPACE -o yaml | grep uid | awk '{print $2}')

TEMP_PVC=prime-$PVC_UID

echo $TEMP_PVC

kubectl describe pvc ${TEMP_PVC?} -n gke-managed-volumepopulator

Se l'output è vuoto, significa che PersistentVolumeClaim temporaneo non è stato creato. Esegui questo comando per verificare la presenza di avvisi relativi all'evento PersistentVolumeClaim:

kubectl describe pvc PVC_NAME -n NAMESPACE

Se il provisioning è riuscito, l'output è simile al seguente. Cerca il log ProvisioningSucceeded:

Warning  ProvisioningFailed     9m12s                   parallelstore.csi.storage.gke.io_gke-10fedd76bae2494db688-2237-793f-vm_5f284e53-b25c-46bb-b231-49e894cbba6c  failed to provision volume with StorageClass "parallelstore-class": rpc error: code = DeadlineExceeded desc = context deadline exceeded
Warning  ProvisioningFailed     3m41s (x11 over 9m11s)  parallelstore.csi.storage.gke.io_gke-10fedd76bae2494db688-2237-793f-vm_5f284e53-b25c-46bb-b231-49e894cbba6c  failed to provision volume with StorageClass "parallelstore-class": rpc error: code = DeadlineExceeded desc = Volume pvc-808e41a4-b688-4afe-9131-162fe5d672ec not ready, current state: CREATING
Normal   ExternalProvisioning   3m10s (x43 over 13m)    persistentvolume-controller                                                                                  Waiting for a volume to be created either by the external provisioner 'parallelstore.csi.storage.gke.io' or manually by the system administrator. If volume creation is delayed, please verify that the provisioner is running and correctly registered.
Normal  Provisioning  8s (x13 over 10m)  "xxx"  External provisioner is provisioning volume for claim "xxx"
Normal  ProvisioningSucceeded  7s  "xxx"  Successfully provisioned volume "xxx"

Controlla se è iniziata la creazione dell'istanza Parallelstore.

gcloud beta parallelstore instances list \
    --project=PROJECT_ID \
    --location=-

L'output è simile al seguente. Verifica che il volume sia impostato sullo stato CREATING. Al termine della creazione dell'istanza Parallelstore, lo stato cambierà in ACTIVE.

"projects/PROJECT_ID/locations/<my-location>/<my-volume>"  12000  2024-10-09T17:59:42.582857261Z  2024-10-09T17:59:42.582857261Z  CREATING  projects/PROJECT_ID/global/NETWORK_NAME

Se il provisioning non riesce, consulta la guida alla risoluzione dei problemi di Parallelstore per ulteriori indicazioni.