Risoluzione dei problemi di AI Platform Pipelines

Utilizza i seguenti suggerimenti per risolvere i problemi nel cluster AI Platform Pipelines.

Informazioni sul motivo per cui un'esecuzione della pipeline non è riuscita

Ogni passaggio di un'esecuzione della pipeline ha un log che descrive l'attività del passaggio. Leggi e analizza questi log per comprendere meglio il motivo dell'errore di esecuzione. Segui le istruzioni riportate di seguito per controllare i log di un'esecuzione della pipeline.

  1. Apri le pipeline della piattaforma AI nella console Google Cloud.

    Vai ad AI Platform Pipelines

  2. Fai clic su Apri dashboard Pipelines per il tuo cluster Kubeflow Pipelines. L'interfaccia utente di Kubeflow Pipelines si apre in una nuova scheda.

  3. Nel pannello di navigazione a sinistra, fai clic su Esperimenti. Viene visualizzato un elenco di esperimenti della pipeline.

  4. Fai clic su Tutte le esecuzioni. Viene visualizzato un elenco di esecuzioni della pipeline.

  5. Fai clic sul nome dell'esecuzione della pipeline di cui vuoi risolvere i problemi. Viene visualizzato un grafico che mostra i passaggi della pipeline.

  6. I passaggi della pipeline con un segno di spunta verde sono stati completati correttamente. I passaggi con un punto esclamativo rosso non sono riusciti.

    Fai clic sul passaggio della pipeline per cui vuoi risolvere i problemi. Viene visualizzata una sezione con gli elementi, gli input, gli output, i volumi, il manifest e i log del passaggio.

  7. Esamina ogni scheda per comprendere gli input e gli output, gli elementi creati e l'attività registrata nel log. Potresti dover eseguire diversi passaggi per trovare la fonte dell'errore.

Accesso vietato alla dashboard di Kubeflow Pipelines

Se ricevi il messaggio forbidden quando accedi alla dashboard di Kubeflow Pipelines per un cluster AI Platform Pipelines, significa che non disponi delle autorizzazioni sufficienti per accedere al cluster. Questo problema può verificarsi quando qualcun altro crea un cluster Google Kubernetes Engine ed esegue il deployment di AI Platform Pipelines per te.

Per risolvere il problema, chiedi all'amministratore di Google Cloud di utilizzare le seguenti istruzioni per concedere al tuo account l'accesso a AI Platform Pipelines:

Segui le istruzioni riportate di seguito per concedere a un account utente l'accesso al tuo cluster AI Platform Pipelines.

  1. Apri le pipeline della piattaforma AI nella console Google Cloud.

    Vai ad AI Platform Pipelines

  2. Trova il tuo cluster AI Platform Pipelines. Prendi nota di Cluster e Zona per utilizzarli nei passaggi successivi.

  3. Apri una sessione di Cloud Shell.

    Apri Cloud Shell

    Cloud Shell si apre in un frame nella parte inferiore della console Google Cloud. Utilizza Cloud Shell per completare il resto della procedura.

  4. Esegui il comando seguente per impostare il progetto Google Cloud predefinito per questa sessione Cloud Shell.

    gcloud config set project PROJECT_ID
    

    Sostituisci PROJECT_ID con l'ID del tuo progetto Google Cloud.

  5. Esegui questo comando per trovare l'account di servizio utilizzato dal tuo cluster GKE.

    gcloud container clusters describe CLUSTER_NAME --zone ZONE \
    --format="flattened(nodePools[].config.serviceAccount)"
    

    Sostituisci quanto segue:

    • CLUSTER_NAME: il nome del tuo cluster GKE.
    • ZONE: la zona in cui è stato creato il cluster.

    La risposta potrebbe indicare che il tuo cluster utilizza un account di servizio chiamato default. Questo valore si riferisce all'account di servizio predefinito per Compute Engine. Esegui il seguente comando per trovare il nome completo di questo account di servizio.

    gcloud iam service-accounts list \
    --filter "compute@developer.gserviceaccount.com"
    

    Scopri di più sull'account di servizio predefinito di Compute Engine.

  6. Concedi al tuo account utente il ruolo Utente account di servizio nell'account di servizio del tuo cluster GKE.

    gcloud iam service-accounts add-iam-policy-binding \
    SERVICE_ACCOUNT_NAME \
    --member=user:USERNAME \
    --role=roles/iam.serviceAccountUser
    

    Sostituisci quanto segue:

    • SERVICE_ACCOUNT_NAME: il nome dell'account di servizio del tuo cluster GKE, che hai trovato nel passaggio precedente. I nomi degli account di servizio hanno il formato *@*.gserviceaccount.com.
    • USERNAME: il tuo nome utente su Google Cloud.
  7. Concedi al tuo account utente l'accesso al ruolo visualizzatore del cluster GKE nel progetto.

    gcloud projects add-iam-policy-binding PROJECT_ID \
    --member user:USERNAME --role roles/container.clusterViewer
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del tuo progetto Google Cloud.
    • USERNAME: il tuo nome utente su Google Cloud.

Autorizzazioni insufficienti durante l'esecuzione di una pipeline

Durante l'esecuzione di una pipeline che accede alle risorse Google Cloud, potresti ricevere un errore di autorizzazioni insufficienti. Ad esempio:

Error executing an HTTP request: HTTP response code 403 with body '{
  "error": {
    "errors": [
      {
       "domain": "global",
       "reason": "insufficientPermissions",
       "message": "Insufficient Permission"
      }
    ],
    "code": 403,
    "message": "Insufficient Permission"
  }
}'

Affinché un passaggio della pipeline possa accedere alle API o alle risorse Google Cloud, il cluster e la pipeline di Google Kubernetes Engine devono:

Messaggio di avviso "Il server è riuscito a soddisfare solo parzialmente la tua richiesta"

Potresti visualizzare il seguente messaggio durante l'upgrade di un cluster o il deployment di AI Platform Pipelines.

Sorry, the server was only able to partially fulfill
your request. Some data might not be rendered.

Se vedi questo messaggio, attendi cinque minuti e poi aggiorna la pagina.