Aggiungere l'esecuzione della pipeline all'esperimento

Puoi utilizzare la console Google Cloud o l'SDK Vertex AI per Python per aggiungere un'esecuzione della pipeline a un esperimento o a un'esecuzione dell'esperimento.

Google Cloud console

Utilizza le seguenti istruzioni per eseguire una pipeline ML e associarla a un esperimento e, facoltativamente, a un'esecuzione dell'esperimento utilizzando la console Google Cloud . Le esecuzioni dell'esperimento possono essere create solo tramite l'SDK Vertex AI per Python (vedi Creare e gestire le esecuzioni dell'esperimento).
  1. Nella console Google Cloud , nella sezione Vertex AI, vai alla pagina Pipeline.
    Vai a Pipeline
  2. Nell'elenco a discesa Regione, seleziona la regione in cui vuoi creare un'esecuzione della pipeline.
  3. Fai clic su Crea esecuzione per aprire il riquadro Crea esecuzione della pipeline.
  4. Specifica i seguenti dettagli di Esegui.
    • Nel campo File, fai clic su Scegli per aprire il selettore di file. Vai al file JSON della pipeline compilata che vuoi eseguire, seleziona la pipeline e fai clic su Apri.
    • Il nome della pipeline corrisponde per impostazione predefinita al nome specificato nella definizione della pipeline. (Facoltativo) Specifica un nome della pipeline diverso.
    • Specifica un Nome esecuzione per identificare in modo univoco questa esecuzione della pipeline.
  5. Per specificare che questa esecuzione della pipeline utilizza un account di servizio personalizzato, una chiave di crittografia gestita dal cliente o una rete VPC con peering, fai clic su Opzioni avanzate (facoltativo).
    Segui le istruzioni riportate di seguito per configurare le opzioni avanzate, ad esempio un account di servizio personalizzato.
    • Per specificare un service account, seleziona un account di servizio dall'elenco a discesa Service account.
      Se non specifichi un account di servizio, Vertex AI Pipelines esegue la pipeline utilizzando il account di servizio Compute Engine predefinito.
      Scopri di più sulla configurazione di un account di servizio da utilizzare con Vertex AI Pipelines.
    • Per utilizzare una chiave di crittografia gestita dal cliente (CMEK), seleziona Utilizza una chiave di crittografia gestita dal cliente. Viene visualizzato il menu a discesa Seleziona una chiave gestita dal cliente. Nell'elenco a discesa Seleziona una chiave gestita dal cliente, seleziona la chiave che vuoi utilizzare.
    • Per utilizzare una rete VPC in peering in questa esecuzione della pipeline, inserisci il nome della rete VPC nella casella Rete VPC in peering.
  6. Fai clic su Continua.
    Viene visualizzato il riquadro Cloud Storage e Parametri pipeline.
    • Obbligatorio: inserisci la directory di output di Cloud Storage, ad esempio gs://location_of_directory.
    • (Facoltativo) Specifica i parametri da utilizzare per questa esecuzione della pipeline.
  7. Fai clic su Invia per creare l'esecuzione della pipeline.
  8. Una volta inviata, la pipeline viene visualizzata nella tabella della console Google Cloud .
  9. Nella riga associata alla pipeline, fai clic su  Visualizza altro > Aggiungi all'esperimento.
    • Seleziona un esperimento esistente o creane uno nuovo.
    • (Facoltativo) Se le esecuzioni dell'esperimento sono associate all'esperimento, vengono visualizzate nel menu a discesa. Seleziona un'esecuzione dell'esperimento esistente.
  10. Fai clic su Salva.

Confrontare l'esecuzione di una pipeline con le esecuzioni di esperimenti utilizzando la console Google Cloud

  1. Nella console Google Cloud , vai alla pagina Esperimenti.
    Vai a Esperimenti.
    Nella pagina Esperimenti viene visualizzato un elenco di esperimenti.
  2. Seleziona l'esperimento a cui vuoi aggiungere l'esecuzione della pipeline.
    Viene visualizzato un elenco di esecuzioni.
  3. Seleziona le corse che vuoi confrontare, poi fai clic su Confronta
  4. Fai clic sul pulsante Aggiungi corsa. Viene visualizzato un elenco di esecuzioni.
  5. Seleziona l'esecuzione della pipeline da aggiungere. La corsa viene aggiunta.

SDK Vertex AI Python {:#sdk-add-pipeline-run}

Gli esempi seguenti utilizzano l'API PipelineJob.

Associare l'esecuzione della pipeline a un esperimento

Questo esempio mostra come associare l'esecuzione di una pipeline a un esperimento. Quando vuoi confrontare le esecuzioni della pipeline, devi associare le esecuzioni della pipeline a un esperimento. Consulta init nella documentazione di riferimento dell'SDK Vertex AI per Python.

Python

from typing import Any, Dict, Optional

from google.cloud import aiplatform


def log_pipeline_job_to_experiment_sample(
    experiment_name: str,
    pipeline_job_display_name: str,
    template_path: str,
    pipeline_root: str,
    project: str,
    location: str,
    parameter_values: Optional[Dict[str, Any]] = None,
):
    aiplatform.init(project=project, location=location)

    pipeline_job = aiplatform.PipelineJob(
        display_name=pipeline_job_display_name,
        template_path=template_path,
        pipeline_root=pipeline_root,
        parameter_values=parameter_values,
    )

    pipeline_job.submit(experiment=experiment_name)

  • experiment_name: fornisci un nome per l'esperimento. Puoi trovare l'elenco degli esperimenti nella console Google Cloud selezionando Esperimenti nel menu di navigazione della sezione.
  • pipeline_job_display_name: il nome definito dall'utente di questa pipeline.
  • template_path: il percorso del file JSON o YAML PipelineJob o PipelineSpec. Può essere un percorso locale o un URI Cloud Storage. Esempio: "gs://project.name"
  • pipeline_root: La radice degli output della pipeline. Per impostazione predefinita, viene utilizzato il bucket di staging.
  • parameter_values: Il mapping dai nomi dei parametri di runtime ai valori che controllano l'esecuzione della pipeline.
  • project: il tuo ID progetto Puoi trovare questi ID nella pagina Benvenuto della console Google Cloud .
  • location: consulta l'elenco delle località disponibili.

Associa l'esecuzione della pipeline all'esecuzione dell'esperimento

L'esempio fornito include l'associazione di un'esecuzione della pipeline a un'esecuzione dell'esperimento.

Casi d'uso:

  • Quando esegui l'addestramento del modello locale e poi esegui la valutazione su quel modello (la valutazione viene eseguita utilizzando una pipeline). In questo caso, devi scrivere le metriche di valutazione dall'esecuzione della pipeline in un ExperimentRun
  • Quando la stessa pipeline viene eseguita più volte. Ad esempio, se modifichi i parametri di input o se un componente non funziona e devi eseguirlo di nuovo.

Quando associ l'esecuzione di una pipeline all'esecuzione di un esperimento, i parametri e le metriche non vengono visualizzati automaticamente e devono essere registrati manualmente utilizzando le API di logging.

Nota: quando il parametro facoltativo resume è specificato come TRUE, l'esecuzione avviata in precedenza riprende. Se non specificato, resume è impostato su FALSE e viene creata una nuova esecuzione.

Consulta init, start_run e log nella documentazione di riferimento dell'SDK Vertex AI per Python.

Python

from google.cloud import aiplatform


def log_pipeline_job_sample(
    experiment_name: str,
    run_name: str,
    pipeline_job: aiplatform.PipelineJob,
    project: str,
    location: str,
):
    aiplatform.init(experiment=experiment_name, project=project, location=location)

    aiplatform.start_run(run=run_name, resume=True)

    aiplatform.log(pipeline_job=pipeline_job)

  • experiment_name: fornisci un nome per l'esperimento. Puoi trovare l'elenco degli esperimenti nella console Google Cloud selezionando Esperimenti nel menu di navigazione della sezione.
  • run_name: specifica un nome di esecuzione.
  • pipeline_job: Un Vertex AI PipelineJob
  • project: il tuo ID progetto Puoi trovarli nella pagina Benvenuto della console Google Cloud .
  • location: vedi Elenco delle località disponibili

Visualizza l'elenco delle esecuzioni della pipeline nella console Google Cloud

  1. Nella console Google Cloud , nella sezione Vertex AI, vai alla pagina Pipeline.

    Vai alla pagina Pipeline

  2. Verifica di trovarti nel progetto corretto.

  3. Un elenco di esperimenti ed esecuzioni associati alle esecuzioni della pipeline del progetto viene visualizzato rispettivamente nelle colonne Esperimento ed Esecuzione esperimento.

Vertex AIList of experiments

Codelab

Passaggi successivi

Esempio di notebook pertinente