Crea un notebook

In questo tutorial utilizzerai l'SDK Vertex AI in un blocco note Jupyter per ottenere previsioni utilizzando un'istanza di Vertex AI Workbench.

Questa sezione mostra come creare un blocco note Jupyter in un'istanza di Vertex AI Workbench. Le istanze Vertex AI Workbench sono ambienti di sviluppo basati su blocchi note Jupyter per l'intero flusso di lavoro di data science. Le istanze di Vertex AI Workbench sono preconfezionate con JupyterLab e dispongono di una suite preinstallata di pacchetti di deep learning, tra cui il supporto per i framework TensorFlow e PyTorch. Per ulteriori informazioni, consulta Introduzione alle istanze Vertex AI Workbench.

Dopo aver creato un blocco note in Vertex AI Workbench, esegui parti sequenziali di codice Python per svolgere la maggior parte del lavoro necessario per generare le tue predizioni.

Crea un'istanza di Vertex AI Workbench

Per creare un'istanza di Vertex AI Workbench:

  1. Nella console Google Cloud, apri il progetto Google Cloud se non è già aperto.

  2. Nella console Google Cloud, vai alla pagina Istanze di Vertex AI Workbench.

    Vai a Istanze

  3. Se viene visualizzata l'opzione per abilitare l'API Notebooks, fai clic su Abilita. Il completamento della procedura di attivazione potrebbe richiedere alcuni istanti.

  4. Fai clic su  Crea nuova.

  5. Nella finestra di dialogo Nuova istanza, in Nome, inserisci un nome per l'istanza.

  6. In Regione, seleziona us-central1 (Iowa).

  7. In Zona, seleziona us-central1-a.

  8. Fai clic su Crea. Se vuoi saperne di più sull'istanza, dopo che appare nell'elenco delle istanze, fai clic sul nome per visualizzarne le proprietà.

Preparare il notebook

L'istanza Vertex AI Workbench è già autenticata per utilizzare il tuo progetto Google Cloud. Tuttavia, devi installare e inizializzare l'SDK Vertex AI per Python. Questa sezione illustra questi passaggi.

Dopo aver creato il notebook, utilizzalo per inserire ed eseguire gli snippet di codice sequenziali in questo tutorial. Ogni snippet di codice deve essere eseguito singolarmente e in ordine.

Creare e aprire il notebook

Il notebook è il luogo in cui esegui il codice in questo tutorial. Si tratta di un file con estensione .ipynb. Quando lo crei, non ha titolo. Puoi rinominarlo dopo averlo aperto. Per creare e aprire il tuo notebook:

  1. Nella console Google Cloud, vai alla pagina Istanze.

    Vai a Istanze

  2. Fai clic su Apri JupyterLab accanto al nome dell'istanza.

    L'istanza di Vertex AI Workbench apre l'ambiente JupyterLab.

  3. In JupyterLab, seleziona File > Nuovo > Notebook.

    Si apre il nuovo file del notebook e viene visualizzata la finestra di dialogo Seleziona kernel.

  4. Nella finestra di dialogo Seleziona kernel, seleziona il kernel Python 3.

  5. Nel riquadro di navigazione a sinistra di JupyterLab, individua il nuovo blocco note, chiamato Untitled.ipynb. Per rinominarlo, fai clic con il tasto destro del mouse sul nome del notebook, fai clic su Rinomina e inserisci un nuovo nome.

Installare l'SDK Vertex AI Python

Dopo aver aperto il notebook, devi installare l'SDK Vertex AI per Python. Utilizzi l'SDK Vertex AI per Python per effettuare chiamate all'API Vertex AI che creano il set di dati, creano il modello, lo addestrano ed eseguono il deployment e effettuano previsioni con il modello. Per ulteriori informazioni, consulta Utilizzare l'SDK Vertex AI per Python.

Quando installi l'SDK Vertex AI per Python, vengono installati anche gli altri SDK Google Cloud di cui è dipendente. In questo tutorial vengono utilizzati due di questi SDK:

  • Cloud Storage: quando utilizzi l'SDK Vertex AI per Python per effettuare chiamate all'API Vertex AI, Vertex AI archivia gli elementi in un bucket Cloud Storage. Il bucket è chiamato bucket di staging. Devi specificare il bucket di staging quando inizializzi l'SDK Vertex AI per Python. Per ulteriori informazioni, consulta il client Python per l'API Google Cloud Storage di Google.

  • BigQuery: Vertex AI addestra il modello utilizzando un set di dati pubblico BigQuery. Per accedere e scaricare il set di dati utilizzato in questo tutorial, devi installare l'SDK BigQuery. Per ulteriori informazioni, consulta le librerie client dell'API BigQuery.

Per installare l'SDK Vertex AI Python e gli SDK dipendenti, esegui il seguente codice.

# Install the Vertex AI SDK
! pip3 install --upgrade --quiet google-cloud-aiplatform

Il flag --quiet elimina l'output in modo da visualizzare solo gli errori, se presenti. Il punto esclamativo (!) indica che si tratta di un comando shell.

Poiché questo è il primo codice che esegui nel nuovo notebook, inseriscilo nella cella di codice vuota nella parte superiore del notebook. Dopo aver inserito il codice in una cella di codice, fai clic su  Esegui le celle selezionate e vai avanti o utilizza la scorciatoia da tastiera Shift + Enter per eseguire il codice.

Esegui il codice per installare l'SDK.

Man mano che avanzi in questo tutorial, esegui il codice nella cella di codice vuota che viene visualizzata automaticamente sotto il codice eseguito più di recente. Se vuoi aggiungere manualmente una nuova cella di codice, fai clic sul pulsante  Inserisci una cella sotto del file del notebook.

Aggiungi una nuova cella di codice.

Imposta l'ID progetto e la regione

In questo passaggio, imposta l'ID progetto e la regione. Devi prima assegnarli alle variabili in modo da potervi fare facilmente riferimento in seguito in questo tutorial. Poi, utilizza il comando gcloud config per impostarli per la sessione Google Cloud. In un secondo momento, li utilizzerai insieme all'URI del bucket Cloud Storage per inizializzare l'SDK Vertex AI per Python.

Imposta l'ID progetto

Per impostare l'ID progetto:

  1. Individua l'ID del tuo progetto Google Cloud. Per ulteriori informazioni, consulta Trovare l'ID progetto.

  2. Esegui quanto segue in una cella di codice del tuo notebook. Nel codice, sostituisci PROJECT_ID con l'ID progetto che hai appena individuato. L'output generato da questo comando è Updated property [core/project].

    project_id = "PROJECT_ID"  # @param {type:"string"}
    # Set the project id
    ! gcloud config set project ${project_id}
    

Imposta la regione

Questo tutorial utilizza la regione us-central1. Per impostare la regione, procedi come segue:

  1. Esegui il seguente codice per impostare la variabile region utilizzata da Vertex AI su us-central1. Questo comando non genera output. Per maggiori informazioni, consulta Scegliere la località.

    region = "us-central1"  # @param {type: "string"}
    

Crea un bucket Cloud Storage

Questo tutorial richiede un bucket Cloud Storage utilizzato da Vertex AI per eseguire lo staging degli elementi. Vertex AI memorizza i dati associati al set di dati che crei e alle risorse del modello nel bucket di staging. Questi dati vengono conservati e sono disponibili in tutte le sessioni. In questo tutorial, Vertex AI archivia anche il set di dati nel bucket di staging. Specifica il bucket di staging quando inizializzi l'SDK Vertex AI per Python.

Ogni nome del bucket Cloud Storage deve essere univoco a livello globale. Se scegli un nome già utilizzato, il comando per creare il bucket non va a buon fine. Il codice seguente utilizza un timestamp e il nome del progetto per creare un nome di bucket univoco. Aggiungi il nome del bucket a gs:// per creare l'URI per il tuo bucket Cloud Storage. Il comando shell echo mostra l'URI in modo da poter verificare che sia stato creato correttamente.

  1. Per impostare il nome e l'URI del bucket, esegui il seguente codice. L'ultima riga visualizza l'URI del bucket Cloud Storage.

    bucket_name = "bucket-name-placeholder"  # @param {type:"string"}
    bucket_uri = f"gs://{bucket_name}"
    
    from datetime import datetime
    timestamp = datetime.now().strftime("%Y%m%d%H%M%S")
    
    if bucket_name == "" or bucket_name is None or bucket_name == "bucket-name-placeholder":
        bucket_name = project_id + "aip-" + timestamp
        bucket_uri = "gs://" + bucket_name
    ! echo $bucket_uri
    
  2. Per creare un bucket utilizzando la libreria client Cloud Storage e l'URI del bucket, esegui il seguente codice. Questo codice non genera output.

    from google.cloud import storage
    client = storage.Client(project=project_id)
    
    # Create a bucket
    bucket = client.create_bucket(bucket_name, location=region)
    
  3. Per verificare che il bucket sia stato creato correttamente, esegui quanto segue:

    print("Bucket {} created.".format(bucket.name))
    

Inizializzare l'SDK Vertex AI per Python

Per inizializzare l'SDK Vertex AI per Python, devi prima importare la relativa libreria,aiplatform. A questo punto, chiami aiplatform.init e passi i valori per i seguenti parametri:

  • project: project specifica il progetto Google Cloud da utilizzare quando utilizzi l'SDK Vertex AI per Python per effettuare chiamate all'API Vertex AI. In questo tutorial specifichi il tuo progetto Google Cloud con il relativo nome. Puoi anche specificare il progetto con il relativo numero.

  • location: il parametro location specifica la regione Google Cloud da utilizzare quando effettui chiamate API. Se non specifichi una posizione, l'SDK Vertex AI per Python utilizza us-central1.

  • staging_bucket: il parametro staging_bucket specifica il bucket Cloud Storage utilizzato per eseguire lo staging degli elementi quando utilizzi l'SDK Vertex AI per Python. Devi specificare il bucket con un URI che inizia con gs://. In questo tutorial, userai l'URI creato in precedenza in Creare un bucket Cloud Storage.

Per impostare il progetto, la regione e il bucket di staging Google Cloud, esegui il seguente comando. Questo comando non genera output.

from google.cloud import aiplatform

# Initialize the Vertex AI SDK
aiplatform.init(project=project_id, location=region, staging_bucket=bucket_uri)

Inizializza BigQuery

Questo tutorial utilizza un set di dati pubblico di BigQuery sui pinguini per addestrare un modello. Dopo che Vertex AI ha addestrato il modello, specifichi i parametri che rappresentano le caratteristiche dei pinguini e il modello utilizza queste caratteristiche per prevedere la specie di pinguino che rappresentano. Per ulteriori informazioni sui set di dati pubblici, consulta Set di dati pubblici di BigQuery.

Prima di utilizzare il set di dati BigQuery, devi inizializzare BigQuery con il tuo ID progetto. Per farlo, esegui il seguente comando. Questo comando non genera output.

from google.cloud import bigquery

# Set up BigQuery client
bq_client = bigquery.Client(project=project_id)