Questa sezione mostra come creare un blocco note Jupyter in un'istanza di Vertex AI Workbench. Le istanze Vertex AI Workbench sono ambienti di sviluppo basati su blocchi note Jupyter per l'intero flusso di lavoro di data science. Le istanze di Vertex AI Workbench sono preconfezionate con JupyterLab e dispongono di una suite preinstallata di pacchetti di deep learning, tra cui il supporto per i framework TensorFlow e PyTorch. Per ulteriori informazioni, consulta Introduzione alle istanze Vertex AI Workbench.
Dopo aver creato un blocco note in Vertex AI Workbench, esegui parti sequenziali di codice Python per svolgere la maggior parte del lavoro necessario per generare le tue predizioni.
Crea un'istanza di Vertex AI Workbench
Per creare un'istanza di Vertex AI Workbench:
Nella console Google Cloud, apri il progetto Google Cloud se non è già aperto.
Nella console Google Cloud, vai alla pagina Istanze di Vertex AI Workbench.
Se viene visualizzata l'opzione per abilitare l'API Notebooks, fai clic su Abilita. Il completamento della procedura di attivazione potrebbe richiedere alcuni istanti.
Fai clic su
Crea nuova.Nella finestra di dialogo Nuova istanza, in Nome, inserisci un nome per l'istanza.
In Regione, seleziona us-central1 (Iowa).
In Zona, seleziona us-central1-a.
Fai clic su Crea. Se vuoi saperne di più sull'istanza, dopo che appare nell'elenco delle istanze, fai clic sul nome per visualizzarne le proprietà.
Preparare il notebook
L'istanza Vertex AI Workbench è già autenticata per utilizzare il tuo progetto Google Cloud. Tuttavia, devi installare e inizializzare l'SDK Vertex AI per Python. Questa sezione illustra questi passaggi.
Dopo aver creato il notebook, utilizzalo per inserire ed eseguire gli snippet di codice sequenziali in questo tutorial. Ogni snippet di codice deve essere eseguito singolarmente e in ordine.
Creare e aprire il notebook
Il notebook è il luogo in cui esegui il codice in questo tutorial. Si tratta di un file con estensione .ipynb
. Quando lo crei, non ha titolo. Puoi rinominarlo dopo averlo aperto. Per creare e aprire il tuo notebook:
Nella console Google Cloud, vai alla pagina Istanze.
Fai clic su Apri JupyterLab accanto al nome dell'istanza.
L'istanza di Vertex AI Workbench apre l'ambiente JupyterLab.
In JupyterLab, seleziona File > Nuovo > Notebook.
Si apre il nuovo file del notebook e viene visualizzata la finestra di dialogo Seleziona kernel.
Nella finestra di dialogo Seleziona kernel, seleziona il kernel Python 3.
Nel riquadro di navigazione a sinistra di JupyterLab, individua il nuovo blocco note, chiamato Untitled.ipynb. Per rinominarlo, fai clic con il tasto destro del mouse sul nome del notebook, fai clic su Rinomina e inserisci un nuovo nome.
Installare l'SDK Vertex AI Python
Dopo aver aperto il notebook, devi installare l'SDK Vertex AI per Python. Utilizzi l'SDK Vertex AI per Python per effettuare chiamate all'API Vertex AI che creano il set di dati, creano il modello, lo addestrano ed eseguono il deployment e effettuano previsioni con il modello. Per ulteriori informazioni, consulta Utilizzare l'SDK Vertex AI per Python.
Quando installi l'SDK Vertex AI per Python, vengono installati anche gli altri SDK Google Cloud di cui è dipendente. In questo tutorial vengono utilizzati due di questi SDK:
Cloud Storage: quando utilizzi l'SDK Vertex AI per Python per effettuare chiamate all'API Vertex AI, Vertex AI archivia gli elementi in un bucket Cloud Storage. Il bucket è chiamato bucket di staging. Devi specificare il bucket di staging quando inizializzi l'SDK Vertex AI per Python. Per ulteriori informazioni, consulta il client Python per l'API Google Cloud Storage di Google.
BigQuery: Vertex AI addestra il modello utilizzando un set di dati pubblico BigQuery. Per accedere e scaricare il set di dati utilizzato in questo tutorial, devi installare l'SDK BigQuery. Per ulteriori informazioni, consulta le librerie client dell'API BigQuery.
Per installare l'SDK Vertex AI Python e gli SDK dipendenti, esegui il seguente codice.
# Install the Vertex AI SDK
! pip3 install --upgrade --quiet google-cloud-aiplatform
Il flag --quiet
elimina l'output in modo da visualizzare solo gli errori, se presenti. Il punto esclamativo (!
) indica che si tratta di un comando shell.
Poiché questo è il primo codice che esegui nel nuovo notebook, inseriscilo nella cella di codice vuota nella parte superiore del notebook. Dopo aver inserito il codice in una cella di codice, fai clic su Shift + Enter
per eseguire il codice.
Man mano che avanzi in questo tutorial, esegui il codice nella cella di codice vuota che viene visualizzata automaticamente sotto il codice eseguito più di recente. Se vuoi aggiungere manualmente una nuova cella di codice, fai clic sul pulsante
Inserisci una cella sotto del file del notebook.
Imposta l'ID progetto e la regione
In questo passaggio, imposta l'ID progetto e la regione. Devi prima assegnarli alle variabili in modo da potervi fare facilmente riferimento in seguito in questo tutorial. Poi, utilizza il comando gcloud config
per impostarli per la sessione Google Cloud.
In un secondo momento, li utilizzerai insieme all'URI del bucket Cloud Storage per inizializzare l'SDK Vertex AI per Python.
Imposta l'ID progetto
Per impostare l'ID progetto:
Individua l'ID del tuo progetto Google Cloud. Per ulteriori informazioni, consulta Trovare l'ID progetto.
Esegui quanto segue in una cella di codice del tuo notebook. Nel codice, sostituisci PROJECT_ID con l'ID progetto che hai appena individuato. L'output generato da questo comando è
Updated property [core/project].
project_id = "PROJECT_ID" # @param {type:"string"} # Set the project id ! gcloud config set project ${project_id}
Imposta la regione
Questo tutorial utilizza la regione us-central1
. Per impostare la regione, procedi come segue:
Esegui il seguente codice per impostare la variabile
region
utilizzata da Vertex AI suus-central1
. Questo comando non genera output. Per maggiori informazioni, consulta Scegliere la località.region = "us-central1" # @param {type: "string"}
Crea un bucket Cloud Storage
Questo tutorial richiede un bucket Cloud Storage utilizzato da Vertex AI per eseguire lo staging degli elementi. Vertex AI memorizza i dati associati al set di dati che crei e alle risorse del modello nel bucket di staging. Questi dati vengono conservati e sono disponibili in tutte le sessioni. In questo tutorial, Vertex AI archivia anche il set di dati nel bucket di staging. Specifica il bucket di staging quando inizializzi l'SDK Vertex AI per Python.
Ogni nome del bucket Cloud Storage deve essere univoco a livello globale. Se scegli un nome già utilizzato, il comando per creare il bucket non va a buon fine. Il codice seguente utilizza un timestamp e il nome del progetto per creare un nome di bucket univoco. Aggiungi il nome del bucket a gs://
per creare l'URI per il
tuo bucket Cloud Storage. Il comando shell echo
mostra l'URI in modo da poter verificare che sia stato creato correttamente.
Per impostare il nome e l'URI del bucket, esegui il seguente codice. L'ultima riga visualizza l'URI del bucket Cloud Storage.
bucket_name = "bucket-name-placeholder" # @param {type:"string"} bucket_uri = f"gs://{bucket_name}" from datetime import datetime timestamp = datetime.now().strftime("%Y%m%d%H%M%S") if bucket_name == "" or bucket_name is None or bucket_name == "bucket-name-placeholder": bucket_name = project_id + "aip-" + timestamp bucket_uri = "gs://" + bucket_name ! echo $bucket_uri
Per creare un bucket utilizzando la libreria client Cloud Storage e l'URI del bucket, esegui il seguente codice. Questo codice non genera output.
from google.cloud import storage client = storage.Client(project=project_id) # Create a bucket bucket = client.create_bucket(bucket_name, location=region)
Per verificare che il bucket sia stato creato correttamente, esegui quanto segue:
print("Bucket {} created.".format(bucket.name))
Inizializzare l'SDK Vertex AI per Python
Per inizializzare l'SDK Vertex AI per Python, devi prima importare la relativa libreria,aiplatform
. A questo punto, chiami aiplatform.init
e passi i valori per i seguenti parametri:
project
:project
specifica il progetto Google Cloud da utilizzare quando utilizzi l'SDK Vertex AI per Python per effettuare chiamate all'API Vertex AI. In questo tutorial specifichi il tuo progetto Google Cloud con il relativo nome. Puoi anche specificare il progetto con il relativo numero.location
: il parametrolocation
specifica la regione Google Cloud da utilizzare quando effettui chiamate API. Se non specifichi una posizione, l'SDK Vertex AI per Python utilizzaus-central1
.staging_bucket
: il parametrostaging_bucket
specifica il bucket Cloud Storage utilizzato per eseguire lo staging degli elementi quando utilizzi l'SDK Vertex AI per Python. Devi specificare il bucket con un URI che inizia congs://
. In questo tutorial, userai l'URI creato in precedenza in Creare un bucket Cloud Storage.
Per impostare il progetto, la regione e il bucket di staging Google Cloud, esegui il seguente comando. Questo comando non genera output.
from google.cloud import aiplatform
# Initialize the Vertex AI SDK
aiplatform.init(project=project_id, location=region, staging_bucket=bucket_uri)
Inizializza BigQuery
Questo tutorial utilizza un set di dati pubblico di BigQuery sui pinguini per addestrare un modello. Dopo che Vertex AI ha addestrato il modello, specifichi i parametri che rappresentano le caratteristiche dei pinguini e il modello utilizza queste caratteristiche per prevedere la specie di pinguino che rappresentano. Per ulteriori informazioni sui set di dati pubblici, consulta Set di dati pubblici di BigQuery.
Prima di utilizzare il set di dati BigQuery, devi inizializzare BigQuery con il tuo ID progetto. Per farlo, esegui il seguente comando. Questo comando non genera output.
from google.cloud import bigquery
# Set up BigQuery client
bq_client = bigquery.Client(project=project_id)