Questo tutorial è una guida completa che mostra come utilizzare l'SDK Vertex AI per Python per creare un modello addestrato personalizzato. Esegui il codice in un file del notebook (IPYNB) che utilizza un container Docker per addestrare e creare il modello. Il tutorial è rivolto ai data scientist che non hanno dimestichezza con Vertex AI, ma conoscono i notebook, Python e il flusso di lavoro di machine learning (ML).
Il processo inizia utilizzando la console Google Cloud per creare il progetto che contiene il tuo lavoro. Nel tuo progetto, utilizzi Vertex AI Workbench per creare un blocco note Jupyter. Nell'ambiente del notebook esegui il codice che scarica e prepara un set di dati, quindi utilizza il set di dati per creare e addestrare un modello. Al termine del tutorial, il modello addestrato genera le previsioni.
L'obiettivo di questo tutorial è illustrare tutti i passaggi necessari per creare predizioni in meno di un'ora. Il set di dati utilizzato è relativamente piccolo, quindi l'addestramento del modello non richiede molto tempo. Al termine, puoi applicare ciò che hai imparato a set di dati più grandi. Maggiore è il set di dati, più accurate sono le tue predizioni.
Passaggi del tutorial
Prerequisiti: crea il tuo account e il tuo progetto Google Cloud.
Crea un blocco note: crea e prepara un blocco note Jupyter e il relativo ambiente. Utilizzi il notebook per eseguire il codice che crea il set di dati, crea e addestra il modello e genera le previsioni.
Crea un set di dati: scarica un set di dati BigQuery disponibile pubblicamente, quindi utilizzalo per creare un set di dati tabulari Vertex AI. Il set di dati contiene i dati che utilizzi per addestrare il modello.
Crea uno script di addestramento: crea un script Python da passare al job di addestramento. Lo script viene eseguito quando il job di addestramento addestra e crea il modello.
Addestramento di un modello: utilizza il set di dati tabulare per addestrare ed eseguire il deployment di un modello. Utilizza il modello per creare le tue predizioni.
Fai previsioni: utilizza il modello per creare previsioni. Questa sezione illustra anche la procedura per eliminare le risorse che crei durante l'esecuzione di questo tutorial, in modo da non incorrere in addebiti superflui.
I risultati che raggiungi
Questo tutorial illustra come utilizzare l'SDK Vertex AI per Python per svolgere quanto segue:
- Creare un bucket Cloud Storage per archiviare un set di dati
- Pre-elaborazione dei dati per l'addestramento
- Utilizza i dati elaborati per creare un set di dati in BigQuery
- Utilizza il set di dati BigQuery per creare un set di dati tabulare Vertex AI
- Crea e addestra un modello con addestramento personalizzato
- Esegui il deployment del modello con addestramento personalizzato su un endpoint
- Generare una previsione
- Annullare il deployment del modello
- Elimina tutte le risorse create nel tutorial per evitare ulteriori addebiti
Risorse fatturabili utilizzate
Questo tutorial utilizza risorse fatturabili associate ai servizi Google Cloud Vertex AI, BigQuery e Cloud Storage. Se non hai mai utilizzato Google Cloud, potresti essere in grado di utilizzare uno o più di questi servizi senza costi. Vertex AI offre 300 $di crediti gratuiti ai nuovi clienti, mentre Cloud Storage e BigQuery hanno livelli gratuiti. Per ulteriori informazioni, consulta le seguenti risorse:
- Prezzi di Vertex AI e funzionalità cloud e offerta di prova gratuite
- Prezzi di BigQuery e utilizzo del livello gratuito di BigQuery
- Prezzi di Cloud Storage e utilizzo del livello gratuito di Cloud Storage
- Calcolatore dei prezzi di Google Cloud
Per evitare ulteriori addebiti, il passaggio finale di questo tutorial illustra la procedura per rimuovere tutte le risorse Google Cloud fatturabili che hai creato.