Introduzione all'addestramento personalizzato: addestramento di un modello di classificazione delle immagini personalizzato

Questa pagina mostra come eseguire un'applicazione di addestramento TensorFlow Keras su Vertex AI. Questo modello specifico addestra un modello di classificazione delle immagini in grado di classificare i fiori in base al tipo.

Questo tutorial è composto da diverse pagine:

  1. Configura il progetto e l'ambiente.

  2. Addestramento di un modello di classificazione delle immagini personalizzato.

  3. Esecuzione di previsioni da un modello di classificazione delle immagini personalizzato.

  4. Pulizia del progetto.

Ogni pagina presuppone che tu abbia già eseguito le istruzioni riportate nelle pagine precedenti del tutorial.

Il resto di questo documento presuppone che tu stia utilizzando lo stesso ambiente Cloud Shell creato seguendo la prima pagina di questo tutorial. Se la sessione Cloud Shell originale non è più aperta, puoi tornare all'ambiente nel seguente modo:

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

  2. Nella sessione Cloud Shell, esegui il seguente comando:

    cd hello-custom-sample

Eseguire una pipeline di addestramento personalizzata

Questa sezione descrive l'utilizzo del pacchetto di addestramento che hai caricato su Cloud Storage per eseguire una pipeline di addestramento personalizzato Vertex AI.

  1. Nella console Google Cloud, nella sezione Vertex AI, vai alla pagina Pipeline di addestramento.

    Vai a Pipeline di addestramento

  2. Fai clic su Crea per aprire il riquadro Addestra nuovo modello.

  3. Nel passaggio Scegli il metodo di addestramento, svolgi i seguenti passaggi:

    1. Nell'elenco a discesa Set di dati, seleziona Nessun set di dati gestito. Questa particolareggiata applicazione di addestramento carica i dati dalla libreria TensorFlow Datasets anziché da un set di dati Vertex AI gestito.

    2. Assicurati che l'opzione Addestramento personalizzato (avanzato) sia selezionata.

    Fai clic su Continua.

  4. Nel passaggio Dettagli del modello, inserisci hello_custom nel campo Nome. Fai clic su Continua.

  5. Nel passaggio Container di addestramento, fornisci a Vertex AI le informazioni di cui ha bisogno per utilizzare il pacchetto di addestramento che hai caricato su Cloud Storage:

    1. Seleziona Container predefinito.

    2. Nell'elenco a discesa Framework modello, seleziona TensorFlow.

    3. Nell'elenco a discesa Versione framework modello, seleziona 2.3.

    4. Nel campo Posizione pacchetto, inserisci cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz.

    5. Nel campo Modulo Python, inserisci trainer.task. trainer è il nome del pacchetto Python nel file tarball e task.py contiene il codice di addestramento. Pertanto, trainer.task è il nome del modulo che vuoi che Vertex AI esegua.

    6. Nel campo Directory di output del modello, fai clic su Sfoglia. Nel riquadro Seleziona cartella, procedi nel seguente modo:

      1. Vai al bucket Cloud Storage.

      2. Fai clic su Crea nuova cartella .

      3. Assegna alla nuova cartella il nome output. Quindi, fai clic su Crea.

      4. Fai clic su Seleziona.

      Verifica che il campo abbia il valore gs://BUCKET_NAME/output, dove BUCKET_NAME è il nome del tuo bucket Cloud Storage.

      Questo valore viene passato a Vertex AI nel campo dell'API baseOutputDirectory, che imposta diverse variabili di ambiente a cui può accedere la tua applicazione di addestramento quando viene eseguita.

      Ad esempio, quando imposti questo campo su gs://BUCKET_NAME/output, Vertex AI imposta la variabile di ambiente AIP_MODEL_DIR su gs://BUCKET_NAME/output/model. Al termine dell'addestramento, Vertex AI utilizza gli eventuali elementi della directory AIP_MODEL_DIR per creare una risorsa modello.

      Scopri di più sulle variabili di ambiente impostate da questo campo.

    Fai clic su Continua.

  6. Nel passaggio facoltativo Iperparametri, assicurati che la casella di controllo Abilita ottimizzazione iperparametro non sia selezionata. Questo tutorial non utilizza l'ottimizzazione degli iperparametri. Fai clic su Continua.

  7. Nel passaggio Compute e prezzi, alloca le risorse per il job di addestramento personalizzato:

    1. Nell'elenco a discesa Regione, seleziona us-central1 (Iowa).

    2. Nell'elenco a discesa Tipo di macchina, seleziona n1-standard-4 dalla sezione Standard.

    Non aggiungere acceleratori o pool di worker per questo tutorial. Fai clic su Continua.

  8. Nel passaggio Contenitore di previsione, fornisci a Vertex AI le informazioni di cui ha bisogno per fornire le previsioni:

    1. Seleziona Container predefinito.

    2. Nella sezione Impostazioni del contenitore precompilato, segui questi passaggi:

      1. Nell'elenco a discesa Framework modello, seleziona TensorFlow.

      2. Nell'elenco a discesa Versione framework modello, seleziona 2.3.

      3. Nell'elenco a discesa Tipo acceleratore, seleziona Nessuno.

      4. Verifica che il campo Model directory (Directory del modello) abbia il valore gs://BUCKET_NAME/output, dove BUCKET_NAME è il nome del bucket Cloud Storage. Corrisponde al valore Directory di output del modello fornito in un passaggio precedente.

    3. Lascia vuoti i campi della sezione Predici schemata.

  9. Fai clic su Inizia addestramento per avviare la pipeline di addestramento personalizzato.

Ora puoi visualizzare la nuova pipeline di addestramento, denominata hello_custom, nella pagina Addestramento. Potresti dover aggiornare la pagina. La pipeline di addestramento svolge due funzioni principali:

  1. La pipeline di addestramento crea una risorsa job personalizzato denominata hello_custom-custom-job. Dopo alcuni istanti, puoi visualizzare questa risorsa nella pagina Job personalizzati della sezione Addestramento:

    Vai a Job personalizzati

    Il job personalizzato esegue l'applicazione di addestramento utilizzando le risorse di calcolo specificate in questa sezione.

  2. Al termine del job personalizzato, la pipeline di addestramento trova gli artefatti che l'applicazione di addestramento crea nella directory output/model/ del tuo bucket Cloud Storage. Utilizza questi elementi per creare una risorsa model.

Monitorare la formazione

Per visualizzare i log di addestramento:

  1. Nella sezione Vertex AI della console Google Cloud, vai alla pagina Job personalizzati.

    Vai a Job personalizzati

  2. Per visualizzare i dettagli del CustomJob che hai appena creato, fai clic su hello_custom-custom-job nell'elenco.

  3. Nella pagina dei dettagli del job, fai clic su Visualizza log.

Visualizzare il modello addestrato

Al termine della pipeline di addestramento personalizzato, puoi trovare il modello addestrato nella console Google Cloud, nella sezione Vertex AI, nella pagina Modelli.

Vai a Modelli

Il modello ha il nome hello_custom.

Passaggi successivi

Vai alla pagina successiva di questo tutorial per fornire le previsioni del modello ML addestrato.