Introduzione all'addestramento personalizzato: addestramento di un modello di classificazione delle immagini personalizzato

Questa pagina mostra come eseguire un'applicazione di addestramento TensorFlow Keras su Vertex AI. Questo modello specifico addestra un modello di classificazione delle immagini in grado di classificare i fiori in base al tipo.

Questo tutorial è composto da più pagine:

  1. Configurazione del progetto e dell'ambiente.

  2. Addestramento di un modello di classificazione delle immagini personalizzato.

  3. Esecuzione di previsioni da un modello di classificazione delle immagini personalizzato.

  4. Pulizia del progetto.

Ogni pagina presuppone che tu abbia già eseguito le istruzioni delle pagine precedenti del tutorial.

Il resto di questo documento presuppone che tu stia utilizzando lo stesso ambiente Cloud Shell che hai creato seguendo la prima pagina di questo tutorial. Se la sessione Cloud Shell originale non è più aperta, puoi tornare all'ambiente nel seguente modo:

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

  2. Nella sessione di Cloud Shell, esegui questo comando:

    cd hello-custom-sample

Esegui una pipeline di addestramento personalizzata

Questa sezione descrive l'utilizzo del pacchetto di addestramento che hai caricato in Cloud Storage per eseguire una pipeline di addestramento personalizzato Vertex AI.

  1. Nella console Google Cloud , nella sezione Vertex AI, vai alla pagina Pipeline di addestramento.

    Vai alle pipeline di addestramento

  2. Fai clic su Crea per aprire il riquadro Addestra nuovo modello.

  3. Nel passaggio Scegli il metodo di addestramento, segui questi passaggi:

    1. Nell'elenco a discesa Set di dati, seleziona Nessun set di dati gestito. Questa particolare applicazione di addestramento carica i dati dalla libreria TensorFlow Datasets anziché da un set di dati gestito da Vertex AI.

    2. Assicurati che sia selezionata l'opzione Addestramento personalizzato (avanzato).

    Fai clic su Continua.

  4. Nel passaggio Dettagli modello, nel campo Nome, inserisci hello_custom. Fai clic su Continua.

  5. Nel passaggio Container di addestramento, fornisci a Vertex AI le informazioni necessarie per utilizzare il pacchetto di addestramento che hai caricato in Cloud Storage:

    1. Seleziona Container predefinito.

    2. Nell'elenco a discesa Framework modello, seleziona TensorFlow.

    3. Nell'elenco a discesa Versione framework modello, seleziona 2.3.

    4. Nel campo Posizione pacchetto, inserisci cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz.

    5. Nel campo Modulo Python, inserisci trainer.task. trainer è il nome del pacchetto Python nel tarball e task.py contiene il codice di addestramento. Pertanto, trainer.task è il nome del modulo che vuoi che Vertex AI esegua.

    6. Nel campo Directory di output del modello, fai clic su Sfoglia. Nel riquadro Seleziona cartella, procedi nel seguente modo:

      1. Vai al bucket Cloud Storage.

      2. Fai clic su Crea nuova cartella .

      3. Assegna alla nuova cartella il nome output. Quindi, fai clic su Crea.

      4. Fai clic su Seleziona.

      Verifica che il campo abbia il valore gs://BUCKET_NAME/output, dove BUCKET_NAME è il nome del tuo bucket Cloud Storage.

      Questo valore viene trasmesso a Vertex AI nel campo baseOutputDirectory API, che imposta diverse variabili di ambiente a cui l'applicazione di addestramento può accedere durante l'esecuzione.

      Ad esempio, quando imposti questo campo su gs://BUCKET_NAME/output, Vertex AI imposta la variabile di ambiente AIP_MODEL_DIR su gs://BUCKET_NAME/output/model. Al termine dell'addestramento, Vertex AI utilizza gli artefatti nella directory AIP_MODEL_DIR per creare una risorsa modello.

      Scopri di più sulle variabili di ambiente impostate da questo campo.

    Fai clic su Continua.

  6. Nel passaggio facoltativo Iperparametri, assicurati che la casella di controllo Abilita ottimizzazione degli iperparametri sia deselezionata. Questo tutorial non utilizza l'ottimizzazione degli iperparametri. Fai clic su Continua.

  7. Nel passaggio Compute e prezzi, alloca le risorse per il job di addestramento personalizzato:

    1. Nell'elenco a discesa Regione, seleziona us-central1 (Iowa).

    2. Nell'elenco a discesa Tipo di macchina, seleziona n1-standard-4 nella sezione Standard.

    Non aggiungere acceleratori o pool di worker per questo tutorial. Fai clic su Continua.

  8. Nel passaggio Container di previsione, fornisci a Vertex AI le informazioni necessarie per pubblicare le previsioni:

    1. Seleziona Container predefinito.

    2. Nella sezione Impostazioni contenitore predefinito, segui questi passaggi:

      1. Nell'elenco a discesa Framework modello, seleziona TensorFlow.

      2. Nell'elenco a discesa Versione framework modello, seleziona 2.3.

      3. Nell'elenco a discesa Tipo acceleratore, seleziona Nessuno.

      4. Verifica che il campo Directory del modello abbia il valore gs://BUCKET_NAME/output, dove BUCKET_NAME è il nome del bucket Cloud Storage. Corrisponde al valore della directory di output del modello che hai fornito in un passaggio precedente.

    3. Lascia vuoti i campi della sezione Predict schemata (Schemi di previsione).

  9. Fai clic su Inizia addestramento per avviare la pipeline di addestramento personalizzato.

Ora puoi visualizzare la nuova pipeline di addestramento, denominata hello_custom, nella pagina Addestramento. Potrebbe essere necessario aggiornare la pagina. La pipeline di addestramento svolge due attività principali:

  1. La pipeline di addestramento crea una risorsa job personalizzato denominata hello_custom-custom-job. Dopo qualche istante, puoi visualizzare questa risorsa nella pagina Job personalizzati della sezione Addestramento:

    Vai a Job personalizzati

    Il job personalizzato esegue l'applicazione di addestramento utilizzando le risorse di computing che hai specificato in questa sezione.

  2. Al termine del job personalizzato, la pipeline di addestramento trova gli artefatti creati dall'applicazione di addestramento nella directory output/model/ del bucket Cloud Storage. Utilizza questi artefatti per creare una risorsa modello.

Monitorare l'addestramento

Per visualizzare i log di addestramento:

  1. Nella console Google Cloud , nella sezione Vertex AI, vai alla pagina Job personalizzati.

    Vai a Job personalizzati

  2. Per visualizzare i dettagli del CustomJob che hai appena creato, fai clic su hello_custom-custom-job nell'elenco.

  3. Nella pagina dei dettagli del job, fai clic su Visualizza log.

Visualizzare il modello addestrato

Al termine della pipeline di addestramento personalizzato, puoi trovare il modello addestrato nella console Google Cloud , nella sezione Vertex AI, nella pagina Modelli.

Vai a Modelli

Il modello ha il nome hello_custom.

Passaggi successivi

Segui i passaggi descritti nella pagina successiva di questo tutorial per fornire le previsioni del modello ML addestrato.