Introduzione ai dati di testo: crea un set di dati per la classificazione del testo e importa i documenti

Utilizza la console Vertex AI per creare un set di dati di classificazione del testo. Dopo aver creato il set di dati, utilizza il file CSV che hai copiato nel bucket Cloud Storage per importare i documenti nel set di dati.

Questo tutorial è composto da più pagine:

  1. Configurazione del progetto e dell'ambiente.

  2. Creazione di un set di dati per la classificazione del testo .

  3. Addestramento di un modello di classificazione di testo AutoML.

  4. Esegui il deployment del modello in un endpoint e invia una previsione.

  5. Pulizia del progetto.

Ogni pagina presuppone che tu abbia già eseguito le istruzioni delle pagine precedenti del tutorial.

  1. Vai alla console Vertex AI.

  2. Nella pagina Inizia a utilizzare Vertex AI, fai clic su Crea set di dati.

  3. Specifica i dettagli del set di dati.

    1. Specifica un nome per il set di dati, ad esempio text_classification_tutorial.

    2. Nella sezione Seleziona un tipo di dati e un obiettivo, fai clic su Testo e poi seleziona Classificazione del testo (con etichetta singola).

    3. Per Regione, seleziona us-central1.

      Questo tutorial utilizza us-central1, ma Vertex AI supporta altre regioni, come europe-west4.

    4. Fai clic su Crea per creare il set di dati vuoto e poi importare i documenti.

  4. Nella pagina di importazione, seleziona Seleziona file di importazione da Cloud Storage e specifica la posizione Cloud Storage del file CSV. Suggerimento: fai clic su Sfoglia, seleziona il file happiness.csv nella finestra di dialogo Seleziona oggetto e fai clic su Seleziona.

    Per questo tutorial, il file CSV si trova in: gs://${BUCKET}/text/happiness.csv. Il bucket per questo tutorial si trova nella stessa regione del set di dati, ma puoi specificare file che si trovano in bucket di qualsiasi regione.

  5. Mantieni la suddivisione dei dati Predefinita.

    Vertex AI assegna automaticamente i documenti ai set di addestramento, convalida e test. Per saperne di più, consulta l'articolo Informazioni sulle suddivisioni di dati per i modelli AutoML.

  6. Fai clic su Continua per avviare l'importazione.

    Il processo di importazione richiede alcuni minuti. Al termine dell'importazione, puoi sfogliare tutti i documenti importati e le relative etichette nella scheda Sfoglia del set di dati.

Passaggi successivi

Segui le istruzioni riportate nella pagina successiva di questo tutorial per avviare un job di addestramento del modello AutoML.