Introduzione ai dati di testo: configura il progetto e l'ambiente

Se prevedi di utilizzare l'SDK Vertex AI per Python, assicurati che il account di servizio che inizializza il client disponga del ruolo IAM agente di servizio Vertex AI (roles/aiplatform.serviceAgent).

Per questa parte del tutorial, configuri il tuo Google Cloud progetto per utilizzare Vertex AI e un bucket Cloud Storage che contiene i documenti per l'addestramento del modello AutoML.

Questo tutorial è composto da più pagine:

  1. Configurazione del progetto e dell'ambiente.

  2. Creazione di un set di dati di classificazione del testo .

  3. Addestramento di un modello di classificazione di testo AutoML.

  4. Esegui il deployment del modello in un endpoint e invia una previsione.

  5. Pulizia del progetto.

Ogni pagina presuppone che tu abbia già eseguito le istruzioni delle pagine precedenti del tutorial.

Configurazione del progetto e dell'ambiente

Completa i seguenti passaggi prima di utilizzare la funzionalità Vertex AI.

  1. In the Google Cloud console, go to the project selector page.

    Go to project selector

  2. Select or create a Google Cloud project.

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Apri Cloud Shell. Cloud Shell è un ambiente shell interattivo per Google Cloud che ti consente di gestire progetti e risorse dal browser web.
  5. Vai a Cloud Shell
  6. In Cloud Shell, imposta il progetto corrente sul tuo ID progetto Google Cloude archivialo nella variabile di shell projectid:
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    Sostituisci PROJECT_ID con l'ID progetto. Puoi trovare l'ID progetto nella Google Cloud console. Per ulteriori informazioni, vedi Trovare l'ID progetto.
  7. Enable the IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI APIs:

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Grant roles to your user account. Run the following command once for each of the following IAM roles: roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:USER_IDENTIFIER" --role=ROLE
    • Replace PROJECT_ID with your project ID.
    • Replace USER_IDENTIFIER with the identifier for your user account. For example, user:myemail@example.com.

    • Replace ROLE with each individual role.
  9. Il ruolo IAM Utente Vertex AI (roles/aiplatform.user) fornisce l'accesso per utilizzare tutte le risorse in Vertex AI. Il ruolo Amministratore storage (roles/storage.admin) ti consente di archiviare il set di dati di addestramento del documento in Cloud Storage.

    Crea un bucket Cloud Storage e copia il set di dati di esempio

    Crea un bucket Cloud Storage per archiviare i documenti che utilizzi per addestrare il modello AutoML.

    1. Apri Cloud Shell.

    2. Imposta la variabile PROJECT_ID sull'ID del tuo progetto.

      export PROJECT_ID=PROJECT_ID
    3. Imposta la variabile BUCKET, che utilizzi per creare un bucket Cloud Storage.

      export BUCKET=${PROJECT_ID}-lcm
    4. Crea un bucket Cloud Storage nella regione us-central1 con la variabile BUCKET.

      gcloud storage buckets create gs://${BUCKET}/ --project=${PROJECT_ID} --location=us-central1
    5. Copia il set di dati di addestramento di esempio happiness.csv nel tuo bucket.

      gcloud storage cp gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/ --recursive

    Passaggi successivi

    Segui la pagina successiva di questo tutorial per utilizzare la console Vertex AI per creare un set di dati di classificazione del testo e importare i documenti che hai copiato nel bucket Cloud Storage.