Creare un modello di runtime in Colab Enterprise

Questa pagina mostra come creare un modello di runtime in Colab Enterprise.

Per eseguire il codice nel notebook, utilizzi una risorsa di calcolo chiamata runtime. Puoi utilizzare il runtime predefinito o un runtime creato da un modello di runtime. Creando un modello di runtime, puoi configurarlo per ottimizzare le prestazioni, i costi e altre caratteristiche di un runtime in base alle tue esigenze.

Scopri di più su runtime e modelli di runtime.

Prima di iniziare

  1. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  2. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  3. Make sure that billing is enabled for your Google Cloud project.

  4. Enable the Vertex AI, Dataform, and Compute Engine APIs.

    Enable the APIs

  5. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  6. Make sure that billing is enabled for your Google Cloud project.

  7. Enable the Vertex AI, Dataform, and Compute Engine APIs.

    Enable the APIs

  8. Ruoli obbligatori

    Per ottenere le autorizzazioni necessarie per creare un modello di runtime in Colab Enterprise, chiedi all'amministratore di concederti il ruolo IAM Amministratore Colab Enterprise (roles/aiplatform.colabEnterpriseAdmin) nel progetto. Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.

    Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.

    Crea il modello di runtime

    Per creare un modello di runtime, puoi utilizzare la console Google Cloud , Google Cloud CLI, l'API REST o Terraform.

    Console

    Per creare un modello di runtime:

    1. Nella console Google Cloud , vai alla pagina Modelli di runtime di Colab Enterprise.

      Vai a Modelli di runtime

    2. Fai clic su  Nuovo modello.

      Viene visualizzata la finestra di dialogo Crea nuovo modello di runtime.

    Informazioni di base del runtime

    1. Nella sezione Nozioni di base sul runtime, inserisci un Nome visualizzato.

    2. Nel menu Regione, seleziona la regione in cui vuoi il modello di runtime.

    3. (Facoltativo) Aggiungi una Descrizione del modello di runtime.

    4. (Facoltativo) Per aggiungere un'etichetta, fai clic su  Aggiungi etichetta, e poi inserisci una coppia Chiave e Valore. Per aggiungere altre etichette, ripeti questo passaggio.

    5. Fai clic su Continua.

    Configura elaborazione

    1. Nella sezione Configura calcolo, nel menu Tipo di macchina, seleziona un tipo di macchina. Per informazioni sui tipi di macchine, consulta la guida alle risorse e al confronto per le famiglie di macchine.

      Se selezioni un tipo di macchina con GPU, seleziona Tipo di acceleratore e Conteggio acceleratori. Se non riesci a selezionare il numero di GPU che vuoi, potresti dover aumentare la quota. Consulta Richiedi un aggiustamento delle quote.

    2. Nel menu Tipo di disco di dati, seleziona un tipo di disco.

    3. Nel campo Dimensione disco dati, inserisci una dimensione in GB.

    4. Nella sezione Arresto inattivo:

      • Per disattivare l'arresto per inattività, deseleziona Abilita arresto per inattività.

      • Per modificare il periodo di inattività, in Tempo di inattività prima dell'arresto (minuti), modifica il numero con il numero di minuti di inattività che vuoi. Nella console Google Cloud , questa impostazione può essere impostata su qualsiasi valore intero compreso tra 10 e 1440.

    5. Fai clic su Continua.

    Ambiente

    1. Nella sezione Ambiente, seleziona un ambiente. Il valore predefinito è Più recente (attualmente Python 3.11).

    2. Fai clic su Continua.

    Networking e sicurezza

    1. Nella sezione Networking e sicurezza, nel menu Rete, seleziona una rete. Se non selezioni una rete, viene selezionata la rete predefinita.

    2. Nel menu Subnet, seleziona una subnet.

    3. Per disattivare l'accesso a internet pubblico, deseleziona Attiva l'accesso a internet pubblico.

    4. Per disattivare l'accesso alle credenziali dell'utente finale, deseleziona Attiva le credenziali dell'utente finale.

    Completa la creazione del modello di runtime

    Fai clic su Crea per completare la creazione del modello di runtime.

    Il modello di runtime viene visualizzato nell'elenco della scheda Modelli di runtime.

    gcloud

    Prima di utilizzare i dati dei comandi riportati di seguito, effettua le seguenti sostituzioni:

    • DISPLAY_NAME: il nome visualizzato del modello di runtime.
    • PROJECT_ID: il tuo ID progetto.
    • REGION: la regione in cui vuoi il modello di runtime.
    • MACHINE_TYPE: il tipo di macchina da utilizzare per il runtime.
    • ACCELERATOR_TYPE: il tipo di acceleratore hardware da utilizzare per il runtime.
    • ACCELERATOR_COUNT: il numero di acceleratori da utilizzare per il runtime.

    Esegui questo comando:

    Linux, macOS o Cloud Shell

    gcloud colab runtime-templates create --display-name="DISPLAY_NAME" \
        --project=PROJECT_ID \
        --region=REGION \
        --machine-type=MACHINE_TYPE \
        --accelerator-type=ACCELERATOR_TYPE \
        --accelerator-count=ACCELERATOR_COUNT

    Windows (PowerShell)

    gcloud colab runtime-templates create --display-name="DISPLAY_NAME" `
        --project=PROJECT_ID `
        --region=REGION `
        --machine-type=MACHINE_TYPE `
        --accelerator-type=ACCELERATOR_TYPE `
        --accelerator-count=ACCELERATOR_COUNT

    Windows (cmd.exe)

    gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ^
        --project=PROJECT_ID ^
        --region=REGION ^
        --machine-type=MACHINE_TYPE ^
        --accelerator-type=ACCELERATOR_TYPE ^
        --accelerator-count=ACCELERATOR_COUNT

    Per ulteriori informazioni sul comando per creare un modello di runtime dalla riga di comando, consulta la documentazione di gcloud CLI.

    REST

    Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:

    • REGION: la regione in cui vuoi il modello di runtime.
    • PROJECT_ID: il tuo ID progetto.
    • DISPLAY_NAME: il nome visualizzato del modello di runtime.
    • MACHINE_TYPE: il tipo di macchina da utilizzare per il runtime.
    • ACCELERATOR_TYPE: il tipo di acceleratore hardware da utilizzare per il runtime.
    • ACCELERATOR_COUNT: il numero di acceleratori da utilizzare per il runtime.

    Metodo HTTP e URL:

    POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates

    Corpo JSON della richiesta:

    {
      "displayName": "DISPLAY_NAME",
      "machineSpec": {
        {
          "machineType": MACHINE_TYPE
          "acceleratorType": ACCELERATOR_TYPE,
          "acceleratorCount": ACCELERATOR_COUNT,
        }
      },
    }
    

    Per inviare la richiesta, scegli una di queste opzioni:

    curl

    Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates"

    PowerShell

    Salva il corpo della richiesta in un file denominato request.json, quindi esegui il comando seguente:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates" | Select-Object -Expand Content
    In caso di esito positivo, il corpo della risposta contiene un'istanza di Operation.

    Per saperne di più, consulta la documentazione dell'API REST di notebookRuntimeTemplates.create.

    Terraform

    Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base. Per saperne di più, consulta la documentazione di riferimento del provider Terraform.

    Il seguente esempio utilizza la risorsa Terraform google_colab_runtime_template per creare un modello di runtime Vertex AI.

    resource "google_compute_network" "my_network" {
      name = "{{index $.Vars "network_name"}}"
      auto_create_subnetworks = false
    }
    
    resource "google_compute_subnetwork" "my_subnetwork" {
      name   = "{{index $.Vars "network_name"}}"
      network = google_compute_network.my_network.id
      region = "us-central1"
      ip_cidr_range = "10.0.1.0/24"
    }
    
    resource "google_colab_runtime_template" "{{$.PrimaryResourceId}}" {
      name        = "{{index $.Vars "runtime_template_name"}}"
      display_name = "Runtime template full"
      location    = "us-central1"
      description = "Full runtime template"
      machine_spec {
        machine_type     = "n1-standard-2"
        accelerator_type = "NVIDIA_TESLA_T4"
        accelerator_count = "1"
      }
    
      data_persistent_disk_spec {
        disk_type    = "pd-standard"
        disk_size_gb = 200
      }
    
      network_spec {
        enable_internet_access = true
        network = google_compute_network.my_network.id
        subnetwork = google_compute_subnetwork.my_subnetwork.id
      }
    
      labels = {
        k = "val"
      }
    
      idle_shutdown_config {
        idle_timeout = "3600s"
      }
    
      euc_config {
        euc_disabled = false
      }
    
      shielded_vm_config {
        enable_secure_boot = false
      }
    
      network_tags = ["abc", "def"]
    
      encryption_spec {
        kms_key_name = "{{index $.Vars "key_name"}}"
      }
    }
    

    Concessione dell'accesso al modello di runtime

    Dopo aver creato un modello di runtime, devi concedere l'accesso a un principal per poterlo utilizzare. Un principal può creare un runtime da un modello di runtime solo se dispone di quanto segue:

    • Accesso al modello di runtime.
    • Le autorizzazioni necessarie per creare runtime.

    Passaggi successivi