Crea un modello di runtime
Questa pagina mostra come creare un modello di runtime in Colab Enterprise.
Per eseguire il codice nel tuo notebook, utilizzi una risorsa di calcolo chiamata runtime. Puoi utilizzare il runtime predefinito o un runtime creato da un modello di runtime. Creando un modello di runtime, puoi configurarlo per ottimizzare le prestazioni, i costi e altre caratteristiche di un runtime in base alle tue esigenze.
Scopri di più su runtime e modelli di runtime.
Prima di iniziare
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI, Dataform, and Compute Engine APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Make sure that billing is enabled for your Google Cloud project.
-
Enable the Vertex AI, Dataform, and Compute Engine APIs.
-
Nella Google Cloud console, vai alla pagina Modelli di runtime di Colab Enterprise.
-
Fai clic su
Nuovo Modello.Viene visualizzata la finestra di dialogo Crea nuovo modello di runtime.
-
Nella sezione Nozioni di base sul runtime, inserisci un nome visualizzato.
-
Nel menu Regione, seleziona la regione in cui vuoi il modello di runtime.
-
(Facoltativo) Aggiungi una descrizione del modello di runtime.
-
(Facoltativo) Per aggiungere un'etichetta, fai clic su
Aggiungi etichetta, quindi inserisci una coppia Chiave e Valore. Per aggiungere altre etichette, ripeti questo passaggio. -
Fai clic su Continua.
-
Nella sezione Configura l'elaborazione, nel menu Tipo di macchina, seleziona un tipo di macchina. Per informazioni sui tipi di macchine, consulta la guida alle risorse e al confronto per le famiglie di macchine.
Se selezioni un tipo di macchina con GPU, seleziona Tipo di acceleratore e Numero di acceleratori. Se non riesci a selezionare il numero di GPU che ti serve, potrebbe essere necessario aumentare la quota. Consulta Richiedi un aggiustamento delle quote.
-
Nel menu Tipo di disco dati, seleziona un tipo di disco.
-
Nel campo Dimensione del disco dati, inserisci una dimensione in GB.
-
Nella sezione Spegnimento inattivo:
-
Per disattivare l'arresto per inattività, deseleziona Attiva arresto per inattività.
-
Per modificare il periodo di tempo di inattività, in Tempo di inattività prima dell'arresto (minuti), modifica il numero in base al numero di minuti di inattività che preferisci. Nella Google Cloud console, questa impostazione può essere impostata su qualsiasi valore intero compreso tra 10 e 1440.
-
-
Fai clic su Continua.
-
Nella sezione Ambiente, seleziona un Ambiente. Il valore predefinito è Ultimo (attualmente Python 3.11).
-
Fai clic su Continua.
-
Nella sezione Networking e sicurezza, nel menu Rete, seleziona una rete. Se non selezioni una rete, viene selezionata la rete predefinita.
-
Nel menu Subnet, seleziona una subnet.
-
Per disattivare l'accesso a internet pubblico, deseleziona Attiva l'accesso a internet pubblico.
-
Per disattivare l'accesso alle credenziali dell'utente finale, deseleziona Attiva le credenziali dell'utente finale.
DISPLAY_NAME
: il nome visualizzato del modello di runtime.PROJECT_ID
: il tuo ID progetto.REGION
: la regione in cui vuoi il modello di runtime.-
MACHINE_TYPE
: il tipo di macchina da utilizzare per il runtime. ACCELERATOR_TYPE
: il tipo di acceleratore hardware da utilizzare per il runtime.ACCELERATOR_COUNT
: il numero di acceleratori da utilizzare per il tuo runtime.REGION
: la regione in cui vuoi il modello di runtime.PROJECT_ID
: il tuo ID progetto.DISPLAY_NAME
: il nome visualizzato del modello di runtime.-
MACHINE_TYPE
: il tipo di macchina da utilizzare per il runtime. ACCELERATOR_TYPE
: il tipo di acceleratore hardware da utilizzare per il runtime.ACCELERATOR_COUNT
: il numero di acceleratori da utilizzare per il tuo runtime.- Accesso al modello di runtime.
- Le autorizzazioni necessarie per creare ambienti di runtime.
-
Nella Google Cloud console, vai alla pagina Modelli di runtime di Colab Enterprise.
-
Nel menu Regione, seleziona la regione che contiene il modello di runtime.
-
Seleziona il modello di runtime che vuoi eliminare.
-
Fai clic su
Elimina -
Fai clic su Conferma.
- Scopri di più su runtime e modelli di runtime.
- Scopri come creare un runtime in base a un modello di runtime.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per creare un modello di runtime in Colab Enterprise, chiedi all'amministratore di concederti il ruolo IAM Colab Enterprise Admin (roles/aiplatform.colabEnterpriseAdmin
) nel progetto.
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Crea il modello di runtime
Per creare un modello di runtime, puoi utilizzare la Google Cloud console, Google Cloud CLI, l'API REST o Terraform.
Console
Per creare un modello di runtime:
Informazioni di base del runtime
Configura elaborazione
Ambiente
Networking e sicurezza
Completa la creazione del modello di runtime
Fai clic su Crea per completare la creazione del modello di runtime.
Il modello di runtime viene visualizzato nell'elenco della scheda Modelli di runtime.
gcloud
Prima di utilizzare i dati dei comandi riportati di seguito, apporta le seguenti sostituzioni:
Esegui il seguente comando:
Linux, macOS o Cloud Shell
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" \ --project=PROJECT_ID \ --region=REGION \ --machine-type=MACHINE_TYPE \ --accelerator-type=ACCELERATOR_TYPE \ --accelerator-count=ACCELERATOR_COUNT
Windows (PowerShell)
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ` --project=PROJECT_ID ` --region=REGION ` --machine-type=MACHINE_TYPE ` --accelerator-type=ACCELERATOR_TYPE ` --accelerator-count=ACCELERATOR_COUNT
Windows (cmd.exe)
gcloud colab runtime-templates create --display-name="DISPLAY_NAME" ^ --project=PROJECT_ID ^ --region=REGION ^ --machine-type=MACHINE_TYPE ^ --accelerator-type=ACCELERATOR_TYPE ^ --accelerator-count=ACCELERATOR_COUNT
Per ulteriori informazioni sul comando per creare un modello di runtime dalla riga di comando, consulta la documentazione della CLI gcloud.
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
Metodo HTTP e URL:
POST https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates
Corpo JSON della richiesta:
{ "displayName": "DISPLAY_NAME", "machineSpec": { { "machineType": MACHINE_TYPE "acceleratorType": ACCELERATOR_TYPE, "acceleratorCount": ACCELERATOR_COUNT, } }, }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/notebookRuntimeTemplates" | Select-Object -Expand Content
Per ulteriori informazioni, consulta la documentazione dell'API REST notebookRuntimeTemplates.create
.
Terraform
Per scoprire come applicare o rimuovere una configurazione Terraform, consulta Comandi Terraform di base. Per saperne di più, consulta la documentazione di riferimento del fornitore Terraform.
Il seguente esempio utilizza la risorsa Terraform google_colab_runtime_template
per creare un modello di runtime Colab Enterprise.
Concedere l'accesso al modello di runtime
Dopo aver creato un modello di runtime, devi concederne l'accesso perché un principale possa utilizzarlo. Un amministratore può creare un runtime da un modello di runtime solo se dispone di quanto segue:
Vedi Gestire l'accesso a un modello di runtime.
Eliminare un modello di runtime
Per eliminare un modello di runtime:
Risoluzione dei problemi
Questa sezione mostra come risolvere i problemi relativi alla creazione di modelli di runtime in Colab Enterprise.
Impossibile selezionare un numero sufficiente di GPU
Durante la creazione di un modello di runtime, non puoi selezionare il numero di GPU che ti serve. Il motivo potrebbe essere che la quota non è sufficiente.
Colab Enterprise utilizza la quota di Compute Engine per le GPU. Per ulteriori informazioni, consulta la panoramica delle quote e dei limiti di Compute Engine.
Per risolvere il problema, richiedi un aggiustamento della quota.