Utilizzare le prenotazioni con le istanze Vertex AI Workbench
Questo documento spiega come utilizzare le prenotazioni di Compute Engine per avere la certezza che le istanze Vertex AI Workbench dispongano di risorse di macchine virtuali (VM) sufficienti per l'esecuzione.
Le prenotazioni sono una funzionalità di Compute Engine. Ti aiutano ad assicurarti di avere le risorse disponibili per creare VM con lo stesso hardware (memoria e vCPU) e risorse facoltative (GPU e dischi SSD locali) ogni volta che ne hai bisogno.
Quando crei una prenotazione, Compute Engine verifica che la capacità richiesta sia disponibile nella zona specificata. In questo caso, Compute Engine riserva le risorse, crea la prenotazione e si verifica quanto segue:
Le risorse riservate sono immediatamente disponibili per l'utilizzo e rimangono disponibili finché non elimini la prenotazione.
Le risorse riservate ti vengono addebitate alla stessa tariffa on demand delle VM in esecuzione, inclusi eventuali sconti applicabili, fino all'eliminazione della prenotazione. Quando utilizza una prenotazione, una VM non incorre in addebiti duplicati per le risorse, poiché la prenotazione viene già fatturata per il costo delle risorse prenotate. Per saperne di più, consulta Prenotazioni di risorse di zona di Compute Engine.
Limitazioni e requisiti
Tutte le limitazioni delle prenotazioni Compute Engine si applicano quando le istanze di Vertex AI Workbench utilizzano le prenotazioni. Scopri come funzionano le prenotazioni.
Inoltre, quando utilizzi le prenotazioni con le istanze Vertex AI Workbench, si applicano le seguenti limitazioni e requisiti:
La prenotazione deve essere una delle seguenti:
- Nello stesso progetto dell'istanza di Vertex AI Workbench.
- Condiviso con lo stesso progetto dell'istanza Vertex AI Workbench.
Per utilizzare una prenotazione, le proprietà VM di una prenotazione devono corrispondere esattamente all'istanza Vertex AI Workbench. Ad esempio, se una prenotazione specifica un tipo di macchina
e2-standard-8
, l'istanza Vertex AI Workbench può utilizzare la prenotazione solo se utilizza anche un tipo di macchinae2-standard-8
. Consulta i requisiti.
Prima di iniziare
- Esamina i requisiti e le limitazioni per le prenotazioni.
- Esamina i requisiti relativi alle quote e le limitazioni per le prenotazioni condivise.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
Compute Admin (
roles/compute.admin
) -
Amministratore di Notebooks (
roles/notebooks.admin
) PROJECT_ID
: il tuo ID progettoLOCATION
: la zona in cui si trova l'istanzaINSTANCE_NAME
: il nome dell'istanzaMACHINE_TYPE
: il tipo di macchina dell'istanzaRESERVATION_TYPE
: il tipo di prenotazione; deve essereRESERVATION_ANY
oRESERVATION_SPECIFIC
RESERVATION_NAME
: il nome della prenotazione quando utilizzi il tipoRESERVATION_SPECIFIC
- Per le prenotazioni nello stesso progetto, puoi utilizzare l'ID prenotazione.
- Per le prenotazioni in un progetto diverso, devi utilizzare il percorso completo della prenotazione.
Le risorse di Compute Engine, inclusi eventuali sconti per impegno di utilizzo (CUD) applicabili, ai prezzi di Compute Engine. Questi addebiti hanno l'etichetta
goog-vertex-ai-product: workbench-instances
sull'SKU. Consulta la pagina Prezzi di Compute Engine.Tariffe di gestione di Vertex AI Workbench oltre all'utilizzo dell'infrastruttura. Consulta i prezzi di Vertex AI Workbench.
- Per saperne di più sulle prenotazioni di Compute Engine, consulta Prenotazioni di risorse di zona di Compute Engine.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per utilizzare le prenotazioni con le istanze Vertex AI Workbench, chiedi all'amministratore di concederti i seguenti ruoli IAM nel progetto:
Per saperne di più sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Crea una prenotazione
Crea una prenotazione Compute Engine. Può trattarsi di una prenotazione per un singolo progetto o di una prenotazione condivisa. Per ulteriori informazioni, consulta i seguenti documenti:
La prenotazione può includere acceleratori GPU.
Utilizzare una prenotazione con una nuova istanza
Puoi aggiungere la prenotazione quando crei una nuova istanza Vertex AI Workbench utilizzando l'API REST.
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
Metodo HTTP e URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corpo JSON della richiesta:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
quindi esegui il comando seguente:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Interrompere l'utilizzo della prenotazione
Per interrompere l'utilizzo della prenotazione, puoi eliminarla.
Se vuoi continuare a utilizzare la prenotazione con altre risorse, ma non vuoi che la tua istanza Vertex AI Workbench esistente la utilizzi, devi eliminare l'istanza.
Fatturazione
Quando utilizzi una prenotazione Compute Engine, ti vengono addebitati i seguenti costi:
Risoluzione dei problemi
Per trovare metodi per diagnosticare e risolvere gli errori relativi all'utilizzo delle prenotazioni con le istanze di Vertex AI Workbench, consulta Risoluzione dei problemi relativi alle istanze di Vertex AI Workbench.