Utilizzare le prenotazioni con le istanze Vertex AI Workbench
Questo documento spiega come utilizzare le prenotazioni di Compute Engine per avere la certezza che le tue istanze di Vertex AI Workbench dispongano di risorse di macchine virtuali (VM) sufficienti per l'esecuzione.
Le prenotazioni sono una funzionalità di Compute Engine. Ti aiutano ad avere sempre a disposizione le risorse necessarie per creare VM con lo stesso hardware (memoria e vCPU) e le risorse facoltative (GPU e dischi SSD locali) ogni volta che ne hai bisogno.
Quando crei una prenotazione, Compute Engine verifica che la capacità richiesta sia disponibile nella zona specificata. In caso affermativo, Compute Engine prenota le risorse, crea la prenotazione e si verifica quanto segue:
Le risorse prenotate sono immediatamente disponibili per l'utilizzo e rimangono disponibili fino a quando non elimini la prenotazione.
Le risorse prenotate ti vengono addebitate alla stessa tariffa on demand delle VM in esecuzione, inclusi eventuali sconti applicabili, fino all'eliminazione della prenotazione. Durante il consumo di una prenotazione, una VM non genera addebiti duplicati per le risorse poiché il costo delle risorse prenotate viene già fatturato per la prenotazione. Per saperne di più, consulta Prenotazioni di risorse di zona di Compute Engine.
Limitazioni e requisiti
Tutte le limitazioni delle prenotazioni di Compute Engine si applicano quando le istanze Vertex AI Workbench utilizzano le prenotazioni. Consulta Come funzionano le prenotazioni.
Inoltre, quando utilizzi le prenotazioni con le istanze Vertex AI Workbench, si applicano le seguenti limitazioni e requisiti:
La prenotazione deve essere una delle seguenti:
- Nello stesso progetto dell'istanza di Vertex AI Workbench.
- Condiviso con lo stesso progetto dell'istanza di Vertex AI Workbench.
Per utilizzare una prenotazione, le proprietà della VM della prenotazione devono corrispondere esattamente a quelle dell'istanza Vertex AI Workbench. Ad esempio, se una prenotazione specifica un tipo di macchina
e2-standard-8
, l'istanza Vertex AI Workbench può utilizzare la prenotazione solo se utilizza anche un tipo di macchinae2-standard-8
. Consulta i requisiti.
Prima di iniziare
- Esamina i requisiti e le limitazioni per le prenotazioni.
- Esamina i requisiti relativi alle quote e le limitazioni per le prenotazioni condivise.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Compute Admin (
roles/compute.admin
) -
Amministratore di Notebooks (
roles/notebooks.admin
) Nella console Google Cloud , vai alla pagina Istanze.
Fai clic su
Crea nuovo.Nella finestra di dialogo Nuova istanza, fai clic su Opzioni avanzate.
Nella finestra di dialogo Crea istanza, nella sezione Tipo di macchina, seleziona il tipo di macchina e la configurazione GPU corrispondenti alla tua prenotazione.
In Piattaforma CPU e GPU, nel menu Prenotazioni, seleziona la prenotazione da utilizzare.
Fai clic su Crea.
Vertex AI Workbench crea un'istanza e la avvia automaticamente. Quando l'istanza è pronta per l'uso, Vertex AI Workbench attiva un link Apri JupyterLab.
PROJECT_ID
: il tuo ID progettoLOCATION
: la zona in cui si trova l'istanzaINSTANCE_NAME
: il nome dell'istanzaMACHINE_TYPE
: il tipo di macchina dell'istanzaRESERVATION_TYPE
: il tipo di prenotazione; deve essereRESERVATION_ANY
oRESERVATION_SPECIFIC
RESERVATION_NAME
: il nome della prenotazione quando utilizzi il tipoRESERVATION_SPECIFIC
- Per le prenotazioni nello stesso progetto, puoi utilizzare l'ID prenotazione.
- Per le prenotazioni in un progetto diverso, devi utilizzare il percorso completo della prenotazione. Ad esempio:
projects/PROJECT_ID/reservations/RESERVATION_NAME
. Le risorse di Compute Engine, inclusi eventuali sconti per impegno di utilizzo (CUD) applicabili, ai prezzi di Compute Engine. Questi addebiti hanno l'etichetta
goog-vertex-ai-product: workbench-instances
sull'SKU. Consulta la pagina Prezzi di Compute Engine.Tariffe di gestione di Vertex AI Workbench oltre all'utilizzo dell'infrastruttura. Consulta i prezzi di Vertex AI Workbench.
- Per saperne di più sulle prenotazioni di Compute Engine, consulta Prenotazioni di risorse di zona di Compute Engine.
Ruoli obbligatori
Per ottenere le autorizzazioni necessarie per utilizzare le prenotazioni con le istanze Vertex AI Workbench, chiedi all'amministratore di concederti i seguenti ruoli IAM sul progetto:
Per ulteriori informazioni sulla concessione dei ruoli, consulta Gestisci l'accesso a progetti, cartelle e organizzazioni.
Potresti anche riuscire a ottenere le autorizzazioni richieste tramite i ruoli personalizzati o altri ruoli predefiniti.
Crea una prenotazione
Crea una prenotazione Compute Engine. Può trattarsi di una prenotazione per un singolo progetto o di una prenotazione condivisa. La prenotazione può essere on demand o una prenotazione futura. Per saperne di più, vedi Scegliere un tipo di prenotazione.
Utilizzare una prenotazione con una nuova istanza
Per creare un'istanza di Vertex AI Workbench che utilizza una prenotazione, puoi utilizzare la console Google Cloud o l'API REST.
Console
Per creare un'istanza di Vertex AI Workbench che utilizza una prenotazione, esegui le seguenti operazioni:
REST
Prima di utilizzare i dati della richiesta, apporta le seguenti sostituzioni:
Metodo HTTP e URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Corpo JSON della richiesta:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Per inviare la richiesta, scegli una di queste opzioni:
curl
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Salva il corpo della richiesta in un file denominato request.json
,
ed esegui questo comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Per ulteriori informazioni, consulta la documentazione dell'API REST di projects.locations.instances.create
.
Interrompere l'utilizzo della prenotazione
Per interrompere l'utilizzo della prenotazione, puoi eliminarla.
Se vuoi continuare a utilizzare la prenotazione con altre risorse, ma non vuoi che la tua istanza Vertex AI Workbench esistente la utilizzi, devi eliminare l'istanza.
Fatturazione
Quando utilizzi una prenotazione Compute Engine, ti viene addebitato quanto segue:
Risoluzione dei problemi
Per trovare metodi per diagnosticare e risolvere gli errori relativi all'utilizzo delle prenotazioni con le istanze di Vertex AI Workbench, consulta Risoluzione dei problemi relativi alle istanze di Vertex AI Workbench.