Usa reservas con instancias de Vertex AI Workbench
En este documento, se explica cómo usar las reservas de Compute Engine para garantizar que tus instancias de Vertex AI Workbench tengan suficientes recursos de máquina virtual (VM) para ejecutarse.
Las reservas son una función de Compute Engine. Ayudan a garantizar que tengas los recursos disponibles para crear VMs con el mismo hardware (memoria y CPU virtuales) y recursos opcionales (GPUs y discos SSD locales) cuando los necesites.
Cuando creas una reserva, Compute Engine verifica que la capacidad solicitada esté disponible en la zona especificada. Si es así, Compute Engine reserva los recursos, crea la reserva y sucede lo siguiente:
Los recursos reservados estarán disponibles de inmediato para que los uses y permanecerán disponibles hasta que borres la reserva.
Se te cobrará por los recursos reservados con la misma tarifa según demanda que las VMs en ejecución, incluidos los descuentos aplicables, hasta que se borre la reserva. Cuando se consume una reserva, una VM no genera cargos duplicados por los recursos, ya que la reserva ya se factura por el costo de los recursos reservados. Para obtener más información, consulta Reservas de recursos zonales de Compute Engine.
Limitaciones y requisitos
Todas las limitaciones de las reservas de Compute Engine se aplican cuando las instancias de Vertex AI Workbench consumen reservas. Consulta la sección sobre cómo funcionan las reservas.
Además, cuando se usan reservas con instancias de Vertex AI Workbench, se aplican las siguientes limitaciones y requisitos:
Tu reserva debe cumplir con uno de los siguientes requisitos:
- En el mismo proyecto que tu instancia de Vertex AI Workbench
- Se comparte con el mismo proyecto que tu instancia de Vertex AI Workbench.
Para consumir la reserva, las propiedades de la VM de la reserva deben coincidir exactamente con tu instancia de Vertex AI Workbench. Por ejemplo, si una reserva especifica un tipo de máquina
e2-standard-8
, la instancia de Vertex AI Workbench solo puede consumir la reserva si también usa un tipo de máquinae2-standard-8
. Consulta los Requisitos.
Antes de comenzar
- Revisa los requisitos y las y las restricciones para las reservas.
- Revisa los requisitos de cuota y las restricciones para las reservas.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
-
Enable the Compute Engine and Notebooks APIs.
-
Administrador de Compute (
roles/compute.admin
) -
Administrador de notebooks (
roles/notebooks.admin
) PROJECT_ID
: el ID de tu proyectoLOCATION
: La zona en la que se encuentra la instancia.INSTANCE_NAME
: el nombre de tu instanciaMACHINE_TYPE
: el tipo de máquina de la instanciaRESERVATION_TYPE
: Es el tipo de reserva y debe serRESERVATION_ANY
oRESERVATION_SPECIFIC
.RESERVATION_NAME
: Es el nombre de tu reserva cuando usas el tipoRESERVATION_SPECIFIC
.- Para las reservas en el mismo proyecto, puedes usar el ID de reserva.
- Para las reservas en un proyecto diferente, debes usar la ruta de acceso completa de la reserva.
Los recursos de Compute Engine, incluidos los descuentos por compromiso de uso (CUD) aplicables, a los precios de Compute Engine Estos cargos tienen la etiqueta
goog-vertex-ai-product: workbench-instances
en el SKU. Consulta los precios de Compute Engine.Tarifas de administración de Vertex AI Workbench, además del uso de tu infraestructura. Consulta los precios de Vertex AI Workbench.
- Para obtener más información sobre las reservas de Compute Engine, consulta Reservas de recursos zonales de Compute Engine.
Roles obligatorios
Para obtener los permisos que necesitas para usar reservas con instancias de Vertex AI Workbench, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Crea una reserva
Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. Para obtener más información, consulta los siguientes documentos:
La reserva puede incluir aceleradores de GPU.
Usa una reserva con una instancia nueva
Puedes agregar tu reserva cuando crees una nueva instancia de Vertex AI Workbench con la API de REST.
Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
Método HTTP y URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Cuerpo JSON de la solicitud:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Para enviar tu solicitud, elige una de estas opciones:
curl
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Deja de usar tu reserva
Para dejar de usar tu reserva, puedes borrarla.
Si deseas continuar usando tu reserva con otros recursos, pero no quieres que tu instancia existente de Vertex AI Workbench la use, debes borrar la instancia.
Facturación
Cuando consumes una reserva de Compute Engine, se te factura lo siguiente:
Solucionar problemas
Para encontrar métodos para diagnosticar y resolver errores relacionados con el uso de reservas con instancias de Vertex AI Workbench, consulta Soluciona problemas de instancias de Vertex AI Workbench.