Usa reservas con instancias de Vertex AI Workbench
En este documento, se explica cómo usar las reservas de Compute Engine para tener un alto nivel de certeza de que tus instancias de Vertex AI Workbench tienen suficientes recursos de máquina virtual (VM) para ejecutarse.
Las reservas son una función de Compute Engine. Ayudan a garantizar que tengas los recursos disponibles para crear VMs con el mismo hardware (memoria y CPU virtuales) y recursos opcionales (GPUs y discos SSD locales) cuando los necesites.
Cuando creas una reserva, Compute Engine verifica que la capacidad solicitada esté disponible en la zona especificada. Si es así, Compute Engine reserva los recursos, crea la reserva y sucede lo siguiente:
Los recursos reservados estarán disponibles de inmediato para que los uses y permanecerán disponibles hasta que borres la reserva.
Se te cobrarán los recursos reservados con la misma tarifa según demanda que las VMs en ejecución, incluidos los descuentos aplicables, hasta que se borre la reserva. Cuando se consume una reserva, una VM no genera cargos duplicados por los recursos, ya que la reserva ya se factura por el costo de los recursos reservados. Para obtener más información, consulta Reservas de recursos zonales de Compute Engine.
Limitaciones y requisitos
Todas las limitaciones de las reservas de Compute Engine se aplican cuando las instancias de Vertex AI Workbench consumen reservas. Consulta la sección sobre cómo funcionan las reservas.
Además, cuando se usan reservas con instancias de Vertex AI Workbench, se aplican las siguientes limitaciones y requisitos:
Tu reserva debe cumplir con uno de los siguientes requisitos:
- En el mismo proyecto que tu instancia de Vertex AI Workbench
- Se comparte con el mismo proyecto que tu instancia de Vertex AI Workbench.
Para consumir la reserva, las propiedades de la VM de la reserva deben coincidir exactamente con tu instancia de Vertex AI Workbench. Por ejemplo, si una reserva especifica un tipo de máquina
e2-standard-8
, la instancia de Vertex AI Workbench solo puede consumir la reserva si también usa un tipo de máquinae2-standard-8
. Consulta los Requisitos.
Antes de comenzar
- Revisa los requisitos y las y las restricciones para las reservas.
- Revisa los requisitos de cuota y las restricciones para las reservas.
- Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
-
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
In the Google Cloud console, on the project selector page, select or create a Google Cloud project.
Roles required to select or create a project
- Select a project: Selecting a project doesn't require a specific IAM role—you can select any project that you've been granted a role on.
-
Create a project: To create a project, you need the Project Creator
(
roles/resourcemanager.projectCreator
), which contains theresourcemanager.projects.create
permission. Learn how to grant roles.
-
Enable the Compute Engine and Notebooks APIs.
Roles required to enable APIs
To enable APIs, you need the Service Usage Admin IAM role (
roles/serviceusage.serviceUsageAdmin
), which contains theserviceusage.services.enable
permission. Learn how to grant roles. -
Administrador de Compute (
roles/compute.admin
) -
Administrador de notebooks (
roles/notebooks.admin
) En la consola de Google Cloud , ve a la página Instancias.
Haz clic en
Crear nuevo.En el cuadro de diálogo Instancia nueva, haz clic en Opciones avanzadas.
En el diálogo Crear instancia, en la sección Tipo de máquina, selecciona el tipo de máquina y la configuración de GPU que coincidan con tu reserva.
En Plataforma de CPU y GPU, en el menú Reservations, selecciona la reserva que deseas consumir.
Haz clic en Crear.
Vertex AI Workbench crea una instancia y la inicia de forma automática. Cuando la instancia está lista para usarse, Vertex AI Workbench activa un vínculo Abrir JupyterLab.
PROJECT_ID
: el ID de tu proyectoLOCATION
: La zona en la que se encuentra la instancia.INSTANCE_NAME
: el nombre de tu instanciaMACHINE_TYPE
: el tipo de máquina de la instanciaRESERVATION_TYPE
: Es el tipo de reserva y debe serRESERVATION_ANY
oRESERVATION_SPECIFIC
.RESERVATION_NAME
: Es el nombre de tu reserva cuando usas el tipoRESERVATION_SPECIFIC
.- Para las reservas en el mismo proyecto, puedes usar el ID de reserva.
- Para las reservas en un proyecto diferente, debes usar la ruta de acceso completa de la reserva. Por ejemplo:
projects/PROJECT_ID/reservations/RESERVATION_NAME
. Los recursos de Compute Engine, incluidos los descuentos por compromiso de uso (CUD) aplicables, a los precios de Compute Engine Estos cargos tienen la etiqueta
goog-vertex-ai-product: workbench-instances
en el SKU. Consulta los precios de Compute Engine.Tarifas de administración de Vertex AI Workbench, además del uso de tu infraestructura. Consulta los precios de Vertex AI Workbench.
- Para obtener más información sobre las reservas de Compute Engine, consulta Reservas de recursos zonales de Compute Engine.
Roles requeridos
Para obtener los permisos que necesitas para usar reservas con instancias de Vertex AI Workbench, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:
Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.
También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.
Crea una reserva
Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. La reserva puede ser a pedido o futura. Para obtener más información, consulta Elige un tipo de reserva.
Usa una reserva con una instancia nueva
Para crear una instancia de Vertex AI Workbench que consuma una reserva, puedes usar la Google Cloud consola o la API de REST.
Console
Para crear una instancia de Vertex AI Workbench que consuma una reserva, haz lo siguiente:
REST
Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:
Método HTTP y URL:
POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME
Cuerpo JSON de la solicitud:
{ "gce_setup": { "machine_type": "MACHINE_TYPE", "reservation_affinity": { "consume_reservation_type": "RESERVATION_TYPE", "key": "compute.googleapis.com/reservation-name", "values": ["RESERVATION_NAME"] } } }
Para enviar tu solicitud, elige una de estas opciones:
curl
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
curl -X POST \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json; charset=utf-8" \
-d @request.json \
"https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"
PowerShell
Guarda el cuerpo de la solicitud en un archivo llamado request.json
y ejecuta el siguiente comando:
$cred = gcloud auth print-access-token
$headers = @{ "Authorization" = "Bearer $cred" }
Invoke-WebRequest `
-Method POST `
-Headers $headers `
-ContentType: "application/json; charset=utf-8" `
-InFile request.json `
-Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
Para obtener más información, consulta la documentación de la API de REST de projects.locations.instances.create
.
Deja de usar tu reserva
Para dejar de usar tu reserva, puedes borrarla.
Si deseas continuar usando tu reserva con otros recursos, pero no quieres que tu instancia existente de Vertex AI Workbench la use, debes borrar la instancia.
Facturación
Cuando consumes una reserva de Compute Engine, se te factura lo siguiente:
Solucionar problemas
Para encontrar métodos para diagnosticar y resolver errores relacionados con el uso de reservas con instancias de Vertex AI Workbench, consulta Soluciona problemas de instancias de Vertex AI Workbench.