Usa reservas con instancias de Vertex AI Workbench

En este documento, se explica cómo usar las reservas de Compute Engine para garantizar que tus instancias de Vertex AI Workbench tengan suficientes recursos de máquina virtual (VM) para ejecutarse.

Las reservas son una función de Compute Engine. Ayudan a garantizar que tengas los recursos disponibles para crear VMs con el mismo hardware (memoria y CPU virtuales) y recursos opcionales (GPUs y discos SSD locales) cuando los necesites.

Cuando creas una reserva, Compute Engine verifica que la capacidad solicitada esté disponible en la zona especificada. Si es así, Compute Engine reserva los recursos, crea la reserva y sucede lo siguiente:

  • Los recursos reservados estarán disponibles de inmediato para que los uses y permanecerán disponibles hasta que borres la reserva.

  • Se te cobrará por los recursos reservados con la misma tarifa según demanda que las VMs en ejecución, incluidos los descuentos aplicables, hasta que se borre la reserva. Cuando se consume una reserva, una VM no genera cargos duplicados por los recursos, ya que la reserva ya se factura por el costo de los recursos reservados. Para obtener más información, consulta Reservas de recursos zonales de Compute Engine.

Limitaciones y requisitos

Todas las limitaciones de las reservas de Compute Engine se aplican cuando las instancias de Vertex AI Workbench consumen reservas. Consulta la sección sobre cómo funcionan las reservas.

Además, cuando se usan reservas con instancias de Vertex AI Workbench, se aplican las siguientes limitaciones y requisitos:

  • Tu reserva debe cumplir con uno de los siguientes requisitos:

    • En el mismo proyecto que tu instancia de Vertex AI Workbench
    • Se comparte con el mismo proyecto que tu instancia de Vertex AI Workbench.
  • Para consumir la reserva, las propiedades de la VM de la reserva deben coincidir exactamente con tu instancia de Vertex AI Workbench. Por ejemplo, si una reserva especifica un tipo de máquina e2-standard-8, la instancia de Vertex AI Workbench solo puede consumir la reserva si también usa un tipo de máquina e2-standard-8. Consulta los Requisitos.

Antes de comenzar

  1. Revisa los requisitos y las y las restricciones para las reservas.
  2. Revisa los requisitos de cuota y las restricciones para las reservas.
  3. Sign in to your Google Cloud account. If you're new to Google Cloud, create an account to evaluate how our products perform in real-world scenarios. New customers also get $300 in free credits to run, test, and deploy workloads.
  4. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  5. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  6. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  7. Enable the Compute Engine and Notebooks APIs.

    Enable the APIs

  8. Roles obligatorios

    Para obtener los permisos que necesitas para usar reservas con instancias de Vertex AI Workbench, pídele a tu administrador que te otorgue los siguientes roles de IAM en el proyecto:

    Para obtener más información sobre cómo otorgar roles, consulta Administra el acceso a proyectos, carpetas y organizaciones.

    También puedes obtener los permisos necesarios mediante roles personalizados o cualquier otro rol predefinido.

    Crea una reserva

    Crea una reserva de Compute Engine. Puede ser una reserva de un solo proyecto o una reserva compartida. Para obtener más información, consulta los siguientes documentos:

    La reserva puede incluir aceleradores de GPU.

    Usa una reserva con una instancia nueva

    Puedes agregar tu reserva cuando crees una nueva instancia de Vertex AI Workbench con la API de REST.

    Antes de usar cualquiera de los datos de solicitud a continuación, realiza los siguientes reemplazos:

    • PROJECT_ID: el ID de tu proyecto
    • LOCATION: La zona en la que se encuentra la instancia.
    • INSTANCE_NAME: el nombre de tu instancia
    • MACHINE_TYPE: el tipo de máquina de la instancia
    • RESERVATION_TYPE: Es el tipo de reserva y debe ser RESERVATION_ANY o RESERVATION_SPECIFIC.
    • RESERVATION_NAME: Es el nombre de tu reserva cuando usas el tipo RESERVATION_SPECIFIC.
      • Para las reservas en el mismo proyecto, puedes usar el ID de reserva.
      • Para las reservas en un proyecto diferente, debes usar la ruta de acceso completa de la reserva.

    Método HTTP y URL:

    POST https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME

    Cuerpo JSON de la solicitud:

    {
      "gce_setup": {
        "machine_type": "MACHINE_TYPE",
        "reservation_affinity": {
          "consume_reservation_type": "RESERVATION_TYPE",
          "key": "compute.googleapis.com/reservation-name",
          "values": ["RESERVATION_NAME"]
        }
      }
    }
    

    Para enviar tu solicitud, elige una de estas opciones:

    curl

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    curl -X POST \
    -H "Authorization: Bearer $(gcloud auth print-access-token)" \
    -H "Content-Type: application/json; charset=utf-8" \
    -d @request.json \
    "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME"

    PowerShell

    Guarda el cuerpo de la solicitud en un archivo llamado request.json y ejecuta el siguiente comando:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
    -Method POST `
    -Headers $headers `
    -ContentType: "application/json; charset=utf-8" `
    -InFile request.json `
    -Uri "https://notebooks.googleapis.com/v2/projects/PROJECT_ID/locations/LOCATION/instances?instanceId=INSTANCE_NAME" | Select-Object -Expand Content
    Si se ejecuta correctamente, el cuerpo de la respuesta contiene una instancia de operación.

    Deja de usar tu reserva

    Para dejar de usar tu reserva, puedes borrarla.

    Si deseas continuar usando tu reserva con otros recursos, pero no quieres que tu instancia existente de Vertex AI Workbench la use, debes borrar la instancia.

    Facturación

    Cuando consumes una reserva de Compute Engine, se te factura lo siguiente:

    • Los recursos de Compute Engine, incluidos los descuentos por compromiso de uso (CUD) aplicables, a los precios de Compute Engine Estos cargos tienen la etiqueta goog-vertex-ai-product: workbench-instances en el SKU. Consulta los precios de Compute Engine.

    • Tarifas de administración de Vertex AI Workbench, además del uso de tu infraestructura. Consulta los precios de Vertex AI Workbench.

    Solucionar problemas

    Para encontrar métodos para diagnosticar y resolver errores relacionados con el uso de reservas con instancias de Vertex AI Workbench, consulta Soluciona problemas de instancias de Vertex AI Workbench.

    ¿Qué sigue?