Acerca de las solicitudes de reserva futuras en el modo de calendario


En este documento, se proporciona una descripción general de las solicitudes de reserva futuras en el modo de calendario. Para obtener más información sobre las diferentes formas de reservar recursos en Compute Engine, consulta Cómo elegir un tipo de reserva.

Para obtener capacidad para crear instancias de máquina virtual (VM) que tengan GPU o TPU conectadas, usa solicitudes de reserva futuras en modo de calendario. Si Google Cloudaprueba tu solicitud, Compute Engine aprovisionará los recursos reservados en la fecha y hora que elegiste, y durante el período que seleccionaste. Luego, puedes usar los recursos reservados para crear VMs con GPU o VMs con TPU y ejecutar las siguientes cargas de trabajo:

  • Trabajos de entrenamiento previo del modelo

  • Trabajos de ajuste de modelos

  • Cargas de trabajo de simulación de computación de alto rendimiento (HPC)

  • Aumentos esperados a corto plazo en las cargas de trabajo de inferencia

Cómo crear una solicitud en el modo de calendario

En las siguientes secciones, se explica cómo ver la disponibilidad de los recursos y qué detalles especificar cuando creas una solicitud de reserva futura en el modo de calendario.

Consulta la disponibilidad futura de los recursos

Antes de crear una solicitud de reserva futura en el modo de calendario, puedes ver la disponibilidad futura en una región de los siguientes recursos:

  • En el caso de las VMs con GPU, hasta con 60 días de anticipación

  • En el caso de las TPU, hasta 120 días de anticipación

Compute Engine usa el programador dinámico de cargas de trabajo (DWS) para ver cuándo están disponibles los recursos que solicitaste. Cuando crees una solicitud, especifica la cantidad, el tipo y el período de reserva de los recursos que confirmaste como disponibles. Google Cloud es más probable que apruebe tu solicitud si proporcionas esta información.

Define las propiedades de la solicitud

Cuando creas una solicitud de reserva futura en el modo de calendario, debes especificar las siguientes propiedades:

  • Eliminación automática Esta propiedad determina si Compute Engine borra la reserva creada automáticamente (creada automáticamente) para tu solicitud en la hora de finalización, incluso si la reserva no se consumió por completo. Para crear una solicitud en modo de calendario, debes habilitar la opción de eliminación automática.

  • Tipo de consumo. Esta propiedad define cómo las VMs consumen la reserva creada automáticamente. Cuando creas una solicitud en el modo de calendario, debes especificar que deseas crear reservas orientadas específicamente. Este parámetro de configuración significa que solo las VMs que se dirigen a la reserva pueden consumirla.

  • Tipo de implementación. Esta propiedad define la ubicación de tus recursos reservados. Cuando creas una solicitud en el modo de calendario, debes especificar que se implementen recursos de forma densa. En este tipo de implementación, los recursos se ubican cerca unos de otros para minimizar la latencia de red.

  • Name. Es el nombre de tu solicitud, que debe ser único dentro de tu proyecto.

  • Cantidad de recursos. Es la cantidad de VMs con GPU o TPU que se reservarán en la hora de inicio solicitada.

  • Estado de planificación. Esta propiedad define si envías de inmediato tu solicitud a Google Cloud para su revisión o si la guardas como borrador y la envías más tarde. Cuando creas una solicitud en el modo de calendario, debes especificar que se envíe de inmediato para su revisión.

  • Modo de reserva Esta propiedad define el método para reservar recursos, que debes establecer en CALENDAR para una solicitud en modo de calendario.

  • Nombre de la reserva Nombre de la reserva que Compute Engine crea automáticamente si Google Cloud aprueba tu solicitud.

  • Tipo de uso compartido Esta propiedad define si otros proyectos de tu organización pueden consumir la reserva creada automáticamente para tu solicitud aprobada. Puedes especificar una de las siguientes opciones:

    • Un solo proyecto. Solo tu proyecto puede consumir la capacidad reservada.

    • Compartido Puedes compartir la capacidad reservada con hasta 100 proyectos más de tu organización. Si especificas esta opción, debes especificar los proyectos con los que deseas compartir la reserva creada automáticamente. Si deseas obtener más información, consulta las prácticas recomendadas para las reservas compartidas.

  • Período de reserva Fecha y hora en que Compute Engine aprovisiona la capacidad solicitada y puedes consumirla. El período de reserva incluye lo siguiente:

    • Hora de inicio Es el momento en el que deseas comenzar a consumir la capacidad reservada. Según los recursos que reserves, la hora de inicio debe ser al menos uno de los siguientes valores desde el momento en que creas y envías una solicitud:

      • En el caso de las VMs con GPU, 87 horas (tres días y 15 horas)

      • En el caso de las TPU, 24 horas

    • Hora de finalización Cuando la capacidad solicitada ya no esté reservada para ti. En ese momento, Compute Engine borra la reserva creada automáticamente y detiene o borra las VMs que consumen la reserva según la acción de finalización que especificaste para las VMs.

  • Propiedades de recursos Son los requisitos de hardware de las VMs con GPU o TPU que deseas reservar. Las VMs solo pueden usar una reserva si sus propiedades coinciden con las de la reserva. Para obtener más información, consulta los requisitos para consumir reservas.

  • Tipo de carga de trabajo Si reservas TPU v5e, debes especificar cómo reservar capacidad según tu tipo de carga de trabajo:

    • Por lotes. Para cargas de trabajo que controlan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (AA).

    • Publicación. Para cargas de trabajo que controlan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de ML

  • Zona. Es la zona en la que deseas reservar capacidad.

Proceso de solicitud de revisión

Para reservar capacidad con una solicitud de reserva futura en modo de calendario, debes crear y enviar la solicitud a Google Cloud para su revisión. Después de que creas y envías una solicitud, Google Cloud la revisa en un minuto y, luego, ocurre una de las siguientes situaciones:

  • Google Cloud aprueba tu solicitud: Compute Engine reserva los recursos solicitados y, en el plazo de un minuto después de la aprobación, crea automáticamente una reserva vacía. A la hora de inicio de la solicitud, Compute Engine aprovisiona la capacidad solicitada aumentando la cantidad de TPU en la reserva.

  • Se produce un error. La solicitud falla porque la zona de la solicitud no tiene suficientes recursos. Te recomendamos que vuelvas a consultar la disponibilidad de los recursos futuros y, luego, crees y envíes una nueva solicitud de revisión.

Ciclo de vida de la solicitud

En el siguiente diagrama, se muestran los diferentes estados en los que Compute Engine puede establecer una solicitud de reserva futura en modo de calendario:

Un diagrama de flujo que muestra los diferentes estados por los que puede pasar una solicitud de reserva futura en el modo de calendario.

Los estados y el flujo de eventos que se muestran en el diagrama anterior son los siguientes:

  • PENDING_APPROVAL: Creaste y enviaste una solicitud de revisión. En un minuto, Google Cloud aprueba la solicitud.

  • APPROVED: Google Cloud aprobó tu solicitud. Luego, en un minuto, Compute Engine crea automáticamente una reserva vacía y cambia el estado de la solicitud a PROCURING.

  • PROCURING: Compute Engine programa el aprovisionamiento de tus recursos reservados. Antes de la hora de inicio de la solicitud, el estado de la solicitud cambia a PROVISIONING.

  • PROVISIONING: Compute Engine está aprovisionando tus recursos reservados aumentando la cantidad de TPU reservadas en la reserva creada automáticamente. En el momento de inicio de la solicitud, el estado de la solicitud cambia a FULFILLED.

  • FULFILLED: Compute Engine aprovisionó tus recursos reservados y se te cobra por ellos. Puedes consumir la reserva creada de forma automática creando VMs hasta la hora de finalización de la solicitud.

A la hora de finalización de la solicitud, Compute Engine borra la solicitud y la reserva creada automáticamente. También detiene o borra las VMs que consumen la reserva según la acción de finalización que especificaste para las VMs.

Consume la capacidad aprovisionada

Después de que Google Cloud aprueba una solicitud de reserva futura en modo de calendario, Compute Engine crea automáticamente una reserva con las siguientes características:

  • La reserva creada automáticamente no tiene VMs con GPU o TPU reservadas, por lo que aún no puedes consumirla.

  • La reserva creada automáticamente hereda las propiedades de la VM o la TPU especificadas en tu solicitud.

A la hora de inicio de la solicitud, Compute Engine aprovisiona la capacidad solicitada aumentando la cantidad de VMs con GPU o TPU en la reserva creada automáticamente. Luego, puedes consumir la reserva creando VMs con GPU o VMs con TPU que cumplan con todas las siguientes condiciones:

Puedes crear VMs hasta que se consuma por completo la reserva o hasta la hora de finalización de la solicitud. En la hora de finalización de la solicitud, Compute Engine borra la reserva creada automáticamente y detiene o borra las VMs que consumen la reserva.

Cuota

Las solicitudes de reserva futuras en el modo de calendario deben usar el modelo de aprovisionamiento vinculado a la reserva. Este modelo no requiere cuota de Compute Engine para reservar recursos. Sin embargo, antes de crear una solicitud, verifica que tengas suficiente cuota para los recursos que no forman parte de una reserva cuando creas VMs, como discos o direcciones IP.

Precios

Cuando creas una solicitud de reserva futura en el modo de calendario, no se te cobra. En cambio, se te cobran cargos cuando sucede lo siguiente:

  • Compute Engine aprovisiona la capacidad solicitada. Cuando una solicitud alcanza el estado FULFILLED, se te cobra por los recursos aprovisionados según los precios de DWS. Este modelo de precios ofrece CPU virtuales, GPU y TPU a un precio con descuento.

  • Usas recursos que no están cubiertos por la reserva. Cuando creas VMs que consumen una reserva creada de forma automática, no se te vuelve a cobrar por los recursos consumidos. Solo se te cobrarán los recursos que no formen parte de la reserva, como los discos o las direcciones IP.

Dejarás de acumular cargos en la fecha y hora de finalización de la solicitud. En ese momento, Compute Engine borra la reserva creada automáticamente y detiene o borra las VMs que consumen la reserva.

Limitaciones

En las siguientes secciones, se explican las limitaciones para las solicitudes de reserva futuras en el modo de calendario.

Limitaciones para todas las solicitudes

Todas las solicitudes de reserva futura en el modo de calendario tienen las siguientes limitaciones:

  • Puedes reservar recursos por un período de entre 1 y 90 días.

  • Después de crear y enviar una solicitud, no podrás cancelarla, borrarla ni modificarla.

Limitaciones para las solicitudes de VMs de GPU

Solo puedes reservar VMs de GPU de la siguiente manera:

  • Puedes reservar entre 1 y 80 VMs con GPU por solicitud.

  • Puedes reservar las siguientes series de máquinas:

  • Solo puedes reservar VMs con GPU en zonas específicas.

Limitaciones para las solicitudes de TPU

Solo puedes reservar TPU de la siguiente manera:

  • Puedes reservar 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1,024 chips de TPU por solicitud.

  • Puedes reservar las siguientes versiones de TPU:

  • Solo puedes reservar 1, 4 u 8 chips de TPU v5e para los tipos de cargas de trabajo de procesamiento (SERVING).

  • Solo puedes reservar TPU en las siguientes zonas:

    • Para TPU v6e:

      • asia-northeast1-b

      • us-east5-a

      • us-east5-b

    • Para TPU v5p:

      • us-east5-a
    • Para TPU v5e:

      • Para los tipos de cargas de trabajo por lotes (BATCH): us-west4-b

      • Para los tipos de cargas de trabajo de entrega (SERVING): us-central1-a

Limitaciones para todas las reservas creadas automáticamente

Una reserva creada de forma automática para una solicitud tiene las siguientes limitaciones:

  • Solo puedes modificar la reserva de la siguiente manera:

    • Para permitir o denegar que los trabajos de Vertex AI la consuman.

    • Después de la hora de inicio de la reserva

  • No puedes aplicar descuentos por compromiso de uso (CUD) ni descuentos por uso continuo (SUD) a la reserva.

  • No puedes borrar la reserva. Compute Engine la borra a la hora de finalización de la reserva.

¿Qué sigue?