Modelos de aprovisionamiento de instancias de Compute Engine


En este documento se describen los modelos de aprovisionamiento de las instancias de Compute Engine. Para obtener más información sobre las opciones de implementación, consulta el artículo Elegir una estrategia de implementación de Compute Engine para una carga de trabajo.

Los modelos de aprovisionamiento determinan la disponibilidad, la vida útil y los precios de tus instancias. Si conoces estos modelos, podrás elegir la mejor opción para tu carga de trabajo.

Modelos de aprovisionamiento disponibles

Cuando creas una instancia de computación, puedes especificar uno de los siguientes modelos de aprovisionamiento. Si no especifica ningún modelo de aprovisionamiento, Compute Engine usará el modelo de aprovisionamiento estándar de forma predeterminada.

En la siguiente tabla se comparan los casos prácticos y los precios de cada modelo de aprovisionamiento:

Estándar Spot Inicio flexible (vista previa) Con reserva
Resumen
  • En función de la disponibilidad de recursos, puedes crear instancias inmediatamente.
  • Puedes controlar cuándo detener o eliminar instancias.
  • En función de la disponibilidad de recursos, puedes crear instancias inmediatamente.
  • Puedes controlar cuándo detener o eliminar instancias. Sin embargo, también puedes permitir que Compute Engine detenga o elimine instancias en cualquier momento para recuperar capacidad.
  • Después de crear un grupo de instancias administradas (MIG) zonal, solicita a Compute Engine que añada instancias con GPUs conectadas al MIG. Compute Engine programa el aprovisionamiento de las instancias en función de la disponibilidad de recursos.
  • Puedes controlar cuándo eliminar las instancias. Sin embargo, no puedes detenerlas, suspenderlas ni volver a crearlas. Las instancias se ejecutan durante un máximo de siete días. A continuación, Compute Engine los elimina.
  • Puedes solicitar reservar capacidad en una fecha futura para crear instancias con GPUs conectadas. Si Google Cloud aprueba tu solicitud, Compute Engine creará una reserva. Al inicio del periodo de reserva, puedes consumir la reserva creando instancias de GPU que coincidan con ella.
  • Durante el periodo de reserva aprobado, puedes detener, reiniciar, eliminar y volver a crear instancias para consumir la reserva según sea necesario. Cuando finaliza el periodo de reserva, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen.
Casos prácticos

Es ideal para cargas de trabajo que requieren estabilidad y un funcionamiento continuo, como las siguientes:

  • Servidores web
  • Bases de datos
  • Aplicaciones empresariales
  • Desarrollo y pruebas

Ideal para cargas de trabajo que pueden tolerar interrupciones, como las siguientes:

  • Procesamiento por lotes
  • Computación de alto rendimiento (HPC)
  • Integración y despliegue continuos (CI/CD)
  • Analíticas de datos
  • Codificación de contenido multimedia
  • Inferencia online

Cargas de trabajo que requieran estabilidad y que no deban ejecutarse durante más de siete días, como las siguientes:

  • Entrenamiento previo de modelos pequeños
  • Ajuste fino del modelo
  • Simulación de HPC
  • Inferencia por lotes

Es ideal para cargas de trabajo que requieren estabilidad y un tiempo de ejecución específico, como las siguientes:

  • Para cargas de trabajo que duren hasta 90 días:

    • Tareas de entrenamiento previo de modelos
    • Tareas de ajuste fino de modelos
    • Cargas de trabajo de simulación de HPC
    • Aumentos previstos a corto plazo en las cargas de trabajo de inferencia
  • Para cargas de trabajo de más de 90 días:

    • Cargas de trabajo de entrenamiento
    • Cargas de trabajo de inferencia
Precios Se te aplicarán las tarifas estándar de las instancias. Para obtener más información, consulta los precios de las instancias de máquinas virtuales. La mayoría de las vCPUs, las GPUs y los SSDs locales están disponibles con un descuento del 60-91 %. Para obtener más información, consulta los precios de las VMs de acceso puntual. En función de la familia de máquinas que usen tus instancias, puedes obtener hasta un 53% de descuento en vCPUs y GPUs. Consulta los precios de Dynamic Workload Scheduler (DWS).

En función de la familia de máquinas que usen tus instancias, puedes obtener hasta un 53% de descuento en vCPUs y GPUs. Además, se te aplican cargos en función de cómo reserves capacidad para crear instancias, tal como se indica a continuación:

Cuota Cuando creas una instancia, se consume la cuota estándar. Cuando creas una instancia, se consume la cuota de instancias no garantizadas . Si tu proyecto no tiene cuota interrumpible, se consumirá la cuota estándar. Los Google Cloud créditos del nivel gratuito no se aplican a las máquinas virtuales de Spot. Cuando el MIG añade instancias al grupo, se consume la cuota de instancias no garantizadas. Si tu proyecto no tiene cuota interrumpible, se consumirá la cuota estándar. La cuota no se aplica al modelo de aprovisionamiento vinculado a reservas.

Disponibilidad y tiempo de vida de las instancias

En la siguiente tabla se muestra la disponibilidad y la duración de las instancias de computación de cada modelo de aprovisionamiento:

Estándar Spot Inicio flexible (vista previa) Con reserva
Requisitos previos para la creación No hay requisitos previos para crearla. No hay requisitos previos para crearla. No hay requisitos previos para crearla.

Para crear instancias, primero debes reservar capacidad mediante uno de los siguientes métodos:

En la fecha y hora de entrega que hayas elegido, Compute Engine proporcionará la capacidad que hayas solicitado. Después, puedes consumir la capacidad creando instancias.

Series de máquinas admitidas Puedes usar cualquier serie de máquinas, excepto A4X, A4 y A3 Ultra. Puedes usar cualquier serie de máquinas, excepto A4X, G4, X4 y las instancias de hardware desnudo.

Solo puedes usar las siguientes series de máquinas:

En función de cómo reserves capacidad para crear VMs, solo podrás usar las siguientes series de máquinas:

Disponibilidad de la instancia Puedes crear instancias en cualquier momento, siempre que los recursos que solicites estén disponibles. Puedes crear instancias en cualquier momento, siempre que los recursos que solicites estén disponibles. Solo puedes crear instancias creando solicitudes de cambio de tamaño en un MIG. Compute Engine usa DWS para programar el aprovisionamiento de la capacidad solicitada en función de la disponibilidad de los recursos. DWS te ayuda a obtener recursos de alta demanda, como GPUs. Solo puedes crear instancias después de reservar capacidad para una fecha futura. En la fecha solicitada, Compute Engine te proporciona la capacidad que has pedido, que puedes usar para crear instancias. Si reservas recursos mediante reservas futuras en modo de calendario, Compute Engine usará DWS para aprovisionar la capacidad solicitada. DWS te ayuda a obtener recursos de alta demanda, como GPUs.
Garantía de capacidad Según el método de creación. La garantía de capacidad varía en función del método que utilices para crear instancias, como se indica a continuación:
  • Si creas instancias inmediatamente, Compute Engine hará todo lo posible para aprovisionar la capacidad solicitada.
  • Si creas instancias consumiendo una reserva bajo demanda o una reserva creada automáticamente para una reserva futura, tendrás muchas garantías de que Compute Engine aprovisionará la capacidad solicitada si la reserva tiene capacidad reservada disponible.
Con el mejor esfuerzo. Cuando creas máquinas virtuales de acceso puntual, Compute Engine hace todo lo posible para aprovisionar la capacidad que has solicitado. Con el mejor esfuerzo. Cuando creas una solicitud para cambiar el tamaño de un MIG, Compute Engine hace todo lo posible para programar el aprovisionamiento de la capacidad solicitada. Muy alto. Si Google Cloud aprueba tu solicitud de reserva, tendrás muchas garantías de que Compute Engine aprovisionará la capacidad reservada en la fecha y hora de entrega que hayas elegido. Tienes acceso exclusivo a la capacidad que has reservado durante el periodo de reserva.
Tiempo de vida de la instancia

Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos:

  • Si el tipo de máquina que usa la instancia no admite la migración en tiempo real, Compute Engine detendrá las instancias durante los eventos de mantenimiento del host.
  • En casos excepcionales, la instancia puede detenerse debido a un error del host.

Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos:

  • Compute Engine puede detener o eliminar la instancia en cualquier momento para recuperar capacidad. Este proceso se denomina prelación.
  • Si el tipo de máquina que usa la instancia no admite la migración en tiempo real, Compute Engine detendrá las instancias durante los eventos de mantenimiento del host.
  • En casos excepcionales, la instancia puede detenerse debido a un error del host.

Las instancias aprovisionadas se ejecutan durante el tiempo que elijas, que puede ser de hasta siete días. No puedes detener, suspender ni volver a crear instancias.

Compute Engine elimina las instancias cuando ocurre una de las siguientes situaciones:

  • Solicitas eliminar instancias.
  • Las instancias alcanzan el final de su duración.

Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos:

  • Compute Engine detiene tu instancia durante los eventos de mantenimiento del host.
  • La reserva creada automáticamente para aprovisionar la capacidad solicitada llega al final de su periodo de reserva comprometida. En ese momento, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen.
  • En casos excepcionales, la instancia puede detenerse debido a un error del host.

Siguientes pasos