Modelos de aprovisionamiento de instancias de Compute Engine


En este documento, se describen los modelos de aprovisionamiento para las instancias de Compute Engine. Si deseas obtener más información sobre las opciones de implementación, consulta Elige una estrategia de implementación de Compute Engine para tu carga de trabajo.

Los modelos de aprovisionamiento determinan la disponibilidad, la vida útil y los precios de tus instancias. Si comprendes estos modelos, puedes elegir la mejor opción para tu carga de trabajo.

Modelos de aprovisionamiento disponibles

Cuando creas una instancia de procesamiento, puedes especificar uno de los siguientes modelos de aprovisionamiento. Si no especificas un modelo de aprovisionamiento, Compute Engine usa el modelo de aprovisionamiento estándar de forma predeterminada.

En la siguiente tabla, se comparan los casos de uso y los precios de cada modelo de aprovisionamiento:

Estándar Spot Flex-start (vista previa) Con reserva
Resumen
  • Según la disponibilidad de recursos, puedes crear instancias de inmediato.
  • Puedes controlar cuándo detener o borrar instancias.
  • Según la disponibilidad de recursos, puedes crear instancias de inmediato.
  • Puedes controlar cuándo detener o borrar instancias. Sin embargo, también permites que Compute Engine detenga o borre instancias en cualquier momento para recuperar capacidad.
  • Después de crear un grupo de instancias administrado (MIG) zonal, solicita a Compute Engine que agregue instancias con GPUs conectadas al MIG. Compute Engine programa el aprovisionamiento de las instancias según la disponibilidad de recursos.
  • Puedes controlar cuándo borrar instancias. Sin embargo, no puedes detenerlas, suspenderlas ni volver a crearlas. Las instancias se ejecutan durante un máximo de siete días. Luego, Compute Engine los borra.
  • Puedes solicitar reservar capacidad en una fecha futura para crear instancias con GPUs conectadas. Si Google Cloud aprueba tu solicitud, Compute Engine creará una reserva. Al inicio del período de reserva, puedes consumir la reserva creando instancias de GPU que coincidan con la reserva.
  • Durante el período de reserva aprobado, puedes detener, reiniciar, borrar y volver a crear instancias para consumir la reserva según sea necesario. Cuando finaliza el período de reserva, Compute Engine borra la reserva y detiene o borra las instancias que la consumen.
Casos de uso Ideal para cargas de trabajo que requieren estabilidad y funcionamiento continuo, como las siguientes:
  • Servidores web
  • Bases de datos
  • Aplicaciones empresariales
  • Desarrollo y pruebas
Ideal para cargas de trabajo que pueden tolerar interrupciones, como las siguientes:
  • Procesamiento por lotes
  • Computación de alto rendimiento (HPC)
  • Integración continua e implementación continua (CI/CD)
  • Análisis de datos
  • Codificación de medios
  • Inferencia en línea
Cargas de trabajo que requieren estabilidad y deben ejecutarse durante no más de siete días, como las siguientes:
  • Entrenamiento previo de modelos pequeños
  • Ajuste del modelo
  • Simulación de HPC
  • Inferencia por lotes
Es ideal para cargas de trabajo que requieren estabilidad y un tiempo de ejecución específico, como las siguientes:
  • Para cargas de trabajo que duran hasta 90 días:
    • Trabajos de entrenamiento previo del modelo
    • Trabajos de ajuste de modelos
    • Cargas de trabajo de simulación de HPC
    • Aumentos esperados a corto plazo en las cargas de trabajo de inferencia
  • Para cargas de trabajo de más de 90 días:
    • Cargas de trabajo de entrenamiento
    • Cargas de trabajo de inferencia
Precios Se te cobrarán los precios estándar por las instancias. Para obtener más información, consulta los precios de instancias de VM. La mayoría de las CPU virtuales, las GPU y los SSD locales están disponibles con un descuento del 60% al 91%. Para obtener más información, consulta los precios de las VMs Spot. Según la familia de máquinas que usen tus instancias, obtendrás hasta un 53% de descuento en las CPU virtuales y las GPU. Consulta los precios del programador dinámico de cargas de trabajo (DWS). Según la familia de máquinas que usen tus instancias, obtendrás hasta un 53% de descuento en las CPU virtuales y las GPU. Además, se generan cargos según cómo reserves capacidad para crear instancias, de la siguiente manera:
Cuota Cuando creas una instancia, se consume la cuota estándar. Cuando creas una instancia, se consume la cuota de instancias interrumpibles . Si tu proyecto no tiene una cuota de recursos interrumpibles, se consumirá la cuota estándar. Los créditos del nivel gratuito no se aplican a las VMs Spot.Google Cloud Cuando el MIG agrega instancias al grupo, se consume la cuota de instancias interrumpibles. Si tu proyecto no tiene una cuota de recursos interrumpibles, se consumirá la cuota estándar. La cuota no se aplica al modelo de aprovisionamiento vinculado a la reserva.

Disponibilidad y vida útil de la instancia

En la siguiente tabla, se muestran la disponibilidad y la vida útil de las instancias de procesamiento para cada modelo de aprovisionamiento:

Estándar Spot Flex-start (vista previa) Con reserva
Requisitos previos para la creación No hay requisitos previos para la creación. No hay requisitos previos para la creación. No hay requisitos previos para la creación.

Para crear instancias, primero debes reservar capacidad con uno de los siguientes métodos:

En la fecha y hora de entrega que elegiste, Compute Engine aprovisiona la capacidad que solicitaste. Luego, puedes consumir la capacidad creando instancias.
Serie de máquinas compatible Puedes usar cualquier serie de máquinas, excepto A4X, A4 y A3 Ultra. Puedes usar cualquier serie de máquinas, excepto las siguientes:
  • M2 y M3
  • Instancias de equipos físicos
Solo puedes usar las siguientes series de máquinas:
Según cómo reserves capacidad para crear VMs, solo puedes usar las siguientes series de máquinas:
Disponibilidad de la instancia Puedes crear instancias en cualquier momento, siempre y cuando los recursos que solicitaste estén disponibles. Puedes crear instancias en cualquier momento, siempre y cuando los recursos que solicitaste estén disponibles. Solo puedes crear instancias si creas solicitudes de cambio de tamaño en un MIG. Compute Engine usa el DWS para programar el aprovisionamiento de la capacidad solicitada según la disponibilidad de recursos. DWS te ayuda a obtener recursos de alta demanda, como las GPUs. Solo puedes crear instancias después de reservar capacidad para una fecha futura. En la fecha solicitada, Compute Engine entrega la capacidad que solicitaste, que luego puedes usar para crear instancias. Si reservas recursos con reservas futuras en modo de calendario, Compute Engine usa DWS para aprovisionar la capacidad solicitada. DWS te ayuda a obtener recursos de alta demanda, como las GPUs.
Vida útil de la instancia Puedes controlar cuándo detener o borrar una instancia, excepto en los siguientes casos:
  • Si el tipo de máquina que usa la instancia no admite la migración en vivo, Compute Engine detiene las instancias durante los eventos de mantenimiento del host.
  • En casos excepcionales, la instancia puede detenerse debido a un error del host.
Puedes controlar cuándo detener o borrar una instancia, excepto en los siguientes casos:
  • Compute Engine puede detener o borrar la instancia en cualquier momento para recuperar capacidad. Este proceso se denomina preemption.
  • Si el tipo de máquina que usa la instancia no admite la migración en vivo, Compute Engine detiene las instancias durante los eventos de mantenimiento del host.
  • En casos excepcionales, la instancia puede detenerse debido a un error del host.
Las instancias aprovisionadas se ejecutan durante el período que elijas, que puede ser de hasta siete días. No puedes detener, suspender ni volver a crear instancias.

Compute Engine borra las instancias cuando sucede uno de los siguientes eventos:
  • Solicitas borrar instancias.
  • Las instancias alcanzan el final de su duración de ejecución.
Puedes controlar cuándo detener o borrar una instancia, excepto en los siguientes casos:
  • Compute Engine detiene la instancia durante los eventos de mantenimiento del host.
  • La reserva creada automáticamente para aprovisionar la capacidad solicitada llega al final de su período de reserva comprometido. En ese momento, Compute Engine borra la reserva y detiene o borra las instancias que la consumen.
  • En casos excepcionales, la instancia puede detenerse debido a un error del host.

¿Qué sigue?