Se usó la API de Cloud Translation para traducir esta página.

Modelos de aprovisionamiento de instancias de Compute Engine

Linux Windows

En este documento, se describen los modelos de aprovisionamiento para las instancias de Compute Engine. Si deseas obtener más información sobre las opciones de implementación, consulta Elige una estrategia de implementación de Compute Engine para tu carga de trabajo.

Los modelos de aprovisionamiento determinan la disponibilidad, la vida útil y el precio de tus instancias. Si comprendes estos modelos, puedes elegir la mejor opción para tu carga de trabajo.

Modelos de aprovisionamiento disponibles

Cuando creas una instancia de procesamiento, puedes especificar uno de los siguientes modelos de aprovisionamiento. Si no especificas un modelo de aprovisionamiento, Compute Engine usa el modelo de aprovisionamiento estándar de forma predeterminada.

Estándar
Spot
Inicio flexible
Con reserva

En la siguiente tabla, se comparan los casos de uso y los precios de cada modelo de aprovisionamiento:

	Estándar	Spot	Inicio flexible	Con reserva
Resumen	Según la disponibilidad de recursos, puedes crear instancias de inmediato. Puedes controlar cuándo detener o borrar instancias.	Según la disponibilidad de recursos, puedes crear instancias de inmediato. Puedes controlar cuándo detener o borrar instancias. Sin embargo, también permites que Compute Engine detenga o borre instancias en cualquier momento para recuperar capacidad.	Después de crear un grupo de instancias administrado (MIG) zonal, solicita a Compute Engine que agregue instancias con GPUs conectadas al MIG. Compute Engine programa el aprovisionamiento de las instancias según la disponibilidad de recursos. Puedes controlar cuándo borrar instancias. Sin embargo, no puedes detenerlas, suspenderlas ni volver a crearlas. Las instancias se ejecutan hasta por siete días. Luego, Compute Engine los borra.	Puedes solicitar reservar capacidad en una fecha futura para crear instancias con GPUs conectadas. Si Google Cloud aprueba tu solicitud, Compute Engine creará una reserva. Al inicio del período de reserva, puedes consumir la reserva creando instancias de GPU que coincidan con la reserva. Durante el período de reserva aprobado, puedes detener, reiniciar, borrar y volver a crear instancias para consumir la reserva según sea necesario. Cuando finaliza el período de reserva, Compute Engine borra la reserva y detiene o borra las instancias que la consumen.
Casos de uso	Es ideal para cargas de trabajo que requieren estabilidad y funcionamiento continuo, como las siguientes: Servidores web Bases de datos Aplicaciones empresariales Desarrollo y pruebas	Ideal para cargas de trabajo que pueden tolerar interrupciones, como las siguientes: Procesamiento por lotes Computación de alto rendimiento (HPC) Integración continua e implementación continua (CI/CD) Análisis de datos Codificación de medios Inferencia en línea	Cargas de trabajo que requieren estabilidad y deben ejecutarse durante no más de siete días, como las siguientes: Entrenamiento previo de modelos pequeños Ajuste del modelo Simulación de HPC Inferencia por lotes	Es ideal para cargas de trabajo que requieren estabilidad y un tiempo de ejecución específico, como las siguientes: Para cargas de trabajo que duran hasta 90 días: Trabajos de entrenamiento previo del modelo Trabajos de ajuste de modelos Cargas de trabajo de simulación de HPC Aumentos esperados a corto plazo en las cargas de trabajo de inferencia Para cargas de trabajo de más de 90 días: Cargas de trabajo de entrenamiento Cargas de trabajo de inferencia
Precios	Se te cobrarán los precios estándar por las instancias. Consulta los precios de instancias de VM. Se te cobrará según el método que uses para crear instancias: Si creas instancias de inmediato, pagarás por uso (PAYG). Si creas instancias con una reserva según demanda o una reserva creada automáticamente para una reserva futura, se te cobrará hasta que exista la reserva. Para obtener más información, consulta facturación de reservas.	Obtienes descuentos de entre el 60% y el 91% para la mayoría de las CPU virtuales, la memoria y las GPU. Además, recibirás descuentos más pequeños para cualquier tipo de máquina A4 o A3, y GPU, discos SSD locales, direcciones IP externas y costos de redes de nivel 1. Para obtener más información, consulta los precios de las VMs Spot. Usas PAYG.	Según la serie de máquinas que usan tus instancias, obtienes un descuento de la siguiente manera: En las series de máquinas A4, A3 y A2, obtienes un descuento del 53% en las CPU virtuales, la memoria y las GPUs. En el caso de la serie de máquinas H4D, obtienes un 25% de descuento en las CPU virtuales y la memoria. Otras series de máquinas compatibles no son aptas para descuentos. Para obtener más información, consulta los precios del Programador de cargas de trabajo dinámico (DWS). Usas PAYG.	Se te cobran cargos según la forma en que reservas capacidad para crear instancias, de la siguiente manera: Si reservas capacidad en AI Hypercomputer, se te cobrarán cargos según los precios de las VMs optimizadas para aceleradores. Si reservas recursos durante un año o más, debes comprar y adjuntar un compromiso basado en recursos a los recursos reservados. Si reservas capacidad con reservas futuras en el modo de calendario, se te cobrarán cargos según los precios del programador dinámico de cargas de trabajo (DWS). Se te cobra por el período de reserva. Para obtener más información, consulta facturación de reservas.
Cuota	Cuando creas una instancia, se consume la cuota estándar.	Cuando creas una instancia, se consume la cuota de instancias interrumpibles . Si tu proyecto no tiene una cuota de recursos interrumpibles, se consume la cuota estándar. Los créditos del nivel gratuitoGoogle Cloud no se aplican a las VMs Spot.	Cuando el MIG agrega instancias al grupo, se consume la cuota de instancias interrumpibles. Si tu proyecto no tiene una cuota de recursos interrumpibles, se consumirá la cuota estándar.	La cuota no se aplica al modelo de aprovisionamiento vinculado a la reserva.

Disponibilidad y vida útil de la instancia

En la siguiente tabla, se muestran la disponibilidad y la vida útil de las instancias de procesamiento para cada modelo de aprovisionamiento:

	Estándar	Spot	Inicio flexible	Con reserva
Requisitos previos para la creación	No hay requisitos previos para la creación.	No hay requisitos previos para la creación.	No hay requisitos previos para la creación.	Para crear instancias, primero debes reservar capacidad con uno de los siguientes métodos: Para reservar capacidad para cargas de trabajo de larga duración, usa las reservas futuras en AI Hypercomputer. Para reservar capacidad para cargas de trabajo que se ejecutan hasta por 90 días, usa las reservas futuras en el modo de calendario. En la fecha y hora de entrega que elegiste, Compute Engine aprovisiona la capacidad solicitada. Luego, puedes consumir la capacidad creando instancias.
Serie de máquinas compatible	Puedes usar cualquier serie de máquinas, excepto A4X, A4 y A3 Ultra.	Puedes usar cualquier serie de máquinas, excepto las instancias de A4X, X4 y Bare Metal.	Solo puedes usar las siguientes series de máquinas: Series de máquinas A4, A3, A2 y G2 Instancias de máquina virtual (VM) N1 con GPUs conectadas Serie de máquinas H4D	Según cómo reserves capacidad para crear VMs, solo puedes usar las siguientes series de máquinas: Si reservas capacidad en AI Hypercomputer, solo puedes usar las series de máquinas A4X, A4 y A3 Ultra. Si crea una reserva futura en modo de calendario, solo puede usar las series de máquinas A4 y A3 Ultra.
Disponibilidad de la instancia	Puedes crear instancias en cualquier momento, siempre y cuando los recursos que solicitaste estén disponibles.	Puedes crear instancias en cualquier momento, siempre y cuando los recursos que solicitaste estén disponibles.	Puedes crear instancias de la siguiente manera: Crea una instancia independiente. Crea una solicitud de cambio de tamaño del MIG. Compute Engine usa el DWS para programar el aprovisionamiento de la capacidad solicitada según la disponibilidad de recursos. DWS te ayuda a obtener recursos de alta demanda, como las GPUs.	Solo puedes crear instancias después de reservar capacidad para una fecha futura. En la fecha solicitada, Compute Engine entrega la capacidad que solicitaste, que luego puedes usar para crear instancias. Si reservas recursos con reservas futuras en modo de calendario, Compute Engine usa DWS para aprovisionar la capacidad solicitada. DWS te ayuda a obtener recursos de alta demanda, como las GPUs.
Garantía de capacidad	Según el método de creación La garantía de capacidad varía según el método que uses para crear instancias, de la siguiente manera: Si creas instancias de inmediato, Compute Engine intentará aprovisionar la capacidad solicitada de la mejor manera posible. Si creas instancias consumiendo una reserva según demanda o una reserva creada automáticamente para una reserva futura, tendrás una certeza muy alta de que Compute Engine aprovisionará la capacidad solicitada si la reserva tiene capacidad reservada disponible.	Mejor esfuerzo. Cuando creas VMs Spot, Compute Engine hace todo lo posible para aprovisionar la capacidad que solicitaste.	Mejor esfuerzo. Cuando creas una solicitud de cambio de tamaño de MIG, Compute Engine hace su mejor esfuerzo para programar el aprovisionamiento de la capacidad solicitada.	Muy alta Si Google Cloud aprueba tu solicitud de reserva, tendrás una certeza muy alta de que Compute Engine aprovisionará tu capacidad reservada en la fecha y hora de entrega que elijas. Tienes acceso exclusivo a la capacidad reservada durante el período de reserva.
Vida útil de la instancia	Puedes controlar cuándo detener o borrar una instancia. Sin embargo, si el tipo de máquina que usa la instancia no admite la migración en vivo, Compute Engine detiene la instancia durante los eventos de mantenimiento del host.	Puedes controlar cuándo detener o borrar una instancia, excepto en los siguientes casos: Compute Engine detiene o borra la instancia para recuperar capacidad. Este proceso se denomina preemption. Si el tipo de máquina que usa la instancia no admite la migración en vivo, Compute Engine detiene la instancia durante los eventos de mantenimiento del host.	Antes de que una instancia llegue al final de su duración de ejecución, puedes hacer lo siguiente: Detener la instancia: Puedes detener la instancia en cualquier momento solo si se creó como una instancia independiente. Borra la instancia: Puedes borrar la instancia en cualquier momento. Cuando una instancia alcanza el final de su duración de ejecución, Compute Engine la borra.	Puedes controlar cuándo detener o borrar una instancia, excepto en los siguientes casos: Compute Engine detiene la instancia durante los eventos de mantenimiento del host. La reserva creada automáticamente para aprovisionar la capacidad solicitada llega al final de su período de reserva comprometido. En ese momento, Compute Engine borra la reserva y detiene o borra las instancias que consumen la reserva según la acción de finalización que se especifica en su configuración.

¿Qué sigue?

Lee una descripción general sobre cómo crear instancias de Compute Engine.
Para crear instancias con el modelo de aprovisionamiento Spot, consulta VMs Spot.
Para crear una instancia independiente que use el modelo de aprovisionamiento, consulta Acerca de las VMs de inicio flexible.
Para crear varias instancias con el modelo de aprovisionamiento de inicio flexible, consulta Información sobre las solicitudes de cambio de tamaño en un MIG.
Para reservar capacidad y crear instancias con el modelo vinculado a la reserva, consulta una de las siguientes opciones:
- Acerca de las solicitudes de reserva futuras en el modo de calendario
- Reserva capacidad en la hipercomputadora de IA