Esta página se ha traducido con Cloud Translation API.

Modelos de aprovisionamiento de instancias de Compute Engine

Linux Windows

En este documento se describen los modelos de aprovisionamiento de las instancias de Compute Engine. Para obtener más información sobre las opciones de implementación, consulta el artículo Elegir una estrategia de implementación de Compute Engine para una carga de trabajo.

Los modelos de aprovisionamiento determinan la disponibilidad, la vida útil y los precios de tus instancias. Si conoces estos modelos, podrás elegir la mejor opción para tu carga de trabajo.

Modelos de aprovisionamiento disponibles

Cuando creas una instancia de computación, puedes especificar uno de los siguientes modelos de aprovisionamiento. Si no especifica ningún modelo de aprovisionamiento, Compute Engine usará el modelo de aprovisionamiento estándar de forma predeterminada.

Estándar
Spot
Inicio flexible
Con reserva

En la siguiente tabla se comparan los casos prácticos y los precios de cada modelo de aprovisionamiento:

	Estándar	Spot	Inicio flexible	Con reserva
Resumen	En función de la disponibilidad de recursos, puedes crear instancias inmediatamente. Puedes controlar cuándo detener o eliminar instancias.	En función de la disponibilidad de recursos, puedes crear instancias inmediatamente. Puedes controlar cuándo detener o eliminar instancias. Sin embargo, también puedes permitir que Compute Engine detenga o elimine instancias en cualquier momento para recuperar capacidad.	Después de crear un grupo de instancias administradas (MIG) zonal, solicita a Compute Engine que añada instancias con GPUs conectadas al MIG. Compute Engine programa el aprovisionamiento de las instancias en función de la disponibilidad de recursos. Puedes controlar cuándo eliminar las instancias. Sin embargo, no puedes detenerlas, suspenderlas ni volver a crearlas. Las instancias se ejecutan durante un máximo de siete días. A continuación, Compute Engine los elimina.	Puedes solicitar reservar capacidad en una fecha futura para crear instancias con GPUs conectadas. Si Google Cloud aprueba tu solicitud, Compute Engine creará una reserva. Al inicio del periodo de reserva, puedes consumir la reserva creando instancias de GPU que coincidan con ella. Durante el periodo de reserva aprobado, puedes detener, reiniciar, eliminar y volver a crear instancias para consumir la reserva según sea necesario. Cuando finaliza el periodo de reserva, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen.
Casos prácticos	Es ideal para cargas de trabajo que requieren estabilidad y un funcionamiento continuo, como las siguientes: Servidores web Bases de datos Aplicaciones empresariales Desarrollo y pruebas	Ideal para cargas de trabajo que pueden tolerar interrupciones, como las siguientes: Procesamiento por lotes Computación de alto rendimiento (HPC) Integración y despliegue continuos (CI/CD) Analíticas de datos Codificación de contenido multimedia Inferencia online	Cargas de trabajo que requieran estabilidad y que no deban ejecutarse durante más de siete días, como las siguientes: Pre-entrenamiento de modelos pequeños Ajuste fino del modelo Simulación de HPC Inferencia por lotes	Es ideal para cargas de trabajo que requieren estabilidad y un tiempo de ejecución específico, como las siguientes: Para cargas de trabajo que duren hasta 90 días: Tareas de pre-entrenamiento de modelos Tareas de ajuste fino de modelos Cargas de trabajo de simulación de HPC Aumentos previstos a corto plazo en las cargas de trabajo de inferencia Para cargas de trabajo de más de 90 días: Cargas de trabajo de entrenamiento Cargas de trabajo de inferencia
Precios	Se te aplican las tarifas estándar de las instancias. Consulta los precios de las instancias de máquinas virtuales. Se te cobrará en función del método que utilices para crear instancias: Si creas instancias inmediatamente, pagarás por uso. Si creas instancias mediante una reserva bajo demanda o una reserva creada automáticamente para una reserva futura, se te cobrará hasta que la reserva deje de estar activa. Para obtener más información, consulta el artículo sobre la facturación de las reservas.	Obtienes descuentos de entre el 60% y el 91% en la mayoría de las vCPUs, la memoria y las GPUs. Además, obtendrá descuentos menores en los tipos de máquina y las GPUs A4 o A3, los discos SSD locales, las direcciones IP externas y los costes de red de Tier_1. Para obtener más información, consulta los precios de las VMs de acceso puntual. Tú pagas según tus ingresos.	En función de la serie de máquinas que usen tus instancias, obtendrás un descuento de la siguiente manera: En el caso de las series de máquinas A4, A3 y A2, obtienes un descuento del 53% en las vCPUs, la memoria y las GPUs. En el caso de la serie de máquinas H4D, obtienes un descuento del 25% en las vCPUs y la memoria. Otras series de máquinas compatibles no cumplen los requisitos para recibir descuentos. Para obtener más información, consulta los precios de Dynamic Workload Scheduler (DWS). Tú pagas según tus ingresos.	Los cargos se aplican en función de cómo reserves capacidad para crear instancias, de la siguiente manera: Si reservas capacidad en AI Hypercomputer, se te cobrará en función de los precios de las máquinas virtuales optimizadas para aceleradores. Si reservas recursos durante un año o más, debes comprar y adjuntar un compromiso basado en recursos a los recursos reservados. Si reservas capacidad mediante reservas futuras en el modo calendario, se te aplican cargos según los precios de Dynamic Workload Scheduler (DWS). Se te cobra por el periodo de reserva. Para obtener más información, consulta el artículo sobre la facturación de reservas.
Cuota	Cuando creas una instancia, se consume la cuota estándar.	Cuando creas una instancia, se consume la cuota de instancias interrumpibles . Si tu proyecto no tiene cuota interrumpible, se consumirá la cuota estándar. Los Google Cloud créditos del nivel gratuito no se aplican a las máquinas virtuales de Spot.	Cuando el MIG añade instancias al grupo, se consume la cuota de instancias no garantizadas. Si tu proyecto no tiene cuota interrumpible, se consumirá la cuota estándar.	La cuota no se aplica al modelo de aprovisionamiento vinculado a reservas.

Disponibilidad y tiempo de vida de las instancias

En la siguiente tabla se muestra la disponibilidad y la duración de las instancias de proceso de cada modelo de aprovisionamiento:

	Estándar	Spot	Inicio flexible	Con reserva
Requisitos previos para la creación	No hay requisitos previos para crearla.	No hay requisitos previos para crearla.	No hay requisitos previos para crearla.	Para crear instancias, primero debes reservar capacidad mediante uno de los siguientes métodos: Para reservar capacidad para cargas de trabajo de larga duración, usa las reservas futuras de AI Hypercomputer. Para reservar capacidad para cargas de trabajo que se ejecuten durante un máximo de 90 días, usa las reservas futuras en el modo Calendario. En la fecha y hora de entrega que hayas elegido, Compute Engine proporcionará la capacidad que hayas solicitado. Después, puedes consumir la capacidad creando instancias.
Series de máquinas admitidas	Puedes usar cualquier serie de máquinas, excepto A4X, A4 y A3 Ultra.	Puedes usar cualquier serie de máquinas, excepto A4X, X4 y las instancias de hardware desnudo.	Solo puedes usar las siguientes series de máquinas: Series de máquinas A4, A3, A2 y G2 Instancias de máquina virtual (VM) N1 con GPUs conectadas Serie de máquinas H4D	En función de cómo reserves capacidad para crear VMs, solo podrás usar las siguientes series de máquinas: Si reservas capacidad en Hiperordenador con IA, solo podrás usar las series de máquinas A4X, A4 y A3 Ultra. Si crea una reserva futura en el modo Calendario, solo podrá usar las series de máquinas A4 y A3 Ultra.
Disponibilidad de la instancia	Puedes crear instancias en cualquier momento, siempre que los recursos que solicites estén disponibles.	Puedes crear instancias en cualquier momento, siempre que los recursos que solicites estén disponibles.	Puedes crear instancias de la siguiente forma: Crea una instancia independiente. Crea una solicitud de cambio de tamaño de MIG. Compute Engine usa DWS para programar el aprovisionamiento de la capacidad solicitada en función de la disponibilidad de los recursos. DWS te ayuda a obtener recursos de alta demanda, como GPUs.	Solo puedes crear instancias después de reservar capacidad para una fecha futura. En la fecha solicitada, Compute Engine te proporciona la capacidad que has pedido, que puedes usar para crear instancias. Si reservas recursos mediante reservas futuras en modo de calendario, Compute Engine usará DWS para aprovisionar la capacidad solicitada. DWS te ayuda a obtener recursos de alta demanda, como GPUs.
Garantía de capacidad	Según el método de creación. La garantía de capacidad varía en función del método que utilices para crear instancias, como se indica a continuación: Si creas instancias inmediatamente, Compute Engine hará todo lo posible para aprovisionar la capacidad solicitada. Si creas instancias consumiendo una reserva bajo demanda o una reserva creada automáticamente para una reserva futura, tendrás muchas garantías de que Compute Engine aprovisionará la capacidad solicitada si la reserva tiene capacidad reservada disponible.	Con el mejor esfuerzo. Cuando creas máquinas virtuales de acceso puntual, Compute Engine hace todo lo posible para aprovisionar la capacidad que has solicitado.	Con el mejor esfuerzo. Cuando creas una solicitud para cambiar el tamaño de un MIG, Compute Engine hace todo lo posible para programar el aprovisionamiento de la capacidad solicitada.	Muy alto. Si Google Cloud aprueba tu solicitud de reserva, tendrás muchas garantías de que Compute Engine aprovisionará la capacidad reservada en la fecha y hora de entrega que hayas elegido. Tienes acceso exclusivo a la capacidad que has reservado durante el periodo de reserva.
Tiempo de vida de la instancia	Puedes controlar cuándo detener o eliminar una instancia. Sin embargo, si el tipo de máquina que usa la instancia no admite la migración en tiempo real, Compute Engine detendrá la instancia durante los eventos de mantenimiento del host.	Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos: Compute Engine detiene o elimina la instancia para recuperar capacidad. Este proceso se denomina prelación. Si el tipo de máquina que usa la instancia no admite la migración en tiempo real, Compute Engine detiene la instancia durante los eventos de mantenimiento del host.	Antes de que una instancia llegue al final de su duración, puedes hacer lo siguiente: Detener la instancia: puedes detener la instancia en cualquier momento solo si se ha creado como una instancia independiente. Eliminar la instancia: puedes eliminar la instancia en cualquier momento. Cuando una instancia llega al final de su duración, Compute Engine la elimina.	Puedes controlar cuándo detener o eliminar una instancia, excepto en los siguientes casos: Compute Engine detiene la instancia durante los eventos de mantenimiento del host. La reserva creada automáticamente para aprovisionar la capacidad solicitada llega al final de su periodo de reserva comprometida. En ese momento, Compute Engine elimina la reserva y detiene o elimina las instancias que la consumen en función de la acción de finalización especificada en su configuración.

Siguientes pasos

Consulta una descripción general sobre cómo crear instancias de Compute Engine.
Para crear instancias mediante el modelo de aprovisionamiento de Spot, consulta Máquinas virtuales de Spot.
Para crear una instancia independiente que use el modelo de aprovisionamiento, consulta Información sobre las VMs de inicio flexible.
Para crear varias instancias mediante el modelo de aprovisionamiento flex-start, consulta Acerca de las solicitudes de cambio de tamaño en un MIG.
Para reservar capacidad para crear instancias mediante el modelo de reserva, consulta una de las siguientes opciones:
- Acerca de las solicitudes de reserva futuras en el modo Calendario
- Capacidad de reserva en AI Hypercomputer