Puedes conectar unidades de procesamiento gráfico (GPU) a tu instancia de máquina virtual (VM) para acelerar cargas de trabajo específicas en Compute Engine.
En este documento, se describen las características y limitaciones de las GPU que se ejecutan en Compute Engine.
GPU y series de máquinas
Las GPU son compatibles con las series de máquinas de uso general N1 y optimizadas para aceleradores (A3, A2 y G2). Para las VMs que usan tipos de máquina N1, debes conectar la GPU a la VM durante la creación de la VM o después. En las VMs que usan los tipos de máquinas A3, A2 o G2, las GPU se conectan de forma automática cuando creas la VM. Las GPU no se pueden usar con otras series de máquinas.
Series de máquinas optimizadas para aceleradores
Cada tipo de máquina optimizada para acelerador tiene un modelo específico de GPU de NVIDIA conectada.
- En los tipos de máquina optimizados para aceleradores A3, se conectan GPU NVIDIA H100 de 80 GB.
- En los tipos de máquinas optimizados para aceleradores A2, se conectan las GPU NVIDIA A100. Están disponibles en las opciones A100 de 40 GB y A100 de 80 GB.
- En los tipos de máquinas optimizados para aceleradores G2, se conectan las GPU NVIDIA L4.
Para obtener más información, consulta Series de máquinas optimizadas para aceleradores.
Series de máquinas de uso general N1
Para todos los demás tipos de GPU, puedes usar la mayoría de los tipos de máquina N1, excepto el núcleo compartido N1.
Para esta serie de máquinas, puedes usar tipos de máquinas predefinidos o personalizados.
GPU en instancias interrumpibles
Puedes agregar GPU a tus instancias de VM interrumpibles a precios interrumpibles para las GPU. Las GPU conectadas a instancias interrumpibles funcionan como las GPU normales, pero persisten solo durante la vida útil de la instancia. Las instancias interrumpibles con GPU siguen el mismo proceso de interrupción que todas las instancias de ese tipo.
Considera solicitar una cuota de Preemptible GPU
dedicada para usar en las GPU en instancias interrumpibles. Si deseas obtener más información, consulta Cuotas para instancias de VM interrumpibles.
Durante los eventos de mantenimiento, las instancias interrumpibles con GPU se interrumpen de forma predeterminada y no se pueden reiniciar automáticamente. Si deseas volver a crear tus instancias después de que hayan sido interrumpidas, usa un grupo de instancias administrado. Los grupos de instancias administrados recrean tus instancias si están disponibles los recursos de CPU virtuales, memoria y GPU.
Si deseas recibir una advertencia antes de que se interrumpa tu instancia, o si deseas configurar tu instancia para que se reinicie automáticamente después de un evento de mantenimiento, usa una instancia estándar con una GPU. Para instancias estándar con GPU, Google proporciona un aviso con una hora de anticipación antes de la interrupción.
Compute Engine no te cobra por las GPU si tus instancias son interrumpibles en el primer minuto después de que comienzan a ejecutarse.
Si deseas conocer los pasos para reiniciar automáticamente una instancia estándar, consulta Actualiza las opciones de una instancia.
Para aprender a crear instancias interrumpibles con GPU conectadas, consulta la sección sobre cómo Crear una VM con GPU conectadas.
GPU y Confidential VMs
No puedes adjuntar GPU a instancias de Confidential VM. Para obtener más información acera de Confidential VMs, consulta Descripción general de Confidential VMs.
GPU y mantenimiento del host
Las VM con GPU conectadas no pueden migrar en vivo y deben detenerse para que se realicen los eventos de mantenimiento del host. Por lo general, estos eventos de mantenimiento ocurren una vez cada dos semanas. Los eventos de mantenimiento también pueden ocurrir con mayor frecuencia cuando sea necesario. Para obtener información sobre cómo controlar los eventos de mantenimiento, consulta Controla eventos de mantenimiento del host de GPU.
GPU y almacenamiento en bloque
Puedes agregar SSD locales a las VMs que tienen GPU conectadas. Para obtener una lista de la compatibilidad con SSD locales según los tipos y regiones de GPU, consulta Disponibilidad de SSD local por regiones y zonas de GPU.
Precios de GPU
La mayoría de las VM con una GPU conectada reciben descuentos por uso continuo de manera similar a las CPU virtuales. Cuando seleccionas una GPU para una estación de trabajo virtual, se agrega una licencia de estación de trabajo virtual de NVIDIA RTX a tu VM.
Para conocer los precios por hora y por mes de las GPU, consulta la página de precios de GPU.
Reserva GPU con descuentos por compromiso de uso
Para reservar recursos de GPU en una zona específica, consulta Reservas de recursos zonales de Compute Engine.
A fin de recibir descuentos por compromiso de uso para GPU en una zona específica, debes comprar compromisos basados en recursos para las GPU y también adjuntar reservas que especifiquen las GPU coincidentes a tus compromisos. Para obtener más información, consulta Adjunta reservas a compromisos basados en recursos.
Restricciones y limitaciones de GPU
Para las VMs que tienen GPU conectadas, se aplican las siguientes restricciones y limitaciones:
Si deseas usar GPU NVIDIA K80 con tus VM, estas no pueden usar Intel Skylake ni plataformas de CPU posteriores.
Actualmente, las GPU solo son compatibles con los tipos de máquinas N1 de uso general o con optimización para aceleradores, A3, A2 y G2.
Para proteger los sistemas y usuarios de Compute Engine, los nuevos proyectos tienen una cuota global de GPU que limita la cantidad total de GPU que puedes crear en cualquier zona compatible. Cuando solicitas una cuota de GPU, debes especificar una cuota de los modelos de GPU que quieres crear en cada región, así como indicar la cuota global con la cantidad total de GPU de los tipos de todas las zonas.
Las VM con una o más GPU tienen una cantidad máxima de CPU virtuales para cada GPU que agregues a la instancia. Por ejemplo, cada GPU NVIDIA K80 te permite tener hasta ocho CPU virtuales y hasta 52 GB de memoria en el tipo de máquina de la instancia. Si deseas ver los rangos de CPU virtuales y memoria disponibles para diferentes configuraciones de GPU, consulta la lista de GPU.
Las GPU requieren controladores de dispositivo para funcionar correctamente. Las GPU de NVIDIA que se ejecutan en Compute Engine deben usar una versión de controlador mínima. Para obtener más información sobre las versiones de controlador, consulta Versiones de controladores NVIDIA necesarias.
Las VM con un modelo de GPU adjunto específico están cubiertas por el ANS de Compute Engine solo si ese modelo de GPU adjunto está en fase de disponibilidad general y se admite en más de una zona de la misma región. El ANS de Compute Engine no cubre los modelos de GPU en las siguientes zonas:
- NVIDIA H100 de 80 GB
us-east5-a
- NVIDIA L4:
europe-west3-b
europe-west6-b
- NVIDIA A100 80 GB:
asia-southeast1-c
us-east4-c
us-east5-b
- NVIDIA A100 40 GB:
us-east1-b
us-west1-b
us-west3-b
us-west4-b
- NVIDIA T4:
europe-west3-b
southamerica-east1-c
us-west3-b
- NVIDIA V100:
asia-east1-c
us-east1-c
- NVIDIA P100:
australia-southeast1-c
europe-west4-a
- NVIDIA K80:
us-west1-b
- NVIDIA H100 de 80 GB
Compute Engine admite la ejecución de un usuario simultáneo por GPU.
Próximos pasos
- Aprende a crear VM con GPU adjuntas.
- Aprende a agregar o quitar GPU.