Para acelerar cargas de trabajo específicas en Compute Engine, puedes implementar una máquina virtual optimizada para acelerador que tenga GPU conectadas o conectar GPU a una máquina virtual N1 de uso general.
Este documento describe las características y limitaciones de las GPU que se ejecutan en Compute Engine.
GPU y series de máquinas
Las GPU son compatibles con la serie de máquinas de uso general N1 y la serie de máquinas optimizadas para acelerador (A4, A3, A2 y G2). Para las máquinas virtuales que usan tipos de máquinas N1, conecte la GPU a la máquina virtual durante o después de la creación de la máquina virtual. Para las máquinas virtuales que utilizan tipos de máquinas optimizadas para acelerador, las GPU se conectan automáticamente cuando crea la máquina virtual. Las GPU no se pueden utilizar con otras series de máquinas.
Serie de máquinas optimizadas para acelerador
Cada tipo de máquina optimizada para acelerador tiene adjunto un modelo específico de GPU NVIDIA.
- Para los tipos de máquinas optimizadas para acelerador A4 , se adjuntan GPU NVIDIA B200.
- Para los tipos de máquinas optimizadas para acelerador A3 , se adjuntan GPU NVIDIA H100 de 80 GB o NVIDIA H200 de 141 GB. Estos están disponibles en las siguientes opciones:
- A3 Ultra : estos tipos de máquinas tienen GPU H200 de 141 GB conectadas
- A3 Mega : estos tipos de máquinas tienen GPU H100 de 80 GB conectadas
- A3 High : estos tipos de máquinas tienen GPU H100 de 80 GB conectadas
- A3 Edge : estos tipos de máquinas tienen GPU H100 de 80 GB conectadas
- Para los tipos de máquinas optimizadas para acelerador A2 , se adjuntan GPU NVIDIA A100. Estos están disponibles en las siguientes opciones:
- A2 Ultra : estos tipos de máquinas tienen GPU A100 de 80 GB conectadas
- Estándar A2 : estos tipos de máquinas tienen GPU A100 de 40 GB conectadas
- Para los tipos de máquinas optimizadas para el acelerador G2 , se adjuntan GPU NVIDIA L4.
Para obtener más información, consulte Serie de máquinas optimizadas para acelerador .
Serie de máquinas de uso general N1
Para todos los demás tipos de GPU, puede utilizar la mayoría de los tipos de máquinas N1, excepto el núcleo compartido N1 ( f1-micro
y g1-small
).
Para esta serie de máquinas, puede utilizar tipos de máquinas predefinidos o personalizados .
GPU en máquinas virtuales puntuales
Puede agregar GPU a sus máquinas virtuales Spot a precios spot más bajos para las GPU. Las GPU conectadas a máquinas virtuales Spot funcionan como GPU normales, pero persisten solo durante la vida útil de la máquina virtual. Las máquinas virtuales de spot con GPU siguen el mismo proceso de preferencia que todas las máquinas virtuales de spot.
Considere la posibilidad de solicitar una cuota Preemptible GPU
dedicada para utilizarla en GPU en máquinas virtuales puntuales. Para obtener más información, consulte Cuotas para máquinas virtuales de spot .
Durante los eventos de mantenimiento, las máquinas virtuales spot con GPU tienen prioridad de forma predeterminada y no se pueden reiniciar automáticamente. Si desea recrear sus máquinas virtuales después de que se hayan apropiado, use un grupo de instancias administrado . Los grupos de instancias administrados recrean sus instancias de VM si los recursos de vCPU, memoria y GPU están disponibles.
Si desea recibir una advertencia antes de que sus máquinas virtuales sean reemplazadas, o desea configurarlas para que se reinicien automáticamente después de un evento de mantenimiento, use máquinas virtuales estándar con una GPU. Para las máquinas virtuales estándar con GPU, Compute Engine proporciona un aviso con una hora de anticipación antes de la preferencia.
Compute Engine no le cobra por las GPU si sus VM se apropian en el primer minuto después de que comienzan a ejecutarse.
Para aprender a crear máquinas virtuales de spot con GPU conectadas, lea Crear una máquina virtual con GPU conectadas y Creación de máquinas virtuales de spot . Por ejemplo, consulte Crear una instancia A3 Ultra o A4 mediante máquinas virtuales puntuales .
GPU en máquinas virtuales con tiempos de ejecución predefinidos
Los recursos para las máquinas virtuales que utilizan el modelo de aprovisionamiento estándar predeterminado (máquinas virtuales estándar) normalmente no pueden utilizar cuotas de asignación preferentes, que están destinadas a cargas de trabajo temporales y, por lo general, están más disponibles. Si su proyecto no tiene una cuota interrumpible y nunca la ha solicitado, todas las máquinas virtuales de ese proyecto consumen cuotas de asignación estándar.
Sin embargo, una vez que solicite una cuota de asignación preferente, las máquinas virtuales estándar que cumplan con todos los criterios siguientes solo podrán consumir una cuota de asignación preferente.
- La VM tiene GPU adjuntas. Puede ser una máquina virtual N1 que tenga GPU conectadas o una máquina virtual optimizada para acelerador .
- La máquina virtual está configurada para eliminarse automáticamente después de un tiempo de ejecución predefinido de 7 días o menos mediante uno de los siguientes métodos:
- Usando el campo
maxRunDuration
o el campoterminationTime
. Para obtener más información, consulte Limitar el tiempo de ejecución de una VM o Limitar el tiempo de ejecución de las VM en un MIG . - Usando el campo
requestedRunDuration
, que solo está disponible para grupos de instancias administrados (MIG). Para obtener más información, consulte Acerca de las solicitudes de cambio de tamaño en un MIG .
- Usando el campo
- La VM no puede consumir reservas. Para obtener más información, consulte Evitar que las instancias informáticas consuman reservas .
Al consumir una cuota de asignación interrumpible para dichas cargas de trabajo, obtiene los beneficios del tiempo de ejecución ininterrumpido de las máquinas virtuales estándar y una mejor capacidad de obtención de la cuota de asignación interrumpible.
Independientemente de la cuota utilizada, las máquinas virtuales estándar no califican para el precio de las máquinas virtuales puntuales y no están sujetas a preferencia.
Para obtener más información, consulte Cuotas preferentes .
GPU y VM confidenciales
No puede conectar GPU a instancias de VM confidenciales. Para obtener más información sobre la VM confidencial, consulte Descripción general de la VM confidencial .
GPU y almacenamiento en bloque
Cuando crea una máquina virtual en una plataforma GPU, puede agregar almacenamiento en bloque temporal o persistente a la máquina virtual. Para almacenar datos no transitorios, utilice almacenamiento en bloque persistente como Hyperdisk ML o Persistent Disk porque los discos son independientes del ciclo de vida de la VM. Los datos del almacenamiento persistente se pueden conservar incluso después de eliminar la VM.
Para almacenamiento temporal temporal o cachés, utilice el almacenamiento temporal en bloque agregando discos SSD locales cuando cree la máquina virtual.
Almacenamiento en bloque persistente con volúmenes de disco persistente e hiperdisco
Puede adjuntar volúmenes de Persistent Disk y Hyperdisk ML con máquinas virtuales habilitadas para GPU.
Para la capacitación en aprendizaje automático y el servicio de cargas de trabajo, Google recomienda utilizar volúmenes de Hyperdisk ML, que ofrecen un alto rendimiento y tiempos de carga de datos más cortos. Esto hace que Hyperdisk ML sea una opción más rentable para cargas de trabajo de ML porque ofrece menores tiempos de inactividad de GPU.
Los volúmenes Hyperdisk ML brindan soporte de conexión múltiple de solo lectura, por lo que puede conectar el mismo disco a varias máquinas virtuales, otorgando a cada máquina virtual acceso a los mismos datos.
Para obtener más información sobre los tipos de discos admitidos para series de máquinas que admiten GPU, consulte las páginas de las series de máquinas optimizadas con acelerador y N1 .
Discos SSD locales
Los discos SSD locales proporcionan almacenamiento temporal rápido para almacenamiento en caché, procesamiento de datos u otros datos transitorios. Los discos SSD locales son de almacenamiento rápido porque están conectados físicamente al servidor que aloja su VM. Son temporales porque los datos se pierden si se reinicia la VM.
No debe almacenar datos con requisitos estrictos de persistencia en discos SSD locales. Para almacenar datos no transitorios, utilice en su lugar almacenamiento persistente .
Si detiene manualmente una VM con una GPU, puede conservar los datos del SSD local, con ciertas restricciones. Consulte la documentación de SSD local para obtener más detalles.
Para obtener soporte regional para SSD local con tipos de GPU, consulte Disponibilidad de SSD local por regiones y zonas de GPU .
GPU y mantenimiento de host
Las máquinas virtuales con GPU conectadas siempre se detienen cuando Compute Engine realiza eventos de mantenimiento en las máquinas virtuales. Si la VM tiene discos SSD locales conectados, los datos del SSD local se pierden después de que la VM se detiene.
Para obtener información sobre cómo manejar eventos de mantenimiento, consulte Manejo de eventos de mantenimiento del host de GPU .
Precios de GPU
La mayoría de las máquinas virtuales con una GPU adjunta reciben descuentos por uso sostenido similares a las vCPU. Cuando selecciona una GPU para una estación de trabajo virtual, se agrega una licencia de estación de trabajo virtual NVIDIA RTX a su VM.
Para conocer los precios por hora y mensual de las GPU, consulte la página de precios de GPU .
Reserva de GPU con descuentos por uso comprometido
Para reservar recursos de GPU en una zona específica, consulta Reservas de recursos zonales de Compute Engine .
Para recibir descuentos por uso comprometido para GPU en una zona específica, debe comprar compromisos basados en recursos para las GPU y también adjuntar reservas que especifiquen GPU coincidentes con sus compromisos. Para obtener más información, consulte Adjuntar reservas a compromisos basados en recursos .
Restricciones y limitaciones de GPU
Para las máquinas virtuales con GPU conectadas, se aplican las siguientes restricciones y limitaciones:
Las GPU solo son compatibles con los tipos de máquinas N1 de uso general o optimizadas para acelerador (A4, A3, A2 y G2).
Para proteger los sistemas y usuarios de Compute Engine, los nuevos proyectos tienen una cuota global de GPU, que limita la cantidad total de GPU que puedes crear en cualquier zona admitida. Cuando solicita una cuota de GPU, debe solicitar una cuota para los modelos de GPU que desea crear en cada región y una cuota global adicional para la cantidad total de GPU de todos los tipos en todas las zonas.
Las máquinas virtuales con una o más GPU tienen una cantidad máxima de vCPU para cada GPU que agregue a la máquina virtual. Para ver los rangos de memoria y vCPU disponibles para diferentes configuraciones de GPU, consulte la lista de GPU .
Las GPU requieren controladores de dispositivo para funcionar correctamente. Las GPU NVIDIA que se ejecutan en Compute Engine deben utilizar una versión mínima del controlador. Para obtener más información sobre las versiones de los controladores, consulte Versiones de controladores NVIDIA necesarias .
Las máquinas virtuales con un modelo de GPU adjunto específico están cubiertas por el SLA de Compute Engine solo si ese modelo de GPU adjunto está disponible de forma general y es compatible con más de una zona en la misma región. Para obtener más información, consulte Regiones y zonas de GPU .
Compute Engine admite la ejecución de 1 usuario simultáneo por GPU.
Consulte también las limitaciones para cada tipo de máquina con GPU conectadas .
¿Qué sigue?
- Aprenda a crear máquinas virtuales con GPU conectadas .
- Aprenda cómo agregar o quitar GPU .