Añadir o quitar GPUs


Compute Engine ofrece unidades de procesamiento gráfico (GPUs) que puedes añadir a tus instancias de máquina virtual. Puedes usar estas GPUs para acelerar cargas de trabajo específicas en tus VMs, como las de aprendizaje automático y procesamiento de datos.

Solo puedes usar dos familias de máquinas al ejecutar GPUs en Compute Engine:

  • La familia de máquinas optimizadas para aceleradores. Todos los tipos de máquinas optimizadas para aceleradores tienen GPUs conectadas.
  • La familia de máquinas de uso general N1. Puedes usar la mayoría de los tipos de máquinas N1, excepto los de núcleo compartido. Si no usas una máquina de uso general N1, puedes cambiar a una máquina de uso general N1 y, a continuación, añadir las GPUs.

Antes de empezar

  • Para consultar otros pasos previos, como seleccionar una imagen del SO y comprobar la cuota de GPU, consulta el documento de descripción general.
  • Si aún no lo has hecho, configura la autenticación. La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.

      Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:

      gcloud init

      Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.

    Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre autenticación de Google Cloud .

Máquinas virtuales optimizadas para aceleradores

Cada tipo de máquina optimizada para aceleradores tiene un modelo específico de GPU NVIDIA conectada. Si tienes cargas de trabajo que utilizan un gran número de gráficos, como la visualización en 3D, también puedes crear estaciones de trabajo virtuales que usen estaciones de trabajo virtuales (vWS) NVIDIA RTX. La estación de trabajo virtual NVIDIA RTX está disponible para algunos modelos de GPU.

Tipo de máquina Modelo de GPU Modelo de estación de trabajo virtual (vWS) NVIDIA RTX
A4X Superchips NVIDIA GB200 Grace Blackwell (nvidia-gb200).

Cada Superchip contiene cuatro GPUs NVIDIA B200 Blackwell.

A4 GPUs NVIDIA B200 Blackwell (nvidia-b200)
A3 Ultra GPUs NVIDIA H200 SXM (nvidia-h200-141gb)
A3 Mega GPUs NVIDIA H100 SXM (nvidia-h100-mega-80gb)
A3 High, A3 Edge GPUs NVIDIA H100 SXM (nvidia-h100-80gb)
A2 Ultra GPUs NVIDIA A100 de 80 GB (nvidia-a100-80gb)
A2 Standard GPUs NVIDIA A100 de 40 GB (nvidia-a100-40gb)
G4 (Vista previa) NVIDIA RTX PRO 6000 Blackwell Server Edition (nvidia-rtx-pro-6000)
G2 GPUs NVIDIA L4 (nvidia-l4) GPUs de estaciones de trabajo virtuales con NVIDIA L4 (nvidia-l4-vws)

Puede modificar cada máquina virtual optimizada para aceleradores de la siguiente manera:

  • En las VMs A4X, A4, A3 y A2 Ultra, no puedes modificar el tipo de máquina. Si utilizas alguno de estos tipos de máquinas en tu VM y necesitas cambiarlo, crea una VM.

  • En las VMs A2 estándar, puedes modificar el número de GPUs cambiando de un tipo de máquina A2 estándar a otro.

  • En las VMs de G2, puedes hacer lo siguiente:

    • Puedes modificar el número de GPUs cambiando de un tipo de máquina G2 a otro.
    • Puedes cambiar de un tipo de máquina G2 a un tipo de máquina de otra familia, como de uso general o optimizada para la computación. Consulta Editar el tipo de máquina de una VM.
  • No puedes quitar GPUs de ninguno de los tipos de máquinas optimizadas para aceleradores.

Modificar el número de GPUs

Puedes modificar el número de GPUs de una VM estándar A2 o de una VM G2 optimizada para aceleradores mediante la Google Cloud consola o la API REST.

Consola

Para modificar el número de GPUs de una VM, debes detenerla y editar su configuración.

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la máquina virtual.

  2. En la consola Google Cloud , ve a la página Instancias de VM para ver tu lista de VMs.

    Ir a instancias de VM

  3. Haga clic en el nombre de la VM para la que quiera modificar el número de GPUs. Se abrirá la página Detalles.

  4. Sigue estos pasos en la página Detalles.

    1. Si la VM está en ejecución, haz clic en Detener para detenerla. Si no aparece la opción Detener, haz clic en Más acciones > Detener.

    2. Haz clic en Editar.

    3. En la sección Configuración de la máquina, selecciona la familia de máquinas GPUs y, a continuación, haz lo siguiente:

      1. En la lista Número de GPUs, aumenta o disminuye el número de GPUs.

    4. Para aplicar los cambios, haz clic en Guardar.

    5. Para reiniciar la VM, haz clic en Iniciar/Reanudar.

REST

Puedes modificar el número de GPUs de tu VM deteniéndola y cambiando el tipo de máquina. Cada tipo de máquina optimizada para aceleradores tiene un número específico de GPUs conectadas. Si cambias el tipo de máquina, se ajustará el número de GPUs conectadas a la VM.

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la VM y, a continuación, crea un comando POST para detener la VM de forma que pueda moverse a un sistema host en el que haya GPUs disponibles.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Una vez que se haya detenido la VM, crea una solicitud POST para modificar el tipo de máquina.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType
    
    {
       machineType: "zones/ZONE/machineTypes/MACHINE_TYPE"
    }
    
  3. Inicia la VM.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

Haz los cambios siguientes:

  • PROJECT_ID: tu ID de proyecto.
  • VM_NAME: el nombre de la VM a la que quieres añadir GPUs.
  • ZONE: la zona en la que se encuentra la VM. Esta zona debe admitir GPUs.
  • MACHINE_TYPE: el tipo de máquina que quieras usar. Debe ser uno de los siguientes:

    • Si tu máquina virtual usa una máquina estándar A2, selecciona otro tipo de máquina A2.
    • Si tu VM usa un tipo de máquina G2, selecciona otro tipo de máquina G2. Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser un múltiplo de 1024 MB y estar dentro del intervalo de memoria admitido. Por ejemplo, para crear una VM con 4 vCPUs y 19 GB de memoria, especifica --machine-type=g2-custom-4-19456.

Limitaciones

Máquinas virtuales A2

  • Solo puedes solicitar capacidad mediante las opciones de consumo admitidas para el tipo de máquina A2 estándar.
  • No recibirás descuentos por uso continuado ni descuentos por compromiso de uso flexible por las instancias que usen un tipo de máquina A2 estándar.
  • Solo puedes usar un tipo de máquina estándar A2 en determinadas regiones y zonas.
  • El tipo de máquina estándar A2 solo está disponible en la plataforma Cascade Lake.
  • Si tu instancia usa un tipo de máquina A2 estándar, solo puedes cambiar de un tipo de máquina A2 estándar a otro. No puedes cambiar a ningún otro tipo de máquina. Para obtener más información, consulta Modificar instancias optimizadas para aceleradores.
  • No puedes usar el sistema operativo Windows con los a2-megagpu-16gtipos de máquinas estándar A2. Si usas sistemas operativos Windows, elige otro tipo de máquina A2 Standard.
  • No puedes hacer un formato rápido de los SSD locales conectados en instancias de Windows que usen tipos de máquinas estándar A2. Para formatear estas unidades SSD locales, debes realizar un formateo completo con la utilidad diskpart y especificar format fs=ntfs label=tmpfs.
  • Los tipos de máquinas estándar A2 no admiten el alquiler exclusivo.

Máquinas virtuales G2

VMs N1 de uso general

En esta sección se explica cómo añadir, modificar o quitar GPUs de una máquina de uso general N1.

En resumen, el proceso para añadir, modificar o quitar GPUs de una VM es el siguiente:

  1. Comprueba que el disco de arranque de tu VM tenga un tamaño de al menos 40 GB.
  2. Detén la VM.
  3. Añade, modifica o elimina las GPUs.

    Si tu VM no tenía GPUs conectadas antes, debes completar los siguientes pasos:

    1. Prepara tu máquina virtual para la modificación.
    2. Modifica el ajuste de mantenimiento del host de la VM. Las VMs con GPUs no se pueden migrar en tiempo real porque están asignadas a dispositivos de hardware específicos. Para obtener más información, consulta Restricciones de GPU.
    3. Cambia el tipo de máquina. Las GPUs solo se admiten en determinados tipos de máquinas.
    4. Instala un controlador de GPU en tu VM para que tu sistema pueda usar el dispositivo.

Preparar la VM

Cuando se añade una GPU a una VM, el orden de la interfaz de red puede cambiar.

La mayoría de las imágenes públicas de Compute Engine no tienen nombres de interfaz de red persistentes y se adaptan al nuevo orden.

Sin embargo, si usas SLES o una imagen personalizada, debes actualizar la configuración del sistema para evitar que la interfaz de red persista. Para evitar que la interfaz de red persista, ejecuta el siguiente comando en tu VM:

 rm /etc/udev/rules.d/70-persistent-net.rules 

Añadir GPUs o modificar el tipo de GPU en VMs

En esta sección se explica cómo añadir GPUs o modificar el tipo de GPU en máquinas virtuales de uso general N1. Este procedimiento es compatible con los siguientes tipos de GPU:

GPUs NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):

  • Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
  • Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
  • Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws

    En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual (vWS) NVIDIA RTX a tu instancia.

Consola

Para añadir GPUs o modificar el tipo de GPU, sigue estos pasos.

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la máquina virtual.

  2. En la consola Google Cloud , ve a la página Instancias de VM para ver tu lista de VMs.

    Ir a instancias de VM

  3. Haz clic en el nombre de la máquina virtual que quieras actualizar. Se abrirá la página Detalles.

  4. Sigue estos pasos en la página Detalles.

    1. Si la VM está en ejecución, haz clic en Detener. Si no aparece la opción Detener, haz clic en Más acciones > Detener.

    2. Haz clic en Editar.

    3. En la sección Configuración de la máquina, selecciona la familia de máquinas GPUs y, a continuación, haz lo siguiente:

      1. En la lista Tipo de GPU, selecciona o cambia a cualquiera de los tipos de GPU compatibles con las VMs N1.

      2. En la lista Número de GPUs, selecciona el número de GPUs.

      3. Si tu modelo de GPU es compatible con estaciones de trabajo virtuales NVIDIA RTX (vWS) para cargas de trabajo de gráficos y tienes previsto ejecutar cargas de trabajo que utilizan un gran número de gráficos en esta VM, selecciona Habilitar estación de trabajo virtual (NVIDIA GRID).

    4. Si tu VM no tenía GPUs conectadas antes, haz lo siguiente:

      1. Si la VM tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina. En la lista Tipo de máquina, selecciona uno de los tipos de máquina N1 predefinidos. También puedes especificar ajustes personalizados del tipo de máquina.

      2. En la sección Gestión, haz lo siguiente:

        1. En la lista Mantenimiento en el host, selecciona Desactivar la instancia de VM. Las máquinas virtuales con GPUs conectadas no se pueden migrar en caliente. Consulta Gestionar eventos de host de GPU.

        2. En la lista Reinicio automático, selecciona Activado.

    5. Para aplicar los cambios, haz clic en Guardar.

    6. Para reiniciar la VM, haz clic en Iniciar/Reanudar.

REST

Puedes añadir o modificar GPUs en tu VM deteniéndola y cambiando su configuración a través de la API.

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la VM y, a continuación, crea un comando POST para detener la VM de forma que pueda pasar a un sistema host en el que haya GPUs disponibles.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Si tu VM no tenía GPUs conectadas antes, sigue estos pasos:

    1. Identifica el tipo de GPU que quieres añadir a tu máquina virtual. Puedes enviar una GETsolicitud para enumerar los tipos de GPU que están disponibles para tu proyecto en una zona específica.

      GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
      
    2. Si la VM tiene un tipo de máquina de núcleo compartido, debes cambiar el tipo de máquina para que tenga una o más vCPUs. No puedes añadir aceleradores a las VMs con tipos de máquina de núcleo compartido.

    3. Crea un comando POST para definir las opciones de programación de la VM.

      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling
      
      {
      "onHostMaintenance": "TERMINATE",
      "automaticRestart": true
      }
      
  3. Crea una solicitud POST para añadir o modificar las GPUs conectadas a tu máquina virtual.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources
    
        {
         "guestAccelerators": [
          {
            "acceleratorCount": ACCELERATOR_COUNT,
            "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
          }
         ]
        }
    
  4. Inicia la VM.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

    Haz los cambios siguientes:

    • PROJECT_ID: tu ID de proyecto.
    • VM_NAME: el nombre de la VM a la que quieres añadir GPUs.
    • ZONE: la zona en la que se encuentra la VM.
    • ACCELERATOR_COUNT: el número de GPUs que quieres asociar a tu VM. Para ver una lista de los límites de GPU en función del tipo de máquina de tu VM, consulta GPUs en Compute Engine.
    • ACCELERATOR_TYPE: el modelo de GPU que quieres adjuntar o cambiar. Si tienes previsto ejecutar cargas de trabajo con muchos gráficos en esta VM, usa uno de los modelos de estación de trabajo virtual.

      Elige uno de los valores que se indican a continuación.

      • GPUs NVIDIA:

        • NVIDIA T4: nvidia-tesla-t4
        • NVIDIA P4: nvidia-tesla-p4
        • NVIDIA P100: nvidia-tesla-p100
        • NVIDIA V100: nvidia-tesla-v100
      • Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):

        • Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
        • Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
        • Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws

        En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.

Instalar controladores

Para instalar los controladores, elija una de las siguientes opciones:

Quitar GPUs

En esta sección se explica cómo quitar los siguientes tipos de GPU de una máquina virtual de uso general N1.

GPUs NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):

  • Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
  • Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
  • Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws

    En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual (vWS) NVIDIA RTX a tu instancia.

Puedes usar el Google Cloud console para quitar GPUs de una VM. Para quitar GPUs, sigue estos pasos:

  1. Verifica que todas tus aplicaciones críticas estén detenidas en la máquina virtual.

  2. En la Google Cloud consola, ve a la página Instancias de VM para ver tu lista de VMs.

    Ir a instancias de VM

  3. Haz clic en el nombre de la VM de la que quieras quitar las GPUs. Se abrirá la página Detalles.

  4. Sigue estos pasos en la página Detalles.

    1. Si la VM está en ejecución, haz clic en Detener para detenerla. Si no aparece la opción Detener, haz clic en Más acciones > Detener.

    2. En la barra de herramientas, haz clic en Editar.

    3. En la sección Configuración de la máquina, seleccione la familia de máquinas De uso general y, a continuación, haga lo siguiente:

      1. Para ver las GPUs conectadas, despliega Configuraciones avanzadas.

      2. En la sección GPUs, elimina las GPUs con una de las siguientes opciones:

        • Para quitar algunas GPUs, en la lista Número de GPUs, selecciona un número nuevo.

        • Para quitar todas las GPUs, haz clic en Eliminar GPU.

    4. Opcional: Modifica el ajuste de la política de mantenimiento del host de la VM. Las VMs con GPUs deben tener la política de mantenimiento en el host definida como Desactivar la instancia de VM. Sin embargo, si has quitado todas las GPUs, tienes la opción de migrar esta VM en directo durante el mantenimiento del host. Para obtener más información, consulta Definir la política de mantenimiento del host de la VM.

    5. Para aplicar los cambios, haz clic en Guardar.

    6. Para reiniciar la VM, haz clic en Iniciar/Reanudar.

Siguientes pasos