Agregar o quitar GPU


Compute Engine proporciona unidades de procesamiento de gráficos (GPU) que puedes agregar a tus instancias de máquina virtual (VM). Puede utilizar estas GPU para acelerar cargas de trabajo específicas en sus máquinas virtuales, como el aprendizaje automático y el procesamiento de datos.

Solo puedes usar dos familias de máquinas cuando ejecutas GPU en Compute Engine:

  • La familia de máquinas optimizadas para el acelerador. Todos los tipos de máquinas optimizadas para aceleradores tienen GPU adjuntas.
  • La familia de máquinas de uso general N1. Puede utilizar la mayoría de los tipos de máquinas N1, excepto el tipo de máquina de núcleo compartido N1. Si no está utilizando una máquina de uso general N1, puede cambiar a una máquina de uso general N1 y luego agregar las GPU.

Antes de comenzar

  • Para revisar pasos de requisitos previos adicionales, como seleccionar una imagen del sistema operativo y verificar la cuota de GPU, revise el documento de descripción general .
  • Si aún no lo has hecho, configura la autenticación. La autenticación es el proceso mediante el cual se verifica su identidad para acceder a Google Cloud servicios y API. Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:

    Select the tab for how you plan to use the samples on this page:

    Console

    When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.

    REST

    Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporcionas a la CLI de gcloud.

      After installing the Google Cloud CLI, initialize it by running the following command:

      gcloud init

      If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.

    Para obtener más información, consulta Autentica para usar REST en la documentación de autenticación de Google Cloud .

VM optimizadas para acelerador

Cada tipo de máquina optimizada para acelerador tiene adjunto un modelo específico de GPU NVIDIA.

Puede modificar cada máquina virtual optimizada para acelerador de la siguiente manera:

  • Para las máquinas virtuales A2 Ultra, A3 y A4, no puede modificar el tipo de máquina. Si está utilizando cualquiera de estos tipos de máquina para su VM y necesita cambiar el tipo de máquina, cree una nueva VM.

  • Para las máquinas virtuales A2 Standard, puede modificar el recuento de GPU cambiando de un tipo de máquina A2 Standard a otro tipo de máquina A2 Standard.

  • Para las máquinas virtuales G2, puede hacer lo siguiente:

    • Puede modificar el recuento de GPU cambiando de un tipo de máquina G2 a otro tipo de máquina G2.
    • Puede cambiar de un tipo de máquina G2 a un tipo de máquina de una familia de máquinas diferente, como las de uso general o las optimizadas para computación. Consulte Editar el tipo de máquina de una VM .
  • No puede eliminar GPU de ningún tipo de máquina optimizada para acelerador. Si ya no necesita GPU, complete lo siguiente:

    • Para máquinas virtuales A4, A3 o A2, cree una nueva máquina virtual.
    • Para máquinas virtuales G2, cambie a un tipo de máquina de una familia de máquinas diferente.

Modificar el recuento de GPU

Puede modificar el recuento de GPU de una máquina virtual estándar A2 o optimizada para acelerador G2 mediante la consola de Google Cloud o REST.

Consola

Puede modificar la cantidad de GPU para su VM deteniéndola y editando la configuración de la VM.

  1. Verifique que todas sus aplicaciones críticas estén detenidas en la VM.

  2. En la consola de Google Cloud, vaya a la página de instancias de VM para ver su lista de VM.

    Ir a instancias de VM

  3. Haga clic en el nombre de la VM para la que desea modificar la cantidad de GPU. Se abre la página Detalles .

  4. Complete los siguientes pasos desde la página Detalles .

    1. Si la VM se está ejecutando, en la barra de herramientas, haga clic en Detener . Luego, espere a que se detenga la máquina virtual.

    2. En la barra de herramientas, haga clic en Editar .

    3. En la sección Configuración de la máquina , seleccione la familia de máquinas GPU y luego haga lo siguiente:

      1. En la lista Número de GPU , aumente o disminuya el recuento de GPU.

    4. Para aplicar sus cambios, haga clic en Guardar .

    5. Para reiniciar la VM, haga clic en Iniciar/Reanudar .

DESCANSAR

Puede modificar la cantidad de GPU en su VM deteniéndola y cambiando el tipo de máquina. Cada tipo de máquina optimizada para acelerador tiene una cantidad específica de GPU conectadas. Si cambia el tipo de máquina, esto ajusta la cantidad de GPU que están conectadas a la VM.

  1. Verifique que todas sus aplicaciones críticas estén detenidas en la VM y luego cree un comando POST para detener la VM para que pueda trasladarse a un sistema host donde haya GPU disponibles.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Después de que la VM se detenga, cree una solicitud POST para modificar el tipo de máquina.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineType
    
    {
       machineType: "zones/ZONE/machineTypes/MACHINE_TYPE"
    }
    
  3. Inicie la máquina virtual.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

Reemplace lo siguiente:

  • PROJECT_ID : su ID de proyecto.
  • VM_NAME : el nombre de la VM a la que desea agregar GPU.
  • ZONE : la zona donde se encuentra la VM. Esta zona debe admitir GPU .
  • MACHINE_TYPE : el tipo de máquina que desea utilizar. Debe ser uno de los siguientes:

    • Si su VM utiliza una máquina estándar A2, seleccione otro tipo de máquina A2 .
    • Si su VM usa un tipo de máquina G2, seleccione otro tipo de máquina G2 . Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser múltiplo de 1024 MB y estar dentro del rango de memoria admitido. Por ejemplo, para crear una máquina virtual con 4 vCPU y 19 GB de memoria, especifique --machine-type=g2-custom-4-19456 .

Limitaciones

Máquinas virtuales A2

  • Solo puede solicitar capacidad utilizando las opciones de aprovisionamiento admitidas para un tipo de máquina estándar A2.
  • No recibe descuentos por uso sostenido ni descuentos por uso comprometido flexible para las máquinas virtuales que utilizan un tipo de máquina estándar A2.
  • Sólo puede utilizar un tipo de máquina A2 estándar en determinadas regiones y zonas .
  • El tipo de máquina A2 Standard solo está disponible en la plataforma Cascade Lake .
  • Si su VM utiliza un tipo de máquina A2 Estándar, solo puede cambiar de un tipo de máquina A2 Estándar a otro tipo de máquina A2 Estándar. No puede cambiar a ningún otro tipo de máquina. Para obtener más información, consulte Modificar máquinas virtuales optimizadas para acelerador .
  • No puedes usar el sistema operativo Windows con A2 Tipos de máquinas estándar. Cuando utilice sistemas operativos Windows, elija un tipo de máquina estándar A2 diferente.
  • No puede realizar un formato rápido de los SSD locales conectados en máquinas virtuales Windows que utilizan tipos de máquinas estándar A2. Para formatear estos SSD locales, debe realizar un formateo completo utilizando la utilidad diskpart y especificando format fs=ntfs label=tmpfs .
  • Los tipos de máquinas A2 estándar no admiten el arrendamiento único .

Máquinas virtuales G2

Máquinas virtuales de uso general N1

Esta sección cubre cómo agregar, modificar o eliminar GPU de una máquina de uso general N1.

En resumen, el proceso para agregar, modificar o eliminar GPU de una VM existente es el siguiente:

  1. Verifique que su VM tenga un tamaño de disco de arranque de al menos 40 GB.
  2. Detenga la máquina virtual.
  3. Agregue, modifique o elimine las GPU.

    Si su VM no tenía GPU conectadas antes, debe completar los siguientes pasos:

    1. Prepare su VM para la modificación.
    2. Modifique la configuración de mantenimiento del host para la VM. Las máquinas virtuales con GPU no pueden migrar en vivo porque están asignadas a dispositivos de hardware específicos. Para obtener más información, consulte Restricciones de GPU .
    3. Cambie el tipo de máquina. Las GPU solo son compatibles con determinados tipos de máquinas .
    4. Instale un controlador de GPU en su VM para que su sistema pueda usar el dispositivo.

Prepare su máquina virtual

Cuando se agrega una GPU a una VM, el orden de la interfaz de red puede cambiar.

La mayoría de las imágenes públicas en Compute Engine no tienen nombres de interfaz de red persistentes y se ajustan al nuevo orden.

Sin embargo, si utiliza SLES o una imagen personalizada, debe actualizar la configuración del sistema para evitar que la interfaz de red persista. Para evitar que la interfaz de red persista, ejecute el siguiente comando en su VM:

 rm /etc/udev/rules.d/70-persistent-net.rules 

Agregue GPU o modifique el tipo de GPU en máquinas virtuales existentes

Esta sección cubre cómo agregar GPU o modificar el tipo de GPU en una máquina virtual N1 de uso general existente. Este procedimiento admite los siguientes tipos de GPU:

GPU NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

Estación de trabajo virtual NVIDIA RTX (vWS) (anteriormente conocida como NVIDIA GRID):

  • Estación de trabajo virtual NVIDIA T4: nvidia-tesla-t4-vws
  • Estación de trabajo virtual NVIDIA P4: nvidia-tesla-p4-vws
  • Estación de trabajo virtual NVIDIA P100: nvidia-tesla-p100-vws

    Para estas estaciones de trabajo virtuales, se agrega automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a su máquina virtual.

Consola

Para agregar GPU o modificar el tipo de GPU, complete los siguientes pasos.

  1. Verifique que todas sus aplicaciones críticas estén detenidas en la VM.

  2. En la consola de Google Cloud, vaya a la página de instancias de VM para ver su lista de VM.

    Ir a instancias de VM

  3. Haga clic en el nombre de la VM que desea actualizar. Se abre la página Detalles .

  4. Complete los siguientes pasos desde la página Detalles .

    1. Si la VM se está ejecutando, en la barra de herramientas, haga clic en Detener . Luego, espere a que se detenga la máquina virtual.

    2. En la barra de herramientas, haga clic en Editar .

    3. En la sección Configuración de la máquina , seleccione la familia de máquinas GPU y luego haga lo siguiente:

      1. En la lista de tipos de GPU , seleccione o cambie a cualquiera de los tipos de GPU admitidos en las máquinas virtuales N1.

      2. En la lista Número de GPU , seleccione la cantidad de GPU.

      3. Si su modelo de GPU admite estaciones de trabajo virtuales NVIDIA RTX (vWS) para cargas de trabajo de gráficos y planea ejecutar cargas de trabajo con uso intensivo de gráficos en esta máquina virtual, seleccione Habilitar estación de trabajo virtual (NVIDIA GRID) .

    4. Si su VM no tenía GPU conectadas antes, complete lo siguiente:

      1. Si la VM tiene un tipo de máquina de núcleo compartido, debe cambiar el tipo de máquina. En la lista Tipo de máquina , seleccione uno de los tipos de máquina N1 preestablecidos. Alternativamente, también puede especificar configuraciones de tipo de máquina personalizadas.

      2. En la sección Gestión , complete lo siguiente:

        1. En la lista Mantenimiento en el host , seleccione Terminar instancia de VM . Las máquinas virtuales con GPU conectadas no pueden migrar en vivo. Consulte Manejar eventos del host de GPU .

        2. En la lista Reinicio automático , seleccione Activado .

    5. Para aplicar sus cambios, haga clic en Guardar .

    6. Para reiniciar la VM, haga clic en Iniciar/Reanudar .

DESCANSAR

Puede agregar o modificar GPU en su VM deteniéndola y cambiando su configuración a través de la API.

  1. Verifique que todas sus aplicaciones críticas estén detenidas en la VM y luego cree un comando POST para detener la VM para que pueda trasladarse a un sistema host donde haya GPU disponibles.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/stop
    
  2. Si su VM no tenía GPU conectadas antes, complete los siguientes pasos:

    1. Identifique el tipo de GPU que desea agregar a su VM. Puede enviar una solicitud GET para enumerar los tipos de GPU que están disponibles para su proyecto en una zona específica.

      GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes
      
    2. Si la máquina virtual tiene un tipo de máquina de núcleo compartido, debe cambiar el tipo de máquina para que tenga una o más vCPU. No puede agregar aceleradores a máquinas virtuales con tipos de máquinas de núcleo compartido.

    3. Cree un comando POST para configurar las opciones de programación para la VM.

      POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setScheduling
      
      {
      "onHostMaintenance": "TERMINATE",
      "automaticRestart": true
      }
      
  3. Cree una solicitud POST para agregar o modificar las GPU conectadas a su VM.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/setMachineResources
    
        {
         "guestAccelerators": [
          {
            "acceleratorCount": ACCELERATOR_COUNT,
            "acceleratorType": "https://www.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
          }
         ]
        }
    
  4. Inicie la máquina virtual.

    POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances/VM_NAME/start
    

    Reemplace lo siguiente:

    • PROJECT_ID : su ID de proyecto.
    • VM_NAME : el nombre de la VM a la que desea agregar GPU.
    • ZONE : la zona donde se encuentra la VM.
    • ACCELERATOR_COUNT : la cantidad de GPU que desea conectar a su VM. Para obtener una lista de límites de GPU según el tipo de máquina de tu VM, consulta GPU en Compute Engine .
    • ACCELERATOR_TYPE : el modelo de GPU que desea conectar o cambiar. Si planea ejecutar cargas de trabajo con uso intensivo de gráficos en esta máquina virtual, use uno de los modelos de estación de trabajo virtual .

      Elija uno de los siguientes valores:

      • GPU NVIDIA:

        • NVIDIA T4: nvidia-tesla-t4
        • NVIDIA P4: nvidia-tesla-p4
        • NVIDIA P100: nvidia-tesla-p100
        • NVIDIA V100: nvidia-tesla-v100
      • Estación de trabajo virtual NVIDIA RTX (vWS) (anteriormente conocida como NVIDIA GRID):

        • Estación de trabajo virtual NVIDIA T4: nvidia-tesla-t4-vws
        • Estación de trabajo virtual NVIDIA P4: nvidia-tesla-p4-vws
        • Estación de trabajo virtual NVIDIA P100: nvidia-tesla-p100-vws

        Para estas estaciones de trabajo virtuales, se agrega automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a su máquina virtual.

Instalar controladores

Para instalar los controladores, elija una de las siguientes opciones:

Quitar GPU

Esta sección cubre cómo eliminar los siguientes tipos de GPU de una máquina virtual N1 de uso general existente.

GPU NVIDIA:

  • NVIDIA T4: nvidia-tesla-t4
  • NVIDIA P4: nvidia-tesla-p4
  • NVIDIA P100: nvidia-tesla-p100
  • NVIDIA V100: nvidia-tesla-v100

Estación de trabajo virtual NVIDIA RTX (vWS) (anteriormente conocida como NVIDIA GRID):

  • Estación de trabajo virtual NVIDIA T4: nvidia-tesla-t4-vws
  • Estación de trabajo virtual NVIDIA P4: nvidia-tesla-p4-vws
  • Estación de trabajo virtual NVIDIA P100: nvidia-tesla-p100-vws

    Para estas estaciones de trabajo virtuales, se agrega automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a su máquina virtual.

Puede utilizar la consola de Google Cloud para eliminar GPU de una máquina virtual existente. Para eliminar GPU, complete los siguientes pasos:

  1. Verifique que todas sus aplicaciones críticas estén detenidas en la VM.

  2. En la consola de Google Cloud, vaya a la página de instancias de VM para ver su lista de VM.

    Ir a instancias de VM

  3. Haga clic en el nombre de la VM de la que desea eliminar las GPU. Se abre la página Detalles .

  4. Complete los siguientes pasos desde la página Detalles .

    1. Si la VM se está ejecutando, en la barra de herramientas, haga clic en Detener . Luego, espere a que se detenga la máquina virtual.

    2. En la barra de herramientas, haga clic en Editar .

    3. En la sección Configuración de la máquina , seleccione la familia de máquinas de uso general y luego haga lo siguiente:

      1. Para ver las GPU conectadas, expanda Configuraciones avanzadas .

      2. En la sección GPU , elimine las GPU usando una de las siguientes opciones:

        • Para eliminar algunas GPU, en la lista Número de GPU , seleccione un número nuevo.

        • Para eliminar todas las GPU, haga clic en Eliminar GPU .

    4. Opcional: modifique la configuración de la política de mantenimiento del host de VM. Las máquinas virtuales con GPU deben tener la política de mantenimiento del host configurada en Terminar instancia de máquina virtual . Pero si eliminó todas las GPU, tiene la opción de migrar en vivo esta máquina virtual durante el mantenimiento del host. Para obtener más información, consulte Establecer la política de mantenimiento del host de VM .

    5. Para aplicar sus cambios, haga clic en Guardar .

    6. Para reiniciar la VM, haga clic en Iniciar/Reanudar .

¿Qué sigue?