Esta página se ha traducido con Cloud Translation API.

Crea una máquina virtual N1 que tenga GPUs conectadas

Linux Windows

En este documento se explica cómo crear una VM que tenga GPUs conectadas y use una familia de máquinas N1. Puedes usar la mayoría de los tipos de máquinas N1, excepto N1 shared-core.

Antes de empezar

Para consultar otros pasos previos, como seleccionar una imagen del SO y comprobar la cuota de GPU, consulta el documento de descripción general.
Si aún no lo has hecho, configura la autenticación. La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console

When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
1. Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
  gcloud init
  Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
  
  Nota: Si ya has instalado la CLI de gcloud, asegúrate de que tienes la versión más reciente ejecutando gcloud components update.
2. Set a default region and zone.
REST

Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.
Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre autenticación de Google Cloud .

Roles obligatorios

Para obtener los permisos que necesitas para crear VMs, pide a tu administrador que te conceda el rol de gestión de identidades y accesos Administrador de instancias de Compute (v. 1) (roles/compute.instanceAdmin.v1) en el proyecto. Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.

Este rol predefinido contiene los permisos necesarios para crear máquinas virtuales. Para ver los permisos exactos que se necesitan, despliega la sección Permisos necesarios:

Permisos obligatorios

Se necesitan los siguientes permisos para crear VMs:

compute.instances.create del proyecto
Para usar una imagen personalizada para crear la VM, sigue estos pasos: compute.images.useReadOnly en la imagen
Para usar una captura para crear la VM, sigue estos pasos: compute.snapshots.useReadOnly en la captura
Para usar una plantilla de instancia para crear la VM, haz lo siguiente: compute.instanceTemplates.useReadOnly en la plantilla de instancia
Para especificar una subred para tu VM, haz lo siguiente: compute.subnetworks.use en el proyecto o en la subred elegida
Para especificar una dirección IP estática para la máquina virtual, haz lo siguiente: compute.addresses.use en el proyecto
Para asignar una dirección IP externa a la VM cuando se usa una red de VPC, sigue estos pasos: compute.subnetworks.useExternalIp en el proyecto o en la subred elegida
Para asignar una red antigua a la VM, sigue estos pasos: compute.networks.use en el proyecto
Para asignar una dirección IP externa a la VM cuando se usa una red antigua, haz lo siguiente: compute.networks.useExternalIp en el proyecto
Para definir los metadatos de la instancia de VM: compute.instances.setMetadata en el proyecto
Para definir etiquetas en la VM, haz lo siguiente: compute.instances.setTags en la VM
Para definir etiquetas en la VM, sigue estos pasos: compute.instances.setLabels en la VM
Para definir una cuenta de servicio que pueda usar la VM, sigue estos pasos: compute.instances.setServiceAccount en la VM
Para crear un disco para la VM, sigue estos pasos: compute.disks.create en el proyecto
Para adjuntar un disco en modo de solo lectura o de lectura y escritura, sigue estos pasos: compute.disks.use en el disco
Para adjuntar un disco en modo de solo lectura, sigue estos pasos: compute.disks.useReadOnly en el disco

También puedes obtener estos permisos con roles personalizados u otros roles predefinidos.

Información general

Los siguientes modelos de GPU se pueden conectar a VMs que usen familias de máquinas N1.

GPUs NVIDIA:

NVIDIA T4: nvidia-tesla-t4
NVIDIA P4: nvidia-tesla-p4
NVIDIA P100: nvidia-tesla-p100
NVIDIA V100: nvidia-tesla-v100

Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):

Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws

En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual (vWS) NVIDIA RTX a tu instancia.

Crear una VM con GPUs conectadas

Puedes crear una VM N1 con GPUs conectadas mediante laGoogle Cloud consola, la CLI de Google Cloud o REST.

Consola

En la Google Cloud consola, ve a la página Crear una instancia.

Ir a Crear una instancia
Especifica un nombre para la máquina virtual. Consulta Convención de nomenclatura de recursos.
Selecciona una región y una zona en las que haya GPUs disponibles. Consulta la lista de zonas con GPU disponibles.
En la sección Configuración de la máquina, selecciona la familia de máquinas GPUs y, a continuación, haz lo siguiente:
1. En la lista Tipo de GPU, selecciona uno de los modelos de GPU compatibles con las máquinas N1.
2. En la lista Número de GPUs, selecciona el número de GPUs.
3. Si tu modelo de GPU es compatible con estaciones de trabajo virtuales NVIDIA RTX (vWS) para cargas de trabajo de gráficos y tienes previsto ejecutar cargas de trabajo que utilizan un gran número de gráficos en esta VM, selecciona Habilitar estación de trabajo virtual (NVIDIA GRID).
4. En la lista Tipo de máquina, selecciona uno de los tipos de máquina N1 predefinidos. También puedes especificar ajustes personalizados del tipo de máquina.
En la sección Disco de arranque, haz clic en Cambiar. Se abrirá la página Configuración del disco de arranque.
En la página Configuración del disco de arranque, haz lo siguiente:
1. En la pestaña Imágenes públicas, elige una imagen de Compute Engine compatible o Imágenes de máquina virtual de aprendizaje profundo.
2. Especifica un tamaño de disco de arranque de al menos 40 GB.
3. Para confirmar las opciones del disco de arranque, haz clic en Seleccionar.
Opcional: En la lista Modelo de aprovisionamiento de la VM, selecciona un modelo de aprovisionamiento.
Para crear e iniciar la VM, haz clic en Crear.

gcloud

Para crear e iniciar una VM, usa el comando gcloud compute instances create con las siguientes marcas.

Si tu carga de trabajo es tolerante a fallos o puede iniciarse en cualquier momento, considera la posibilidad de usar otro modelo de aprovisionamiento para reducir los costes. Para cambiar el modelo de aprovisionamiento, incluye la marca --provisioning-model=<var>PROVISIONING_MODEL</var> en el comando. Para obtener más información sobre los modelos disponibles, consulta Modelos de aprovisionamiento de instancias de Compute Engine.

gcloud compute instances create VM_NAME \
    --machine-type MACHINE_TYPE \
    --zone ZONE \
    --boot-disk-size DISK_SIZE \
    --accelerator type=ACCELERATOR_TYPE,count=ACCELERATOR_COUNT \
    [--image IMAGE | --image-family IMAGE_FAMILY] \
    --image-project IMAGE_PROJECT \
    --maintenance-policy TERMINATE \
    [--provisioning-model=PROVISIONING_MODEL]

Haz los cambios siguientes:

VM_NAME: el nombre de la nueva VM.
MACHINE_TYPE: el tipo de máquina que has seleccionado para tu VM.
ZONE: la zona de la VM. Esta zona debe admitir el tipo de GPU.
DISK_SIZE: el tamaño de tu disco de arranque en GB. Especifica un tamaño de disco de arranque de al menos 40 GB.
IMAGE o IMAGE_FAMILY que admita GPUs. Especifique una de las siguientes opciones:
- IMAGE: la versión necesaria de una imagen pública. Por ejemplo, --image debian-10-buster-v20200309.
- IMAGE_FAMILY: una familia de imágenes. De este modo, se crea la VM a partir de la imagen de SO más reciente que no esté obsoleta. Por ejemplo, si especificas --image-family debian-10, Compute Engine crea una VM a partir de la versión más reciente de la imagen del SO de la familia de imágenes Debian 10.
También puedes especificar una imagen personalizada o imágenes de máquina virtual de aprendizaje profundo.
IMAGE_PROJECT: el proyecto de imagen de Compute Engine al que pertenece la familia de imágenes. Si usas una imagen personalizada o una imagen de máquina virtual de aprendizaje profundo, especifica el proyecto al que pertenecen esas imágenes.
PROVISIONING_MODEL: el modelo de aprovisionamiento de la máquina virtual. Especifica SPOT o FLEX_START. Si no especifica un modelo de aprovisionamiento, se usará el estándar. Esta marca es opcional.
ACCELERATOR_COUNT: número de GPUs que quieres añadir a tu VM. Consulta la lista de límites de GPU en función del tipo de máquina de tu VM en el artículo GPUs en Compute Engine.
ACCELERATOR_TYPE: el modelo de GPU que quieres usar. Si tienes previsto ejecutar cargas de trabajo con muchos gráficos en esta VM, usa uno de los modelos de estación de trabajo virtual.

Elige uno de los valores que se indican a continuación.
- GPUs NVIDIA:
  - NVIDIA T4: nvidia-tesla-t4
  - NVIDIA P4: nvidia-tesla-p4
  - NVIDIA P100: nvidia-tesla-p100
  - NVIDIA V100: nvidia-tesla-v100
- Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):
  - Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
  - Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
  - Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws
    
    En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.

Ejemplo

Por ejemplo, puedes usar el siguiente comando gcloud para iniciar una VM de Ubuntu 22.04 con 1 GPU NVIDIA T4 y 2 vCPUs en la zona us-east1-d.

gcloud compute instances create gpu-instance-1 \
    --machine-type n1-standard-2 \
    --zone us-east1-d \
    --boot-disk-size 40GB \
    --accelerator type=nvidia-tesla-t4,count=1 \
    --image-family ubuntu-2204-lts \
    --image-project ubuntu-os-cloud \
    --maintenance-policy TERMINATE

REST

Identifica el tipo de GPU que quieres añadir a tu VM. Envía una solicitud GET para enumerar los tipos de GPU que están disponibles para tu proyecto en una zona específica.

Para crear máquinas virtuales a un precio con descuento, puedes especificar otro modelo de aprovisionamiento añadiendo el campo "provisioningModel": "PROVISIONING_MODEL" al objeto scheduling de tu solicitud. Para obtener más información sobre los modelos disponibles, consulta Modelos de aprovisionamiento de instancias de Compute Engine.

GET https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/acceleratorTypes

Haz los cambios siguientes:

PROJECT_ID: ID de proyecto.
ZONE: zona desde la que quieres enumerar los tipos de GPU disponibles.

Envía una solicitud POST al método instances.insert. Incluye el parámetro acceleratorType para especificar el tipo de GPU que quieres usar y el parámetro acceleratorCount para indicar cuántas GPUs quieres añadir. También debe asignar el valor TERMINATE al parámetro onHostMaintenance.

POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances
{
  "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE",
  "disks":
  [
    {
      "type": "PERSISTENT",
      "initializeParams":
      {
        "diskSizeGb": "DISK_SIZE",
        "sourceImage": "projects/IMAGE_PROJECT/global/images/family/IMAGE_FAMILY"
      },
      "boot": true
    }
  ],
  "name": "VM_NAME",
  "networkInterfaces":
  [
    {
      "network": "projects/PROJECT_ID/global/networks/NETWORK"
    }
  ],
  "guestAccelerators":
  [
    {
      "acceleratorCount": ACCELERATOR_COUNT,
      "acceleratorType": "projects/PROJECT_ID/zones/ZONE/acceleratorTypes/ACCELERATOR_TYPE"
    }
  ],
  "scheduling":
  {
    ["automaticRestart": true],
    "onHostMaintenance": "TERMINATE",
    "provisioningModel": "PROVISIONING_MODEL"
  },
}

Haz los cambios siguientes:

VM_NAME: el nombre de la VM.
PROJECT_ID: tu ID de proyecto.
ZONE: la zona de la VM. Esta zona debe admitir el tipo de GPU.
MACHINE_TYPE: el tipo de máquina que has seleccionado para la VM. Consulta el artículo sobre GPUs en Compute Engine para ver qué tipos de máquinas están disponibles en función del número de GPUs que elijas.
IMAGE o IMAGE_FAMILY: especifique una de las siguientes opciones:
- IMAGE: la versión necesaria de una imagen pública. Por ejemplo: "sourceImage": "projects/debian-cloud/global/images/debian-10-buster-v20200309"
- IMAGE_FAMILY: una familia de imágenes. De este modo, se crea la VM a partir de la imagen de SO más reciente que no esté obsoleta. Por ejemplo, si especificas "sourceImage": "projects/debian-cloud/global/images/family/debian-10", Compute Engine crea una VM a partir de la última versión de la imagen del SO de la familia de imágenes Debian 10.
También puedes especificar una imagen personalizada o imágenes de máquina virtual de aprendizaje profundo.
IMAGE_PROJECT: el proyecto de imagen de Compute Engine al que pertenece la familia de imágenes. Si usas una imagen personalizada o una imagen de máquina virtual de aprendizaje profundo, especifica el proyecto al que pertenecen esas imágenes.
DISK_SIZE: el tamaño de tu disco de arranque en GB. Especifica un tamaño de disco de arranque de al menos 40 GB.
NETWORK: la red de VPC que quieres usar para la VM. Puedes especificar default para usar tu red predeterminada.
ACCELERATOR_COUNT: número de GPUs que quieres añadir a tu VM. Consulta la lista de límites de GPU en función del tipo de máquina de tu VM en el artículo GPUs en Compute Engine.
ACCELERATOR_TYPE: el modelo de GPU que quieres usar. Si tienes previsto ejecutar cargas de trabajo con muchos gráficos en esta VM, usa uno de los modelos de estación de trabajo virtual.

Elige uno de los valores que se indican a continuación.
- GPUs NVIDIA:
  - NVIDIA T4: nvidia-tesla-t4
  - NVIDIA P4: nvidia-tesla-p4
  - NVIDIA P100: nvidia-tesla-p100
  - NVIDIA V100: nvidia-tesla-v100
- Estación de trabajo virtual (vWS) NVIDIA RTX (antes NVIDIA GRID):
  - Estación de trabajo virtual con NVIDIA T4: nvidia-tesla-t4-vws
  - Estación de trabajo virtual con NVIDIA P4: nvidia-tesla-p4-vws
  - Estación de trabajo virtual con NVIDIA P100: nvidia-tesla-p100-vws
    
    En el caso de estas estaciones de trabajo virtuales, se añade automáticamente una licencia de estación de trabajo virtual NVIDIA RTX (vWS) a tu instancia.
PROVISIONING_MODEL: el modelo de aprovisionamiento de la máquina virtual. Especifica SPOT o FLEX_START. Si no especifica un modelo de aprovisionamiento, se usará el modelo estándar. Esta propiedad es opcional. Para obtener más información sobre los modelos de aprovisionamiento, consulta Modelos de aprovisionamiento de instancias de Compute Engine.

Instalar controladores

Para instalar los controladores, elija una de las siguientes opciones:

Si tienes previsto ejecutar cargas de trabajo que utilizan un gran número de gráficos, como las de juegos y visualización, instala los controladores de la estación de trabajo virtual NVIDIA RTX.
En la mayoría de las cargas de trabajo, instala los controladores de GPU.

Siguientes pasos

Consulta más información sobre las plataformas de GPU.
Añade SSDs locales a tus instancias. Los dispositivos SSD locales se combinan bien con las GPUs cuando tus aplicaciones requieren almacenamiento de alto rendimiento.
Instala los controladores de la GPU. Si has habilitado una estación de trabajo virtual NVIDIA RTX, instala un controlador para la estación de trabajo virtual.
Para gestionar el mantenimiento del host de GPU, consulta Gestionar eventos de mantenimiento de host de GPU.

Crea una máquina virtual N1 que tenga GPUs conectadas

Antes de empezar

Console

gcloud

REST

Roles obligatorios

Permisos obligatorios

Información general

Crear una VM con GPUs conectadas

Consola

gcloud

REST

Instalar controladores

Siguientes pasos