Este documento explica cómo crear una máquina virtual que utilice un tipo de máquina de las series de máquinas A3 High, A3 Mega, A3 Edge, A2 y G2. Para obtener más información sobre la creación de máquinas virtuales con GPU conectadas, consulte Descripción general de la creación de una instancia con GPU conectadas .
Antes de comenzar
- Para revisar las limitaciones y los pasos de requisitos previos adicionales para crear instancias con GPU adjuntas, como seleccionar una imagen del sistema operativo y verificar la cuota de GPU, consulte Descripción general de la creación de una instancia con GPU adjuntas .
- Si aún no lo has hecho, configura la autenticación. La autenticación es el proceso mediante el cual se verifica su identidad para acceder a Google Cloud servicios y API. Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
-
compute.instances.create
en el proyecto. - Para usar una imagen personalizada para crear la VM:
compute.images.useReadOnly
en la imagen - Para usar una instantánea para crear la VM:
compute.snapshots.useReadOnly
en la instantánea - Para usar una plantilla de instancia para crear la VM:
compute.instanceTemplates.useReadOnly
en la plantilla de instancia - Para asignar una red heredada a la VM:
compute.networks.use
en el proyecto - Para especificar una dirección IP estática para la VM:
compute.addresses.use
en el proyecto - Para asignar una dirección IP externa a la VM cuando se usa una red heredada:
compute.networks.useExternalIp
en el proyecto - Para especificar una subred para su VM:
compute.subnetworks.use
en el proyecto o en la subred elegida - Para asignar una dirección IP externa a la VM cuando se usa una red VPC:
compute.subnetworks.useExternalIp
en el proyecto o en la subred elegida - Para configurar metadatos de instancia de VM para la VM:
compute.instances.setMetadata
en el proyecto - Para configurar etiquetas para la VM:
compute.instances.setTags
en la VM - Para configurar etiquetas para la VM:
compute.instances.setLabels
en la VM - Para configurar una cuenta de servicio para que la use la VM:
compute.instances.setServiceAccount
en la VM - Para crear un nuevo disco para la VM:
compute.disks.create
en el proyecto - Para conectar un disco existente en modo de solo lectura o lectura-escritura:
compute.disks.use
en el disco - Para conectar un disco existente en modo de solo lectura:
compute.disks.useReadOnly
en el disco En la consola de Google Cloud, vaya a la página Crear una instancia .
Especifique un nombre para su VM. Consulte Convención de nomenclatura de recursos .
Seleccione una región y zona donde las GPU estén disponibles. Consulte la lista de regiones y zonas de GPU disponibles.
En la sección Configuración de la máquina , seleccione la familia de máquinas GPU .
Complete uno de los siguientes pasos para seleccionar un tipo de máquina predefinido o personalizado según la serie de la máquina:
Para todas las series de máquinas GPU, puede seleccionar un tipo de máquina predefinido de la siguiente manera:
En la lista de tipos de GPU , seleccione su tipo de GPU.
- Para máquinas virtuales optimizadas para acelerador A3 High, A3 Mega o A3 Edge, seleccione
NVIDIA H100 80GB
oNVIDIA H100 80GB MEGA
. - Para máquinas virtuales optimizadas para acelerador A2, seleccione
NVIDIA A100 40GB
oNVIDIA A100 80GB
. - Para máquinas virtuales optimizadas para acelerador G2, seleccione
NVIDIA L4
.
- Para máquinas virtuales optimizadas para acelerador A3 High, A3 Mega o A3 Edge, seleccione
En la lista Número de GPU , seleccione la cantidad de GPU.
Para la serie de máquinas G2, puede seleccionar un tipo de máquina personalizado de la siguiente manera:
- En la lista de tipos de GPU , seleccione
NVIDIA L4
. - En la sección Tipo de máquina , seleccione Personalizado .
- Para especificar la cantidad de vCPU y la cantidad de memoria para la instancia, arrastre los controles deslizantes o ingrese los valores en los cuadros de texto. La consola muestra un costo estimado para la instancia a medida que cambia la cantidad de vCPU y memoria.
- En la lista de tipos de GPU , seleccione
Opcional: la serie de máquinas G2 admite estaciones de trabajo virtuales NVIDIA RTX (vWS) para cargas de trabajo de gráficos . Si planea ejecutar cargas de trabajo con uso intensivo de gráficos en su máquina virtual G2, seleccione Habilitar estación de trabajo virtual (NVIDIA GRID) .
En la sección Disco de arranque , haga clic en Cambiar . Esto abre la página de configuración del disco de arranque .
En la página de configuración del disco de arranque , haga lo siguiente:
- En la pestaña Imágenes públicas , elija una imagen de Compute Engine compatible o Imágenes de VM de aprendizaje profundo .
- Especifique un tamaño de disco de arranque de al menos 40 GB.
- Para confirmar las opciones de su disco de arranque, haga clic en Seleccionar .
Opcional: Configure el modelo de aprovisionamiento. Por ejemplo, si su carga de trabajo es tolerante a fallas y puede soportar una posible apropiación de VM, considere usar Spot VM para reducir el costo de sus VM y las GPU conectadas. Para obtener más información, consulte GPU en máquinas virtuales puntuales . Para hacer esto, complete los siguientes pasos:
- En la sección Políticas de disponibilidad , seleccione Spot en la lista de modelos de aprovisionamiento de VM . Esta configuración deshabilita las opciones de reinicio automático y mantenimiento del host para la VM.
- Opcional: en la lista Al finalizar la VM , selecciona qué sucede cuando Compute Engine se adelanta a la VM:
- Para detener la máquina virtual durante la preferencia, seleccione Detener (predeterminado).
- Para eliminar la VM durante la preferencia, seleccione Eliminar .
Para crear e iniciar la VM, haga clic en Crear .
- El indicador
--provisioning-model=SPOT
que configura sus máquinas virtuales como máquinas virtuales puntuales. Si su carga de trabajo es tolerante a fallas y puede soportar una posible apropiación de VM, considere usar Spot VM para reducir el costo de sus VM y las GPU conectadas. Para obtener más información, consulte GPU en máquinas virtuales puntuales . Para las máquinas virtuales puntuales, los indicadores de opciones de reinicio automático y mantenimiento del host están deshabilitados. - El indicador
--accelerator
para especificar una estación de trabajo virtual. Las estaciones de trabajo virtuales NVIDIA RTX (vWS) solo son compatibles con máquinas virtuales G2. -
VM_NAME
: el nombre de la nueva VM. -
MACHINE_TYPE
: el tipo de máquina que seleccionó. Elija entre uno de los siguientes:- Una máquina tipo A3 .
- Una máquina tipo A2 .
- Una máquina tipo G2 . Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser múltiplo de 1024 MB y estar dentro del rango de memoria admitido. Por ejemplo, para crear una máquina virtual con 4 vCPU y 19 GB de memoria, especifique
--machine-type=g2-custom-4-19456
.
-
ZONE
: la zona para la VM. Esta zona debe ser compatible con el modelo de GPU seleccionado . -
DISK_SIZE
: el tamaño de su disco de arranque en GB. Especifique un tamaño de disco de arranque de al menos 40 GB. -
IMAGE
: una imagen del sistema operativo compatible con GPU . Si desea utilizar la imagen más reciente en una familia de imágenes , reemplace la marca--image
con la marca--image-family
y establezca su valor en una familia de imágenes que admita GPU. Por ejemplo:--image-family=rocky-linux-8-optimized-gcp
.
También puede especificar una imagen personalizada o imágenes de VM de aprendizaje profundo . -
IMAGE_PROJECT
: el proyecto de imagen de Compute Engine al que pertenece la imagen del sistema operativo. Si utiliza una imagen personalizada o imágenes de VM de aprendizaje profundo, especifique el proyecto al que pertenecen esas imágenes. -
VWS_ACCELERATOR_COUNT
: la cantidad de GPU virtuales que necesitas. -
VM_NAME
: el nombre de la nueva VM. -
PROJECT_ID
: su ID de proyecto. -
ZONE
: la zona para la VM. Esta zona debe ser compatible con el modelo de GPU seleccionado . -
MACHINE_TYPE
: el tipo de máquina que seleccionó. Elija entre uno de los siguientes:- Una máquina tipo A3 .
- Una máquina tipo A2 .
- Una máquina tipo G2 . Los tipos de máquinas G2 también admiten memoria personalizada. La memoria debe ser múltiplo de 1024 MB y estar dentro del rango de memoria admitido. Por ejemplo, para crear una máquina virtual con 4 vCPU y 19 GB de memoria, especifique
--machine-type=g2-custom-4-19456
.
SOURCE_IMAGE_URI
: el URI de la imagen o familia de imágenes específica que desea utilizar. Por ejemplo:- Imagen específica:
"sourceImage": "projects/rocky-linux-cloud/global/images/rocky-linux-8-optimized-gcp-v20220719"
- Familia de imágenes:
"sourceImage": "projects/rocky-linux-cloud/global/images/family/rocky-linux-8-optimized-gcp"
-
DISK_SIZE
: el tamaño de su disco de arranque en GB. Especifique un tamaño de disco de arranque de al menos 40 GB. -
NETWORK
: la red VPC que desea utilizar para la VM. Puede especificar "predeterminado" para usar su red predeterminada. - Si su carga de trabajo es tolerante a fallas y puede soportar una posible apropiación de VM, considere usar VM puntuales para reducir el costo de sus VM y las GPU conectadas. Para obtener más información, consulte GPU en máquinas virtuales puntuales . Para especificar máquinas virtuales puntuales, agregue la opción
"provisioningModel": "SPOT"
a su solicitud. Para las máquinas virtuales puntuales, los indicadores de opciones de reinicio automático y mantenimiento del host están deshabilitados."scheduling": { "provisioningModel": "SPOT" }
- Para las máquinas virtuales G2, se admiten las estaciones de trabajo virtuales NVIDIA RTX (vWS). Para especificar una estación de trabajo virtual, agregue la opción `guestAccelerators` a su solicitud. Reemplace
VWS_ACCELERATOR_COUNT
con la cantidad de GPU virtuales que necesita."guestAccelerators": [ { "acceleratorCount": VWS_ACCELERATOR_COUNT, "acceleratorType": "projects/PROJECT_ID/zones/ZONEacceleratorTypes/nvidia-l4-vws" } ]
- Imágenes de máquinas virtuales de aprendizaje profundo . Este ejemplo utiliza la máquina virtual A2 Standard (
a2-highgpu-1g
). - Imagen optimizada para contenedores (COS) . Este ejemplo utiliza una máquina virtual
a3-highgpu-8g
oa3-edgegpu-8g
. Imagen pública . Este ejemplo utiliza una máquina virtual G2.
Cree la máquina virtual. En este ejemplo, también se especifican indicadores opcionales como el tipo y tamaño del disco de arranque.
gcloud compute instances create VM_NAME \ --project=PROJECT_ID \ --zone=ZONE \ --machine-type=g2-standard-8 \ --maintenance-policy=TERMINATE --restart-on-failure \ --network-interface=nic-type=GVNIC \ --accelerator=type=nvidia-l4-vws,count=1 \ --image-family=rocky-linux-8-optimized-gcp \ --image-project=rocky-linux-cloud \ --boot-disk-size=200GB \ --boot-disk-type=pd-ssd
Reemplace lo siguiente:
-
VM_NAME
: el nombre de tu VM -
PROJECT_ID
: su ID de proyecto. -
ZONE
: la zona para la VM.
-
Instale el controlador NVIDIA y CUDA . Para las GPU NVIDIA L4, se requiere CUDA versión XX o superior.
-
common-cu110
: controlador NVIDIA y CUDA preinstalados -
tf-ent-1-15-cu110
: controlador NVIDIA, CUDA, TensorFlow Enterprise 1.15.3 preinstalado -
tf2-ent-2-1-cu110
: controlador NVIDIA, CUDA, TensorFlow Enterprise 2.1.1 preinstalado -
tf2-ent-2-3-cu110
: controlador NVIDIA, CUDA, TensorFlow Enterprise 2.3.1 preinstalado -
pytorch-1-6-cu110
: controlador NVIDIA, CUDA, Pytorch 1.6 Cree una máquina virtual utilizando la imagen
tf2-ent-2-3-cu110
y el tipo de máquinaa2-highgpu-1g
. En este ejemplo, se especifican indicadores opcionales como el tamaño y el alcance del disco de arranque.gcloud compute instances create VM_NAME \ --project PROJECT_ID \ --zone ZONE \ --machine-type a2-highgpu-1g \ --maintenance-policy TERMINATE \ --image-family tf2-ent-2-3-cu110 \ --image-project deeplearning-platform-release \ --boot-disk-size 200GB \ --metadata "install-nvidia-driver=True,proxy-mode=project_editors" \ --scopes https://www.googleapis.com/auth/cloud-platform
Reemplace lo siguiente:
-
VM_NAME
: el nombre de tu VM -
PROJECT_ID
: su ID de proyecto. -
ZONE
: la zona para la VM
-
El comando de ejemplo anterior también genera una instancia de notebooks administrada por el usuario de Vertex AI Workbench para la VM. Para acceder al cuaderno, en la consola de Google Cloud, vaya a la página Vertex AI Workbench > Cuadernos administrados por el usuario .
Cree una máquina virtual optimizada para acelerador A3 High, A3 Mega, A3 Edge o A2.
Habilite los controladores de GPU NVIDIA .
Habilite GPU de instancias múltiples.
sudo nvidia-smi -mig 1
Revise las formas de GPU de instancias múltiples que están disponibles.
sudo nvidia-smi mig --list-gpu-instance-profiles
El resultado es similar al siguiente:
+-----------------------------------------------------------------------------+ | GPU instance profiles: | | GPU Name ID Instances Memory P2P SM DEC ENC | | Free/Total GiB CE JPEG OFA | |=============================================================================| | 0 MIG 1g.10gb 19 7/7 9.62 No 16 1 0 | | 1 1 0 | +-----------------------------------------------------------------------------+ | 0 MIG 1g.10gb+me 20 1/1 9.62 No 16 1 0 | | 1 1 1 | +-----------------------------------------------------------------------------+ | 0 MIG 1g.20gb 15 4/4 19.50 No 26 1 0 | | 1 1 0 | +-----------------------------------------------------------------------------+ | 0 MIG 2g.20gb 14 3/3 19.50 No 32 2 0 | | 2 2 0 | +-----------------------------------------------------------------------------+ | 0 MIG 3g.40gb 9 2/2 39.25 No 60 3 0 | | 3 3 0 | +-----------------------------------------------------------------------------+ .......
Cree la GPU (GI) de instancias múltiples y las instancias informáticas (CI) asociadas que desee. Puede crear estas instancias especificando el nombre del perfil completo o abreviado, el ID del perfil o una combinación de ambos. Para obtener más información, consulte Creación de instancias de GPU .
El siguiente ejemplo crea dos instancias de GPU
MIG 3g.20gb
utilizando el ID del perfil (9
).También se especifica el indicador
-C
, que crea las instancias informáticas asociadas para el perfil requerido.sudo nvidia-smi mig -cgi 9,9 -C
Verifique que se hayan creado las dos GPU de instancias múltiples:
sudo nvidia-smi mig -lgi
Compruebe que se hayan creado tanto las IG como los CI correspondientes.
sudo nvidia-smi
El resultado es similar al siguiente:
+-----------------------------------------------------------------------------+ | NVIDIA-SMI 525.125.06 Driver Version: 525.125.06 CUDA Version: 12.0 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 NVIDIA H100 80G... Off | 00000000:04:00.0 Off | On | | N/A 33C P0 70W / 700W | 39MiB / 81559MiB | N/A Default | | | | Enabled | +-------------------------------+----------------------+----------------------+ | 1 NVIDIA H100 80G... Off | 00000000:05:00.0 Off | On | | N/A 32C P0 69W / 700W | 39MiB / 81559MiB | N/A Default | | | | Enabled | +-------------------------------+----------------------+----------------------+ ...... +-----------------------------------------------------------------------------+ | MIG devices: | +------------------+----------------------+-----------+-----------------------+ | GPU GI CI MIG | Memory-Usage | Vol| Shared | | ID ID Dev | BAR1-Usage | SM Unc| CE ENC DEC OFA JPG| | | | ECC| | |==================+======================+===========+=======================| | 0 1 0 0 | 19MiB / 40192MiB | 60 0 | 3 0 3 0 3 | | | 0MiB / 65535MiB | | | +------------------+----------------------+-----------+-----------------------+ | 0 2 0 1 | 19MiB / 40192MiB | 60 0 | 3 0 3 0 3 | | | 0MiB / 65535MiB | | | +------------------+----------------------+-----------+-----------------------+ ...... +-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| | No running processes found | +-----------------------------------------------------------------------------+
- Obtenga más información sobre las plataformas GPU .
- Agregue SSD locales a sus instancias . Los dispositivos SSD locales se combinan bien con las GPU cuando sus aplicaciones requieren almacenamiento de alto rendimiento.
- Instale los controladores de la GPU .
- Si habilitó una estación de trabajo virtual NVIDIA RTX, instale un controlador para la estación de trabajo virtual .
- Para gestionar el mantenimiento del host de GPU, consulte Manejo de eventos de mantenimiento del host de GPU .
REST
Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporcionas a la CLI de gcloud.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Para obtener más información, consulta Autentica para usar REST en la documentación de autenticación de Google Cloud .
Roles requeridos
Para obtener los permisos que necesita para crear máquinas virtuales, solicite a su administrador que le otorgue la función de IAM Compute Instance Admin (v1) (
roles/compute.instanceAdmin.v1
) en el proyecto. Para obtener más información sobre cómo otorgar roles, consulte Administrar el acceso a proyectos, carpetas y organizaciones .Esta función predefinida contiene los permisos necesarios para crear máquinas virtuales. Para ver los permisos exactos que se requieren, expanda la sección Permisos requeridos :
Permisos requeridos
Se requieren los siguientes permisos para crear máquinas virtuales:
Es posible que también pueda obtener estos permisos con roles personalizados u otros roles predefinidos .
Cree una máquina virtual que tenga GPU conectadas
Puede crear una máquina virtual optimizada para acelerador A3 High, A3 Mega, A3 Edge, A2 o G2 mediante la consola de Google Cloud, la CLI de Google Cloud o REST.
Para realizar algunas personalizaciones en sus máquinas virtuales G2, es posible que necesite utilizar la CLI o REST de Google Cloud. Ver limitaciones de G2 .
Consola
nube de gcloud
Para crear e iniciar una VM, use el comando
gcloud compute instances create
con las siguientes marcas. Las máquinas virtuales con GPU no pueden migrar en vivo; asegúrese de configurar el indicador--maintenance-policy=TERMINATE
.Los siguientes indicadores opcionales se muestran en el comando de ejemplo:
Reemplace lo siguiente:gcloud compute instances create VM_NAME \ --machine-type=MACHINE_TYPE \ --zone=ZONE \ --boot-disk-size=DISK_SIZE \ --image=IMAGE \ --image-project=IMAGE_PROJECT \ --maintenance-policy=TERMINATE \ [--provisioning-model=SPOT] \ [--accelerator=type=nvidia-l4-vws,count=VWS_ACCELERATOR_COUNT]
DESCANSAR
Envíe una solicitud POST al método
instances.insert
. Las máquinas virtuales con GPU no pueden migrar en vivo; asegúrese de configurar el parámetroonHostMaintenance
enTERMINATE
. Reemplace lo siguiente:POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instances { "machineType": "projects/PROJECT_ID/zones/ZONE/machineTypes/MACHINE_TYPE", "disks": [ { "type": "PERSISTENT", "initializeParams": { "diskSizeGb": "DISK_SIZE", "sourceImage": "SOURCE_IMAGE_URI" }, "boot": true } ], "name": "VM_NAME", "networkInterfaces": [ { "network": "projects/PROJECT_ID/global/networks/NETWORK" } ], "scheduling": { "onHostMaintenance": "terminate", ["automaticRestart": true] }, }
Instalar controladores
Para que la VM utilice la GPU, debe instalar el controlador de la GPU en su VM .
Ejemplos
En estos ejemplos, la mayoría de las máquinas virtuales se crean mediante la CLI de Google Cloud. Sin embargo, también puedes usar la consola de Google Cloud o REST para crear estas máquinas virtuales.
Los siguientes ejemplos muestran cómo crear máquinas virtuales utilizando las siguientes imágenes:
COS (A3 borde/alto)
Puede crear máquinas virtuales
a3-edgegpu-8g
oa3-highgpu-8g
que tengan GPU H100 conectadas mediante imágenes optimizadas para contenedores (COS) .Para obtener instrucciones detalladas sobre cómo crear estas máquinas virtuales
a3-edgegpu-8g
oa3-highgpu-8g
que usan sistema operativo optimizado para contenedores, consulte Crear una máquina virtual A3 con GPUDirect-TCPX habilitado .Imagen pública del sistema operativo (G2)
Puedes crear máquinas virtuales que tengan GPU conectadas que utilicen una imagen pública que esté disponible en Compute Engine o una imagen personalizada .
Para crear una máquina virtual utilizando la imagen más reciente y no obsoleta de Rocky Linux 8 optimizada para Google Cloud familia de imágenes que utiliza el tipo de máquina
g2-standard-8
y tiene una estación de trabajo virtual NVIDIA RTX, complete los siguientes pasos:Imagen DLVM (A2)
Usar imágenes DLVM es la forma más sencilla de comenzar porque estas imágenes ya tienen los controladores NVIDIA y las bibliotecas CUDA preinstalados.
Estas imágenes también proporcionan optimizaciones de rendimiento.
Las siguientes imágenes DLVM son compatibles con NVIDIA A100:
Para obtener más información sobre las imágenes DLVM que están disponibles y los paquetes instalados en las imágenes, consulte la documentación de Deep Learning VM .
GPU de instancias múltiples (solo máquinas virtuales A3 y A2)
Una GPU de instancias múltiples divide una única GPU NVIDIA H100 o A100 dentro de la misma máquina virtual en hasta siete instancias de GPU independientes. Se ejecutan simultáneamente, cada uno con su propia memoria, caché y multiprocesadores de streaming. Esta configuración permite que la GPU NVIDIA H100 o A100 ofrezca calidad de servicio (QoS) garantizada con una utilización hasta 7 veces mayor en comparación con los modelos de GPU anteriores.
Puede crear hasta siete GPU de instancias múltiples. Para las GPU A100 de 40 GB, a cada GPU de instancias múltiples se le asignan 5 GB de memoria. Con las GPU A100 de 80 GB y H100 de 80 GB, la memoria asignada se duplica a 10 GB cada una.
Para obtener más información sobre el uso de GPU de instancias múltiples, consulte la Guía del usuario de GPU de instancias múltiples de NVIDIA .
Para crear GPU de instancias múltiples, complete los siguientes pasos:
¿Qué sigue?
A menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-04-17 (UTC).
-