Este documento describe cómo crear un grupo de instancias administrado (MIG) con instancias de máquinas virtuales (VM) que tienen GPU conectadas. Describe cómo agregar máquinas virtuales con GPU todas a la vez en el grupo mediante solicitudes de cambio de tamaño . Para crear una solicitud de cambio de tamaño en un MIG que pueda utilizar las funciones y servicios disponibles en Cluster Director, consulte Crear un MIG y una solicitud de cambio de tamaño en la documentación de AI Hypercomputer.
El uso de una solicitud de cambio de tamaño mejora la obtención de máquinas virtuales con GPU en un MIG. En la solicitud, especifique la cantidad de máquinas virtuales con GPU y la duración durante la cual desea ejecutar esas máquinas virtuales. Dynamic Workload Scheduler (DWS) , el mecanismo de programación subyacente, programa las solicitudes de cambio de tamaño creadas en Compute Engine en función de la duración solicitada y la disponibilidad de recursos. Cuando los recursos están disponibles, el MIG crea automáticamente las máquinas virtuales.
Si el trabajo que se ejecuta en estas máquinas virtuales finaliza antes de la duración solicitada, puede eliminar esas máquinas virtuales. De lo contrario, el MIG elimina automáticamente las VM cuando finaliza la duración.
También puedes leer sobre otros escenarios básicos para crear un MIG .
Antes de comenzar
- Para asegurarse de tener suficiente cuota de GPU para los recursos que solicita, verifique su cuota de GPU .
- Para comprender el consumo de cuotas, lea Máquinas virtuales con GPU y cuotas de asignación interrumpibles .
- Si aún no lo has hecho, configura la autenticación. La autenticación es el proceso mediante el cual se verifica su identidad para acceder a Google Cloud servicios y API. Para ejecutar código o muestras desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
- Set a default region and zone.
Cree una plantilla de instancia , que es necesaria para crear un MIG. El MIG crea cada VM en el grupo según la plantilla de instancia. En la plantilla, especifique la configuración para las máquinas virtuales con GPU y las configuraciones adicionales necesarias para utilizar solicitudes de cambio de tamaño.
Para obtener más información sobre las plantillas de instancias, consulte Acerca de las plantillas de instancias .
Cree un MIG y una solicitud de cambio de tamaño para agregar máquinas virtuales con GPU todas a la vez.
Vaya a la página de plantillas de instancia .
Haga clic en Crear plantilla de instancia .
En el campo Nombre , ingrese un nombre para la plantilla de instancia.
En la sección Configuración de la máquina , haga lo siguiente:
- Haga clic en la pestaña GPU .
- En la lista de tipos de GPU , seleccione el tipo de GPU.
- En la lista Número de GPU , seleccione la cantidad de GPU.
- En la lista Tipo de máquina , seleccione un tipo de máquina.
Opcional: Para cambiar el tipo o imagen del disco de inicio del valor predeterminado, en la sección Disco de inicio , haga clic en Cambiar . Luego, siga las indicaciones para cambiar el disco de arranque.
Expanda la sección Opciones avanzadas y luego haga lo siguiente:
- Expanda la sección Gestión .
- En la lista de Reservas , seleccione No usar .
Haga clic en Crear .
-
INSTANCE_TEMPLATE_NAME
: el nombre de la plantilla de instancia. -
MACHINE_TYPE
: un tipo de máquina que admite GPU . Si especifica un tipo de máquina N1, incluya el indicador--accelerator
para especificar la cantidad y el tipo de GPU que se conectarán a sus máquinas virtuales. -
PROJECT_ID
: el ID del proyecto en el que quieres crear el MIG. -
INSTANCE_TEMPLATE_NAME
: el nombre de la plantilla de instancia. -
MACHINE_TYPE
: un tipo de máquina que admite GPU . Si especifica un tipo de máquina N1, incluya el campoguestAccelerators
para especificar la cantidad y el tipo de GPU que se conectarán a sus máquinas virtuales. Vaya a la página de grupos de instancias .
Haz clic en Crear grupo de instancias .
Ingrese los siguientes campos:
- Nombre : Introduzca un nombre para el grupo.
- Plantilla de instancia : seleccione la plantilla de instancia que configuró en la sección anterior.
- En la sección Ubicación :
- Seleccione Zona única .
- En las listas Región y Zona , seleccione la ubicación donde desea crear el grupo.
El campo Número de instancias se habilitará para editar después de eliminar la configuración de escalado automático y desactivar las reparaciones en los siguientes pasos.
Elimine la configuración de escalado automático de la siguiente manera:
- En la sección Escala automática , haga clic en la lista Modo de escala automática y luego haga clic en Eliminar configuración de escala automática .
- ¿En la configuración de eliminación de escalado automático? cuadro de diálogo, haga clic en Eliminar .
Desactive las reparaciones en el MIG de la siguiente manera:
En la sección Ciclo de vida de la instancia de VM , establezca el campo Acción predeterminada en caso de error en Sin acción .
Especifique la cantidad de máquinas virtuales con GPU y la duración de la ejecución para crear una solicitud de cambio de tamaño:
En el campo Número de instancias , ingrese la cantidad de máquinas virtuales con GPU que desea crear todas a la vez.
Seleccione la casilla Usar solicitud de cambio de tamaño para crear máquinas virtuales todas a la vez . Aparecen los campos para ingresar la duración de la ejecución.
En el campo Duración de ejecución solicitada y en la lista Unidad , especifique la duración de ejecución de las máquinas virtuales GPU. La duración debe ser entre 1 hora y 7 días.
Haga clic en Crear .
Cree un MIG zonal mediante el comando
instance-groups managed create
.gcloud compute instance-groups managed create INSTANCE_GROUP_NAME \ --template=INSTANCE_TEMPLATE_NAME \ --size=0 \ --zone=ZONE \ --default-action-on-vm-failure=do_nothing
En el MIG, cree una solicitud de cambio de tamaño utilizando el comando
instance-groups managed resize-requests create
. Especifique la cantidad de máquinas virtuales con GPU que desea y la duración durante la cual desea ejecutar esas máquinas virtuales.gcloud compute instance-groups managed resize-requests create INSTANCE_GROUP_NAME \ --resize-request=RESIZE_REQUEST_NAME \ --resize-by=COUNT \ --requested-run-duration=RUN_DURATION\ --zone=ZONE
-
INSTANCE_GROUP_NAME
: el nombre del MIG. -
INSTANCE_TEMPLATE_NAME
: el nombre de la plantilla de instancia para máquinas virtuales con GPU. -
ZONE
: una de las zonas disponibles para Compute Engine. -
RESIZE_REQUEST_NAME
: el nombre de la solicitud de cambio de tamaño. -
COUNT
: la cantidad de máquinas virtuales que se agregarán todas a la vez en el grupo. -
RUN_DURATION
: la duración que desea que se ejecuten las máquinas virtuales solicitadas. El valor debe tener el formato del número de días, horas, minutos o segundos seguidos ded
,h
,m
ys
respectivamente. Por ejemplo, especifique30m
para 30 minutos o1d2h3m4s
para 1 día, 2 horas, 3 minutos y 4 segundos. El valor debe estar entre 10 minutos y 7 días. Cree un MIG zonal realizando una solicitud
POST
al métodoinstanceGroupManagers.insert
.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers { "versions": [ { "instanceTemplate": "global/instanceTemplates/INSTANCE_TEMPLATE_NAME" } ], "name": "INSTANCE_GROUP_NAME", "targetSize": 0, "instanceLifecyclePolicy": { "defaultActionOnFailure": "DO_NOTHING" } }
En MIG, cree una solicitud de cambio de tamaño realizando una solicitud
POST
al métodoinstanceGroupManagerResizeRequests.insert
. En el cuerpo de la solicitud, especifique la cantidad de máquinas virtuales con GPU que desea crear todas a la vez y la duración que desea ejecutar esas máquinas virtuales.POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/zones/ZONE/instanceGroupManagers/INSTANCE_GROUP_NAME/resizeRequests { "name": "RESIZE_REQUEST_NAME", "resizeBy": COUNT, "requestedRunDuration": { "seconds": "RUN_DURATION" } }
-
PROJECT_ID
: el ID del proyecto en el que quieres crear el MIG. -
INSTANCE_GROUP_NAME
: el nombre del MIG. -
INSTANCE_TEMPLATE_NAME
: el nombre de la plantilla de instancia para máquinas virtuales con GPU. -
ZONE
: una de las zonas disponibles para Compute Engine. -
RESIZE_REQUEST_NAME
: el nombre de la solicitud de cambio de tamaño. -
COUNT
: la cantidad de máquinas virtuales que se agregarán todas a la vez en el grupo. -
RUN_DURATION
: la duración, en segundos, que desea que se ejecuten las VM solicitadas antes de que MIG las elimine automáticamente. El valor debe estar entre600
, que son 600 segundos (10 minutos), y604800
, que son 604.800 segundos (7 días). Aprenda cómo funcionan las solicitudes de cambio de tamaño en un MIG .
Aprenda cómo crear un MIG regional que sea compatible con solicitudes de cambio de tamaño ( Vista previa ).
Aprenda cómo ver, cancelar o eliminar solicitudes de cambio de tamaño en un MIG .
Aprenda a ver información sobre MIG y máquinas virtuales administradas .
REST
Para usar las muestras de la API de REST en esta página en un entorno de desarrollo local, debes usar las credenciales que proporcionas a la CLI de gcloud.
After installing the Google Cloud CLI, initialize it by running the following command:
gcloud init
If you're using an external identity provider (IdP), you must first sign in to the gcloud CLI with your federated identity.
Para obtener más información, consulta Autentica para usar REST en la documentación de autenticación de Google Cloud .
Limitaciones
Revise las limitaciones para crear una solicitud de cambio de tamaño en un MIG.
Cree un MIG y agregue máquinas virtuales GPU todas a la vez
Para crear un MIG y agregar máquinas virtuales GPU todas a la vez en el grupo, haga lo siguiente:
Crear una plantilla de instancia
Cree una plantilla de instancia como se describe en esta sección y luego use la plantilla para crear un MIG .
Consola
nube de gcloud
Cree una plantilla de instancia usando el comando
instance-templates create
.El siguiente comando crea una plantilla de instancia global basada en una imagen de VM de aprendizaje profundo.
gcloud compute instance-templates create INSTANCE_TEMPLATE_NAME \ --machine-type=MACHINE_TYPE \ --image-project=deeplearning-platform-release \ --image-family=common-cu121 \ --maintenance-policy=TERMINATE \ --reservation-affinity=none
Reemplace lo siguiente:
DESCANSAR
Cree una plantilla de instancia realizando una solicitud
POST
al métodoinstanceTemplates.insert
.La siguiente solicitud crea una plantilla de instancia global basada en una imagen de VM de aprendizaje profundo.
POST https://compute.googleapis.com/compute/v1/projects/PROJECT_ID/global/instanceTemplates { "name": "INSTANCE_TEMPLATE_NAME", "properties": { "machineType": "MACHINE_TYPE", "disks": [ { "boot": true, "mode": "READ_WRITE", "type": "PERSISTENT", "initializeParams": { "sourceImage": "projects/deeplearning-platform-release/global/images/family/common-cu121" } } ], "networkInterfaces": [ { "accessConfigs": [ { "name": "external-IP", "type": "ONE_TO_ONE_NAT" } ], "network": "global/networks/default" } ], "reservationAffinity": { "consumeReservationType": "NO_RESERVATION" }, "scheduling": { "onHostMaintenance": "TERMINATE" } } }
Reemplace lo siguiente:
Cree un MIG y agregue máquinas virtuales GPU todas a la vez
Cree un MIG como se describe en esta sección. Para utilizar una solicitud de cambio de tamaño en MIG, no debe configurar el escalado automático y debe desactivar las reparaciones .
Consola
nube de gcloud
Reemplace lo siguiente:
DESCANSAR
Reemplace lo siguiente:
La solicitud de cambio de tamaño que cree permanece en el estado
ACCEPTED
hasta que el MIG cree todas las máquinas virtuales GPU solicitadas. Una vez creadas todas las máquinas virtuales GPU en el grupo, el estado de la solicitud cambia aSUCCEEDED
.¿Qué sigue?
A menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-04-17 (UTC).
-