En este documento se explica cómo crear una solicitud de reserva futura en el modo Calendario. Para obtener más información sobre este tipo de reserva, consulta el artículo Descripción general de las solicitudes de reserva futuras en el modo Calendario.
Crea una solicitud de reserva futura en el modo Calendario para reservar los siguientes recursos durante un máximo de 90 días:
Hasta 80 instancias de máquina virtual (VM) con GPUs conectadas.
Hasta 1024 chips de TPU.
En la fecha y hora de entrega que elijas, podrás crear máquinas virtuales con GPU o TPU consumiendo la capacidad reservada. Usa las solicitudes de reserva futuras en el modo Calendario para obtener recursos de alta demanda para las siguientes cargas de trabajo:
Tareas de entrenamiento previo de modelos
Tareas de ajuste fino de modelos
Cargas de trabajo de simulación de computación de alto rendimiento (HPC)
Aumentos a corto plazo de las cargas de trabajo de inferencia
Si quieres reservar más de 80 VMs con GPU o durante más de 90 días en una sola solicitud, consulta Reservar capacidad en la documentación de AI Hypercomputer.
Limitaciones
En las siguientes secciones se explican las limitaciones de las futuras solicitudes de reserva en el modo Calendario.
Limitaciones de todas las solicitudes
Todas las solicitudes de reserva futuras en el modo Calendario tienen las siguientes limitaciones:
Puedes reservar recursos durante un periodo de entre 1 y 90 días.
Una vez que hayas creado y enviado una solicitud, no podrás cancelarla, eliminarla ni modificarla.
Limitaciones de las solicitudes de máquinas virtuales con GPU
Solo puedes reservar VMs con GPU de las siguientes formas:
Puedes reservar entre 1 y 80 VMs con GPU por solicitud.
Puedes reservar las siguientes series de máquinas:
Solo puedes reservar máquinas virtuales con GPU en zonas específicas.
Limitaciones de las solicitudes de TPUs
Solo puedes reservar TPUs de la siguiente forma:
Puedes reservar 1, 4, 8, 16, 32, 64, 128, 256, 512 o 1024 chips de TPU por solicitud.
Puedes reservar las siguientes versiones de TPU:
Solo puedes reservar 1, 4 u 8 chips de TPU v5e para los tipos de carga de trabajo de servicio (
SERVING
).Solo puedes reservar TPUs en las siguientes zonas:
Para la TPU v6e:
asia-northeast1-b
us-east5-a
us-east5-b
Para la versión 5p de las TPU:
us-east5-a
Para la TPU v5e:
Para los tipos de carga de trabajo por lotes (
BATCH
):us-west4-b
Para los tipos de carga de trabajo de servicio (
SERVING
):us-central1-a
Antes de empezar
- Si no puedes usar las solicitudes de reserva futuras en el modo Calendario, es posible que no cumplas los requisitos para acceder a esta función y usarla. En ese caso, ponte en contacto con el equipo de tu cuenta o con el equipo de Ventas.
- Para compartir tu capacidad reservada con otros proyectos de tu organización, asegúrate de que el proyecto en el que quieras crear futuras solicitudes de reserva en modo Calendario tenga permiso para crear reservas compartidas. De lo contrario, se producirán errores.
-
Si aún no lo has hecho, configura la autenticación.
La autenticación verifica tu identidad para acceder a Google Cloud servicios y APIs. Para ejecutar código o ejemplos desde un entorno de desarrollo local, puedes autenticarte en Compute Engine seleccionando una de las siguientes opciones:
Select the tab for how you plan to use the samples on this page:
Console
When you use the Google Cloud console to access Google Cloud services and APIs, you don't need to set up authentication.
gcloud
-
Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
gcloud init
Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
- Set a default region and zone.
REST
Para usar las muestras de la API REST de esta página en un entorno de desarrollo local, debes usar las credenciales que proporciones a la CLI de gcloud.
Instala Google Cloud CLI. Después de la instalación, inicializa la CLI de Google Cloud ejecutando el siguiente comando:
gcloud init
Si utilizas un proveedor de identidades (IdP) externo, primero debes iniciar sesión en la CLI de gcloud con tu identidad federada.
Para obtener más información, consulta el artículo Autenticarse para usar REST de la documentación sobre autenticación de Google Cloud .
Roles obligatorios
Para obtener los permisos que necesitas para crear una solicitud de reserva futura en el modo de calendario, pide a tu administrador que te conceda el rol de gestión de identidades y accesos Usuario de reserva futura de Compute (
roles/compute.futureReservationUser
) en el proyecto. Para obtener más información sobre cómo conceder roles, consulta el artículo Gestionar el acceso a proyectos, carpetas y organizaciones.Este rol predefinido contiene los permisos necesarios para crear una solicitud de reserva futura en el modo Calendario. Para ver los permisos exactos que se necesitan, despliega la sección Permisos necesarios:
Permisos obligatorios
Para crear una solicitud de reserva futura en el modo Calendario, se necesitan los siguientes permisos:
-
Para crear una solicitud de reserva futura, sigue estos pasos:
compute.futureReservations.create
en el proyecto -
Para permitir que Compute Engine cree reservas automáticamente, haz lo siguiente:
compute.reservations.create
en el proyecto -
Para especificar una plantilla de instancia, siga estos pasos:
compute.instanceTemplates.useReadOnly
en la plantilla de instancia -
Para ver la disponibilidad futura de los recursos, haz lo siguiente:
compute.advice.calendarMode
en el proyecto
También puedes obtener estos permisos con roles personalizados u otros roles predefinidos.
Información general
Para crear una solicitud de reserva futura en el modo Calendario, sigue estos pasos:
Consulta la disponibilidad futura de un recurso. Consulta la disponibilidad futura de las VMs con GPU o las TPUs que quieras reservar. Después, cuando crees una solicitud, especifica el número, el tipo y la duración de la reserva de los recursos que hayas confirmado que están disponibles. Google Cloud es más probable que apruebe tu solicitud si proporcionas esta información.
Crea una solicitud de reserva de máquinas virtuales con GPU o TPUs. Crea y envía una solicitud de reserva futura en modo calendario para máquinas virtuales con GPU o TPUs. Si puedes crear una solicitud correctamente, Google Cloud la aprobará en un minuto.
Ver la disponibilidad futura de un recurso
Para ver la disponibilidad futura de las máquinas virtuales con GPU o las TPUs en una región, sigue estos pasos:
En el caso de las VMs con GPU, hasta 60 días antes
En el caso de las TPUs, hasta 120 días antes
Para ver la disponibilidad futura de las VMs con GPU o TPU en una región, selecciona una de las siguientes opciones:
Consola
Puedes ver la disponibilidad futura de las VMs con GPU o las TPUs en una región al crear una solicitud de reserva futura en el modo de calendario. Para obtener más información, consulta el artículo Crear una solicitud de reserva de VMs con GPU o TPU de este documento.
gcloud
Para ver la disponibilidad futura de las VMs con GPU o TPU en una región, usa uno de los siguientes
gcloud beta compute advice calendar-mode
comandos. En función de los recursos que quieras ver, incluye las siguientes marcas:Para ver la disponibilidad de las VMs con GPU, incluye las marcas
--vm-count
y--machine-type
:gcloud beta compute advice calendar-mode \ --vm-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Para ver la disponibilidad de las TPU, incluye las marcas
--chip-count
y--tpu-version
:gcloud beta compute advice calendar-mode \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --region=REGION \ --start-time-range=from=FROM_START_TIME,to=TO_START_TIME \ --end-time-range=from=FROM_END_TIME,to=TO_END_TIME
Haz los cambios siguientes:
NUMBER_OF_VMS
: número de VMs con GPU que se van a reservar.MACHINE_TYPE
: el tipo de máquina con GPU que se va a reservar.NUMBER_OF_CHIPS
: número de chips de TPU que se van a reservar.TPU_VERSION
: la versión de TPU que se va a reservar. Especifica uno de los siguientes valores:En el caso de la TPU v6e:
V6E
En el caso de la TPU v5p:
V5P
En el caso de las TPU v5e:
V5E
Si especificas una TPU v5e, debes incluir la
--workload-type
marca. Define esta marca en el tipo de cargas de trabajo que quieras ejecutar en las TPUs:En el caso de las cargas de trabajo que gestionan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (ML), especifica
BATCH
.En el caso de las cargas de trabajo que gestionan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de aprendizaje automático, especifica
SERVING
.
REGION
: la región en la que reservar las VMs con GPU o las TPUs. Para comprobar qué regiones y zonas se admiten, consulta la sección Limitaciones de este documento.FROM_START_TIME
yTO_START_TIME
: las fechas más antiguas y más recientes en las que quieres reservar capacidad. Da a estas fechas el formato de marca de tiempo RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSET
Haz los cambios siguientes:
YYYY-MM-DD
: una fecha con el formato de año de cuatro dígitos, mes de dos dígitos y día de dos dígitos, separados por guiones (-
).HH:MM:SS
: hora con el formato de hora de dos dígitos en formato de 24 horas, minutos de dos dígitos y segundos de dos dígitos, separados por dos puntos (:
).OFFSET
: la zona horaria con el formato de una diferencia con respecto al tiempo universal coordinado (UTC). Por ejemplo, para usar la hora estándar del Pacífico (PST), especifica-08:00
. Para no usar ninguna variación, especificaZ
.
FROM_END_TIME
yTO_END_TIME
: las fechas más tempranas y más tardías en las que quieres que finalice tu reserva de capacidad. Estas fechas deben tener el formato de marca de tiempo RFC 3339. Si quieres especificar un intervalo de duraciones para el periodo de reserva en lugar de horas de finalización, sustituye la marca--end-time-range
por la marca--duration-range
.
El resultado debería ser similar al siguiente:
- recommendationsPerSpec: spec: endTime: '2025-09-07T00:00:00Z' location: zones/us-east5-a otherLocations: zones/us-east5-b: details: this machine family is not supported in this zone status: NOT_SUPPORTED zones/us-east5-c: details: this machine family is not supported in this zone status: NOT_SUPPORTED recommendationId: 0d3f005d-f952-4fce-96f2-6af25e1591eb recommendationType: FUTURE_RESERVATION startTime: '2025-06-09T00:00:00Z'
Si los recursos solicitados están disponibles, el resultado contiene los campos
startTime
,endTime
ylocation
. En estos campos se especifican la hora de inicio más temprana, la hora de finalización más tardía y las zonas en las que los recursos están disponibles.REST
Para ver la disponibilidad futura de las VMs con GPU o TPU en una región, haz una solicitud
GET
al método betaadvice.calendarMode
. En función de los recursos que quieras ver, incluye los siguientes campos en el cuerpo de la solicitud:Para ver la disponibilidad de las VMs con GPU, incluya los campos
instanceCount
ymachineType
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "specificSkuResources": { "instanceCount": "NUMBER_OF_VMS", "machineType": "MACHINE_TYPE" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Para ver la disponibilidad de las TPU, incluya los campos
acceleratorCount
yvmFamily
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/regions/REGION/advice/calendarMode { "futureResourcesSpecs": { "spec": { "targetResources": { "aggregateResources": { "acceleratorCount": "NUMBER_OF_CHIPS", "vmFamily": "TPU_VERSION" } }, "timeRangeSpec": { "startTimeNotEarlierThan": "FROM_START_TIME", "startTimeNotLaterThan": "TO_START_TIME", "endTimeNotEarlierThan": "FROM_END_TIME", "endTimeNotLaterThan": "TO_END_TIME" } } } }
Haz los cambios siguientes:
PROJECT_ID
: el ID del proyecto en el que quieres reservar recursos.REGION
: la región en la que quieres reservar VMs con GPUs o TPUs. Para consultar las regiones y zonas admitidas, consulta la sección Limitaciones de este documento.NUMBER_OF_VMS
: número de VMs con GPU que se van a reservar.MACHINE_TYPE
: el tipo de máquina con GPU que se va a reservar.NUMBER_OF_CHIPS
: número de chips de TPU que se van a reservar.TPU_VERSION
: la versión de TPU que se va a reservar. Especifica uno de los siguientes valores:En el caso de la TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
En el caso de la TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
En el caso de las TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si especificas una TPU v5e, en el campo
aggregateResources
debes incluir el campoworkloadType
. Define este campo con el tipo de cargas de trabajo que quieras ejecutar en las TPU:En el caso de las cargas de trabajo que gestionan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (ML), especifica
BATCH
.En el caso de las cargas de trabajo que gestionan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de aprendizaje automático, especifica
SERVING
.
FROM_START_TIME
yTO_START_TIME
: las fechas más antiguas y más recientes en las que quieres reservar capacidad. Da a estas fechas el formato de marca de tiempo RFC 3339:YYYY-MM-DDTHH:MM:SSOFFSET
Haz los cambios siguientes:
YYYY-MM-DD
: una fecha con el formato de año de cuatro dígitos, mes de dos dígitos y día de dos dígitos, separados por guiones (-
).HH:MM:SS
: hora con el formato de hora de dos dígitos en formato de 24 horas, minutos de dos dígitos y segundos de dos dígitos, separados por dos puntos (:
).OFFSET
: la zona horaria con el formato de una diferencia con respecto al tiempo universal coordinado (UTC). Por ejemplo, para usar la hora estándar del Pacífico (PST), especifica-08:00
. Para no usar ninguna variación, especificaZ
.
FROM_END_TIME
yTO_END_TIME
: las fechas más tempranas y más tardías en las que quieres que finalice tu reserva de capacidad. Estas fechas deben tener el formato de marca de tiempo RFC 3339. Si quieres especificar un intervalo de duraciones para el periodo de reserva en lugar de horas de finalización, sustituye los camposendTimeNotEarlierThan
yendTimeNotLaterThan
por los camposminDuration
ymaxDuration
.
El resultado debería ser similar al siguiente:
{ "recommendations": [ { "recommendationsPerSpec": { "spec": { "recommendationId": "a21a2fa0-72c7-4105-8179-88de5409890b", "recommendationType": "FUTURE_RESERVATION", "startTime": "2025-06-09T00:00:00Z", "endTime": "2025-09-07T00:00:00Z", "otherLocations": { "zones/us-east5-b": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" }, "zones/us-east5-c": { "status": "NOT_SUPPORTED", "details": "this machine family is not supported in this zone" } }, "location": "zones/us-east5-a" } } } ] }
Si los recursos solicitados están disponibles, el resultado contiene los campos
startTime
,endTime
ylocation
. En estos campos se especifican la hora de inicio más temprana, la hora de finalización más tardía y las zonas en las que los recursos están disponibles.Crear una solicitud de reserva de máquinas virtuales con GPU o TPUs
Cuando creas una solicitud de reserva futura en el modo Calendario, solo puedes especificar un periodo de reserva de la siguiente forma:
Hora de inicio: en función de los recursos que quiera reservar, debe especificar una hora de inicio que sea al menos uno de los siguientes valores desde el momento en que cree y envíe una solicitud:
En el caso de las VMs con GPU, 87 horas (tres días y 15 horas)
En el caso de las TPUs, seis horas
Hora de finalización: puedes reservar recursos durante un máximo de 90 días.
Para crear una solicitud usando una VM con GPU como referencia, usa laGoogle Cloud consola. De lo contrario, selecciona una de las siguientes opciones:
Consola
En la Google Cloud consola, ve a la página Reservas.
Haz clic en la pestaña Reservas futuras.
Haz clic en
Crear reserva futura. Aparecerá la página Crear una reserva futura y se seleccionará el panel Configuración de hardware.En la sección Configuración, especifique las propiedades de las VMs con GPU o las TPUs que quiera reservar de una de las siguientes formas:
Para especificar directamente las propiedades de la máquina virtual con GPU o TPU, sigue estos pasos:
Selecciona Especificar tipo de máquina.
Haz clic en la pestaña GPUs o TPUs y, a continuación, selecciona el tipo de máquina con GPU o la versión de TPU que quieras reservar.
Para especificar las propiedades de la VM con GPU mediante una plantilla de instancia, seleccione Plantilla de instancia y, a continuación, seleccione la plantilla.
Para especificar las propiedades de la VM con GPU usando una VM como referencia, selecciona Usar VM existente y, a continuación, selecciona la VM.
Si has especificado una TPU v5e (CT5LP) en el paso anterior, en la lista Tipo de carga de trabajo de TPU v5, selecciona una de las siguientes opciones:
Para ejecutar cargas de trabajo en las TPUs que gestionan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático, selecciona Lote.
Para ejecutar cargas de trabajo en las TPUs que gestionan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de aprendizaje automático, selecciona Servicio.
En la sección Buscar capacidad, sigue estos pasos:
En las listas Región y Zona, especifica la región y la zona en las que quieras reservar recursos. Para consultar las regiones y zonas admitidas, ve a la sección Limitaciones de este documento.
En el campo Capacidad total necesaria (al reservar VMs con GPU) o en la lista Número de chips (al reservar TPUs), especifica el número de VMs con GPU o de chips de TPU que quieras reservar.
En la lista Hora de inicio, selecciona la hora de inicio de tu solicitud.
Opcional: En la lista Elige la flexibilidad de la fecha de inicio, selecciona el grado de exactitud que debe tener la fecha de inicio.
En el campo Duración de la reserva, especifica durante cuánto tiempo quieres reservar los recursos.
Haz clic en Buscar capacidad. A continuación, en la tabla Capacidad disponible, selecciona una de las opciones disponibles que contenga el tipo, el número y el periodo de reserva de las VMs con GPU o las TPUs que quieras reservar.
Haz clic en Siguiente.
En la sección Tipo de uso compartido, selecciona los proyectos con los que quieras compartir la capacidad solicitada:
Para usar la capacidad reservada solo en tu proyecto, selecciona Local.
Para compartir la capacidad reservada con otros proyectos, selecciona Compartido, haz clic en
y, a continuación, en Añadir proyectos. Sigue las instrucciones para seleccionar los proyectos.
Haz clic en Siguiente.
En el campo Nombre de la reserva futura, introduce un nombre para la solicitud.
En el campo Nombre de la reserva, introduce el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.
Haz clic en Crear.
gcloud
Para crear una solicitud de reserva futura en el modo Calendario y enviarla para que se revise, usa uno de los siguientes
gcloud beta compute future-reservations create
comandos. En función de los recursos que quieras reservar, incluye las siguientes marcas:Para reservar máquinas virtuales con GPU, incluye las marcas
--total-count
y--machine-type
:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --total-count=NUMBER_OF_VMS \ --machine-type=MACHINE_TYPE \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Para reservar TPUs, incluye las marcas
--chip-count
y--tpu-version
:gcloud beta compute future-reservations create FUTURE_RESERVATION_NAME \ --auto-delete-auto-created-reservations \ --chip-count=NUMBER_OF_CHIPS \ --tpu-version=TPU_VERSION \ --deployment-type=DENSE \ --planning-status=SUBMITTED \ --require-specific-reservation \ --reservation-mode=CALENDAR \ --reservation-name=RESERVATION_NAME \ --share-setting=SHARE_TYPE \ --start-time=START_TIME \ --end-time=END_TIME \ --zone=ZONE
Haz los cambios siguientes:
FUTURE_RESERVATION_NAME
: el nombre de la solicitud.NUMBER_OF_VMS
: número de VMs con GPU que se van a reservar.MACHINE_TYPE
: el tipo de máquina con GPU que se va a reservar.NUMBER_OF_CHIPS
: número de chips de TPU que se van a reservar.TPU_VERSION
: la versión de TPU que se va a reservar. Especifica uno de los siguientes valores:En el caso de la TPU v6e:
V6E
En el caso de la TPU v5p:
V5P
En el caso de las TPU v5e:
V5E
Si especificas una TPU v5e, debes incluir la
--workload-type
marca. Define la marca en el tipo de cargas de trabajo que quieras ejecutar en las TPUs:En el caso de las cargas de trabajo que gestionan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático (ML), especifica
BATCH
.En el caso de las cargas de trabajo que gestionan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de aprendizaje automático, especifica
SERVING
.
RESERVATION_NAME
: el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.SHARE_TYPE
: si otros proyectos de tu organización pueden consumir la capacidad reservada. Especifica uno de los siguientes valores:Para usar la capacidad solo en tu proyecto, haz lo siguiente:
local
Para compartir capacidad con otros proyectos, sigue estos pasos:
projects
Si especificas
projects
, debes incluir la marca--share-with
con una lista de IDs de proyecto separados por comas. Por ejemplo,project-1,project-2
. Puedes especificar hasta 100 proyectos en tu organización. No incluyas el ID de tu proyecto en esta lista. Puedes consumir la capacidad reservada de forma predeterminada.START_TIME
: hora de inicio de la solicitud, con el formato de marca de tiempo RFC 3339.END_TIME
: hora de finalización del periodo de reserva, con formato de marca de tiempo RFC 3339. Si quieres especificar una duración, en segundos, para tu periodo de reserva en lugar de una hora de finalización, sustituye la marca--end-time
por la marca--duration
.ZONE
: la zona en la que quieres reservar recursos.
REST
Para crear una solicitud de reserva futura en el modo de calendario y enviarla para que se revise, envía la siguiente solicitud
POST
al método betafutureReservations.insert
. En función de los recursos que quieras reservar, incluye los siguientes campos en el cuerpo de la solicitud:Para reservar VMs con GPU, incluye los campos
totalCount
ymachineType
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "specificSkuProperties": { "totalCount": NUMBER_OF_VMS, "instanceProperties": { "machineType": "MACHINE_TYPE" } }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Para reservar TPUs, incluye los campos
acceleratorCount
yvmFamily
:POST https://compute.googleapis.com/compute/beta/projects/PROJECT_ID/zones/ZONE/futureReservations { "name": "FUTURE_RESERVATION_NAME", "autoDeleteAutoCreatedReservations": true, "deploymentType": "DENSE", "planningStatus": "SUBMITTED", "reservationMode": "CALENDAR", "reservationName": "RESERVATION_NAME", "shareSettings": { "shareType": "SHARE_TYPE" }, "specificReservationRequired": true, "aggregateReservation": { "reservedResources": [ { "accelerator": { "acceleratorCount": NUMBER_OF_CHIPS } } ], "vmFamily": "TPU_VERSION" }, "timeWindow": { "startTime": "START_TIME", "endTime": "END_TIME" } }
Haz los cambios siguientes:
PROJECT_ID
: el ID del proyecto en el que quieres crear la solicitud.ZONE
: la zona en la que quieres reservar recursos.FUTURE_RESERVATION_NAME
: el nombre de la solicitud.RESERVATION_NAME
: el nombre de la reserva que Compute Engine crea automáticamente para aprovisionar la capacidad solicitada.SHARE_TYPE
: si otros proyectos de tu organización pueden consumir la capacidad reservada. Especifica uno de los siguientes valores:Para usar la capacidad solo en tu proyecto, haz lo siguiente:
LOCAL
Para compartir capacidad con otros proyectos, sigue estos pasos:
SPECIFIC_PROJECTS
Si especifica
SPECIFIC_PROJECTS
, en el camposhareSettings
debe incluir el campoprojectMap
para especificar los proyectos con los que quiere compartir la capacidad. Puedes especificar hasta 100 proyectos en tu organización. No especifiques el ID del proyecto. Puedes usar la capacidad reservada de forma predeterminada.Por ejemplo, para compartir la capacidad solicitada con otros dos proyectos, incluya lo siguiente:
"shareSettings": { "shareType": "SPECIFIC_PROJECTS", "projectMap": { "CONSUMER_PROJECT_ID_1": { "projectId": "CONSUMER_PROJECT_ID_1" }, "CONSUMER_PROJECT_ID_2": { "projectId": "CONSUMER_PROJECT_ID_2" } } }
Sustituye
CONSUMER_PROJECT_ID_1
yCONSUMER_PROJECT_ID_2
por los IDs de dos proyectos a los que quieras permitir que consuman la capacidad solicitada.NUMBER_OF_VMS
: número de VMs con GPU que se van a reservar.MACHINE_TYPE
: el tipo de máquina con GPU que se va a reservar.NUMBER_OF_CHIPS
: número de chips de TPU que se van a reservar.TPU_VERSION
: la versión de TPU que se va a reservar. Especifica uno de los siguientes valores:En el caso de la TPU v6e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT6E
En el caso de la TPU v5p:
VM_FAMILY_CLOUD_TPU_POD_SLICE_CT5P
En el caso de las TPU v5e:
VM_FAMILY_CLOUD_TPU_LITE_POD_SLICE_CT5LP
Si especificas una TPU v5e, en el campo
aggregateResources
debes incluir el campoworkloadType
. Define el campo con el tipo de cargas de trabajo que quieras ejecutar en las TPUs:En el caso de las cargas de trabajo que gestionan grandes cantidades de datos en una o varias operaciones, como las cargas de trabajo de entrenamiento de aprendizaje automático, especifica
BATCH
.En el caso de las cargas de trabajo que gestionan solicitudes simultáneas y requieren una latencia de red mínima, como las cargas de trabajo de inferencia de aprendizaje automático, especifica
SERVING
.
START_TIME
: hora de inicio de la solicitud, con el formato de marca de tiempo RFC 3339.END_TIME
: hora de finalización del periodo de reserva, con formato de marca de tiempo RFC 3339. Si quieres especificar una duración en segundos para tu periodo de reserva en lugar de una hora de finalización, sustituye el campoendTime
por el campoduration
.
Siguientes pasos
Usar una reserva creada automáticamente para VMs con GPU en Compute Engine
Consumir una reserva creada automáticamente para TPUs en TPU de Cloud
Usar una reserva creada automáticamente con tareas de predicción de Vertex AI
Consumir una reserva creada automáticamente mediante tareas de entrenamiento de Vertex AI
A menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-09-12 (UTC).
-