Cuotas y límites de Vertex AI

Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios Google Cloud recursos.

El sistema de cuotas de Cloud hace lo siguiente:

En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.

Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

También hay límites en los recursos de Vertex AI. Estos límites no están relacionados con el sistema de cuotas. Los límites no se pueden cambiar.

Cuotas de frecuencia

Las cuotas que se describen a continuación se aplican a las solicitudes de Vertex AI de un proyecto o región admitidos concretos. Por ejemplo, en un mismo proyecto puedes tener hasta 30.000 solicitudes de inferencia online por minuto en una región y otras 30.000 del mismo tipo por minuto en otra región admitida.

Tipo de solicitud Solicitudes por minuto
Solicitudes de gestión de recursos (CRUD)1 600
Solicitudes de envío de tareas u operaciones de larga duración 60
Solicitudes de inferencia online2 30.000
Rendimiento de solicitudes de inferencia online 1,5 GB
Solicitudes de explicación online 600
Solicitudes de lectura de series temporales de Vertex AI TensorBoard 60.000
Solicitudes de metadatos de aprendizaje automático (CRUD) 12.000
Solicitudes de almacenamiento en caché (CRUD) de IA generativa 200
Solicitudes de Vertex AI Vizier (CRUD) 6000
Solicitudes de servicio online de Vertex AI Feature Store 300.000
Solicitudes de Vertex ML Metadata 12.000
Número de solicitudes de tokens de recuento o de tokens de computación 3000

1Las solicitudes de gestión de recursos incluyen cualquier solicitud que no sea un trabajo, una operación de larga duración, una solicitud de inferencia online, una solicitud de Vertex AI Vizier, una solicitud de metadatos de AA, una solicitud de lectura de la API Timeseries Insights de Vertex AI TensorBoard, una solicitud de Vertex AI Feature Store, una solicitud de streaming de Vertex AI Feature Store o una solicitud de búsqueda vectorial.

2 Esta cuota solo se aplica a los endpoints públicos.

Las tareas u operaciones de larga duración incluyen las siguientes solicitudes:

  • Crea o elimina un conjunto de datos.
  • Importar o exportar datos a un conjunto de datos o desde él.
  • Crea un endpoint.
  • Crea o elimina una tarea personalizada.
  • Crear o eliminar una tarea de etiquetado de datos.
  • Crea o elimina una tarea de ajuste de hiperparámetros.
  • Crea o elimina una tarea de inferencia por lotes.
  • Crea o elimina un modelo.
  • Subir, eliminar o exportar un modelo.
  • Crea o elimina una plantilla de tiempo de ejecución de cuaderno.
  • Asigna, elimina, inicia o actualiza un entorno de ejecución de un cuaderno.
  • Crea, elimina o actualiza un monitor de modelo.
  • Crea o elimina una tarea de monitorización de modelos.


Para obtener información sobre las cuotas de los modelos de IA generativa, consulta Cuotas y límites de la IA generativa en Vertex AI.

Cuotas de modelos de AutoML

Las siguientes cuotas se aplican a todos los objetivos y tipos de datos de un proyecto o región concretos. Por ejemplo, en un proyecto o región determinados, puedes desplegar 10 modelos de clasificación de imágenes de AutoML y 10 modelos de detección de objetos de imágenes de AutoML, lo que da lugar a un total de 20 modelos desplegados.

Imagen

Clasificación

Cuota Valor
Tareas de entrenamiento simultáneas 5
Tareas de entrenamiento simultáneas con Explainable AI 2
Tareas de inferencia por lotes simultáneas 5
Tareas de implementación de modelos simultáneas 5
Tareas simultáneas de anulación del despliegue de modelos 5
Número de modelos desplegados 10

Detección de objetos

Cuota Valor
Tareas de entrenamiento simultáneas 5
Tareas de inferencia por lotes simultáneas 5
Número de modelos desplegados 10

Contenido tabular

Cuota Valor
Tareas de entrenamiento simultáneas 5
Tareas de inferencia por lotes simultáneas 5
Número de modelos desplegados 30

Registro de modelos de Vertex AI

El tamaño máximo de modelo admitido por el registro de modelos de Vertex AI es de 1 TB.

Límites de modelos de AutoML

Los siguientes límites se aplican a todos los tipos de datos de un proyecto o región concretos. Por ejemplo, en un proyecto y una región concretos, puedes incluir un máximo de 1.000.000 de imágenes en la entrada de una solicitud en lote.

Imagen

Tipo de límite Valor
Tamaño de archivo de imagen Máximo: 30 MB
Imágenes por conjunto de datos Máximo: 1.000.000
Etiquetas por conjunto de datos Mínimo: 2
Máximo: 5000
Imágenes por etiqueta Mínimo: 10
Recomendado: 1000
Tamaño de archivo CSV de la entrada por lotes Máximo: 100 MB
Número de imágenes de la entrada en lote Máximo: 1.000.000

Tabular

Tipo de límite Valor
Tamaño máximo 100 GB
Número de filas Entre 1000 y 100.000.000 filas
Número de columnas Entre 2 y 1000 columnas
Número de importaciones de conjuntos de datos que se ejecutan simultáneamente 5 importaciones
Tamaño del archivo CSV Máximo: 10 GB por archivo, hasta un total de 100 GB

Vídeo

Tipo de límite Valor
Duración máxima de vídeo 3 horas
Tamaño máximo de archivo de vídeo 50 GB
Etiquetas mínimas por conjunto de datos 2
Vídeos mínimos por etiqueta 10 (el valor recomendado es 1000)
Tamaño de archivo CSV de la entrada por lotes Máximo: 100 MB
Número de segmentos de vídeo de la entrada por lotes Máximo: 1000

Cuotas de modelos entrenados personalizados

Las siguientes cuotas se aplican a los modelos entrenados personalizados de Vertex AI de un proyecto o región concretos.

Formación

Cuota Valor
Flujos de procesamiento de entrenamiento personalizados simultáneos 2000
Número de CPU N1 y E2 para el entrenamiento por región
RegiónValor
us-west1 2200
us-west2 20
us-west3 2200
us-west4 20
us-central1 2200
us-east1 2200
us-east4 20
us-east5 450
us-south1 450
northamerica-northeast1 2200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2200
europe-west1 2200
europe-west4 2200
europe-west6 20
europe-west3 2200
europe-north1 20
europe-central2 450
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 2200
asia-south2 20
asia-southeast1 2200
asia-southeast2 2200
asia-east2 2200
asia-east1 2200
asia-northeast1 2200
asia-northeast2 20
australia-southeast1 2200
australia-southeast2 20
asia-northeast3 2200
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Número de CPU N2 para el entrenamiento por región
RegiónValor
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-south2 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Número de CPU M1 para el entrenamiento por región
RegiónValor
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-east5 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1 0
europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1 0
asia-south1 0
asia-south2 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
me-central1 0
me-central2 0
europe-west12 0
africa-south1 0
Número de CPU C2 para el entrenamiento por región
RegiónValor
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1 20
europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1 20
asia-south1 20
asia-south2 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 20
me-central2 20
europe-west12 20
africa-south1 20
Número de CPU A2 para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 Ilimitado
us-east1 Ilimitado
us-east4 Ilimitado
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 Ilimitado
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 Ilimitado
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 Ilimitado
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de CPU A3 simultáneas para el entrenamiento por región
RegiónValor
us-west1 Ilimitado
us-west2 Ilimitado
us-west3 Ilimitado
us-west4 Ilimitado
us-central1 Ilimitado
us-east1 Ilimitado
us-east4 Ilimitado
us-east5 Ilimitado
us-south1 Ilimitado
northamerica-northeast1 Ilimitado
northamerica-northeast2 Ilimitado
southamerica-east1 Ilimitado
southamerica-west1 Ilimitado
europe-west2 Ilimitado
europe-west1 Ilimitado
europe-west4 Ilimitado
europe-west6 Ilimitado
europe-west3 Ilimitado
europe-north1 Ilimitado
europe-central2 Ilimitado
europe-west8 Ilimitado
europe-west9 Ilimitado
europe-southwest1 Ilimitado
asia-south1 Ilimitado
asia-south2 Ilimitado
asia-southeast1 Ilimitado
asia-southeast2 Ilimitado
asia-east2 Ilimitado
asia-east1 Ilimitado
asia-northeast1 Ilimitado
asia-northeast2 Ilimitado
australia-southeast1 Ilimitado
australia-southeast2 Ilimitado
asia-northeast3 Ilimitado
me-west1 Ilimitado
me-central1 Ilimitado
me-central2 Ilimitado
europe-west12 Ilimitado
africa-south1 Ilimitado
Número de GPUs H200 simultáneas para el entrenamiento por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 8
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 0
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 8
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPU P4 para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 6
us-west3 No disponible
us-west4 No disponible
us-central1 6
us-east1 No disponible
us-east4 1
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 6
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 6
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 6
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 6
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPU T4 para el entrenamiento por región
RegiónValor
us-west1 2
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 12
us-east1 2
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 6
europe-west1 No disponible
europe-west4 2
europe-west6 No disponible
europe-west3 0
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 6
asia-south2 No disponible
asia-southeast1 1
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 6
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 1
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs L4 para el entrenamiento por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 0
us-east4 0
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 0
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 0
asia-south2 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 0
me-west1 No disponible
me-central1 No disponible
me-central2 0
europe-west12 No disponible
africa-south1 No disponible
Número de GPU P100 para el entrenamiento por región
RegiónValor
us-west1 30
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 56
us-east1 30
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 30
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 30
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 6
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs V100 para el entrenamiento por región
RegiónValor
us-west1 6
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 6
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 6
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 6
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs A100 para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 8
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 8
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 8
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPU A100 de 80 GB simultáneas para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 0
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible

Para obtener más información, consulta Ver y gestionar cuotas.

Número de GPUs H100 simultáneas para el entrenamiento por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 0
us-east5 0
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 0
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPU B200 simultáneas para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs GB200 simultáneas para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs H100 Mega simultáneas para el entrenamiento por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 0
us-central1 0
us-east1 No disponible
us-east4 0
us-east5 0
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 0
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 0
asia-northeast2 No disponible
australia-southeast1 0
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible

Para obtener más información, consulta Ver y gestionar cuotas.

Número de núcleos de TPU V2 para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 0
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de núcleos de pods de TPU V2 para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 No disponible
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de núcleos de TPU V3 para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 0
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de núcleos de pods de TPU V3 para el entrenamiento por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 No disponible
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Uso de HDD (GB) durante el entrenamiento, por región
RegiónValor
us-west1 180.000
us-west2 3600
us-west3 180.000
us-west4 3600
us-central1 180.000
us-east1 180.000
us-east4 3600
us-east5 3600
us-south1 180.000
northamerica-northeast1 180.000
northamerica-northeast2 3600
southamerica-east1 3600
southamerica-west1 3600
europe-west2 180.000
europe-west1 180.000
europe-west4 180.000
europe-west6 3600
europe-west3 180.000
europe-north1 3600
europe-central2 180.000
europe-west8 3600
europe-west9 180.000
europe-southwest1 3600
asia-south1 180.000
asia-south2 3600
asia-southeast1 180.000
asia-southeast2 180.000
asia-east2 180.000
asia-east1 180.000
asia-northeast1 180.000
asia-northeast2 3600
australia-southeast1 180.000
australia-southeast2 3600
asia-northeast3 180.000
me-west1 180.000
me-central1 3600
me-central2 3600
europe-west12 3600
africa-south1 3600
Uso de SSD (GB) durante el entrenamiento, por región
RegiónValor
us-west1 75.000
us-west2 450
us-west3 75.000
us-west4 450
us-central1 75.000
us-east1 75.000
us-east4 450
us-east5 450
us-south1 75.000
northamerica-northeast1 75.000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75.000
europe-west1 75.000
europe-west4 75.000
europe-west6 450
europe-west3 75.000
europe-north1 450
europe-central2 75.000
europe-west8 450
europe-west9 75.000
europe-southwest1 450
asia-south1 75.000
asia-south2 450
asia-southeast1 75.000
asia-southeast2 75.000
asia-east2 75.000
asia-east1 75.000
asia-northeast1 75.000
asia-northeast2 450
australia-southeast1 75.000
australia-southeast2 450
asia-northeast3 75.000
me-west1 75.000
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Uso de Hyperdisk Balanced (GB) durante el entrenamiento, por región
RegiónValor
us-west1 75.000
us-west2 450
us-west3 450
us-west4 450
us-central1 75.000
us-east1 450
us-east4 75.000
us-east5 450
us-south1 75.000
northamerica-northeast1 450
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 450
europe-west1 75.000
europe-west4 75.000
europe-west6 450
europe-west3 450
europe-north1 450
europe-central2 450
europe-west8 450
europe-west9 450
europe-southwest1 450
asia-south1 75.000
asia-south2 450
asia-southeast1 450
asia-southeast2 450
asia-east2 450
asia-east1 450
asia-northeast1 450
asia-northeast2 450
australia-southeast1 450
australia-southeast2 450
asia-northeast3 450
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450

sirviendo

Cuota Valor
Número de réplicas de modelos personalizados desplegadas 100
Número de CPUs para el servicio, por región
RegiónValor
us-west1 2200
us-west2 2200
us-west3 2200
us-west4 16
us-central1 2200
us-east1 2200
us-east4 2200
us-east5 16
us-south1 450
northamerica-northeast1 2200
northamerica-northeast2 450
southamerica-east1 2200
southamerica-west1 450
europe-west2 2200
europe-west1 2200
europe-west4 2200
europe-west6 2200
europe-west3 2200
europe-north1 16
europe-central2 450
europe-west8 16
europe-west9 16
europe-southwest1 16
asia-south1 2200
asia-south2 16
asia-southeast1 2200
asia-southeast2 2200
asia-east2 2200
asia-east1 2200
asia-northeast1 2200
asia-northeast2 16
australia-southeast1 2200
australia-southeast2 16
asia-northeast3 2200
me-west1 450
me-central1 16
me-central2 16
europe-west12 16
africa-south1 16
Número de GPUs H200 simultáneas para el servicio, por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 0
us-east5 No disponible
us-south1 8
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 0
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 8
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPU P100 para el servicio, por región
RegiónValor
us-west1 30
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 56
us-east1 30
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 30
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 30
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs P4 para el servicio, por región
RegiónValor
us-west1 No disponible
us-west2 6
us-west3 No disponible
us-west4 No disponible
us-central1 6
us-east1 No disponible
us-east4 6
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 6
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 6
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 6
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 6
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs T4 para el servicio, por región
RegiónValor
us-west1 12
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 12
us-east1 12
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 12
europe-west1 No disponible
europe-west4 12
europe-west6 No disponible
europe-west3 0
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 6
asia-south2 No disponible
asia-southeast1 6
asia-southeast2 No disponible
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 6
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs L4 para el servicio, por región
RegiónValor
us-west1 28
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 28
us-east1 28
us-east4 28
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 28
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 28
asia-northeast1 28
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs V100 para el servicio, por región
RegiónValor
us-west1 6
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 6
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 6
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs A100 para el servicio, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 14
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 14
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 14
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 14
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 14
me-west1 1
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs A100 de 80 GB para el servicio, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 1
us-east1 No disponible
us-east4 1
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 1
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 1
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPU B200 simultáneas para el servicio, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs GB200 simultáneas para el servicio, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de GPUs H100 para el servicio, por región
RegiónValor
us-west1 8
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 16
us-east1 No disponible
us-east4 0
us-east5 16
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 16
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 16
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de mega-GPUs H100 para el servicio, por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 0
us-central1 0
us-east1 No disponible
us-east4 0
us-east5 0
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 0
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 0
asia-northeast2 No disponible
australia-southeast1 0
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de chips de TPU v5e para el servicio, por región
RegiónValor
us-west1 4
us-west2 No disponible
us-west3 No disponible
us-west4 0
us-central1 32
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 32
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 32
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 32
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Número de chips de TPU v6e para el servicio, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 No disponible
us-east1 0
us-east4 No disponible
us-east5 0
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 8
europe-west6 No disponible
europe-west3 No disponible
europe-north1 No disponible
europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1 No disponible
asia-south1 No disponible
asia-south2 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 0
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible

Límites de modelos con entrenamiento personalizado

Los siguientes límites se aplican a los modelos con entrenamiento personalizado de Vertex AI de un proyecto o región concretos.

sirviendo

Límite Valor
Número de réplicas por proyecto 200
Número de contenedores por clúster 25.000

Vertex AI Feature Store

En esta sección se indican las cuotas y los límites de los siguientes elementos:

Vertex AI Feature Store

Las siguientes cuotas se aplican a un proyecto y una región concretos. Por ejemplo, en un mismo proyecto, puedes tener 200 nodos de entrega online en us-central1 y otros 50 nodos en us-east4.

Cuota Valor
Solicitudes de servicio online por minuto 300.000
Número máximo de instancias de FeatureOnlineStore 10
Número máximo de solicitudes de búsqueda por minuto 6.000.000
Número máximo de nodos de entrega online en todas las instancias de FeatureOnlineStore optimizadas del proyecto 80
Número máximo de instancias de FeatureView en todas las instancias de FeatureOnlineStore 30

Vertex AI Feature Store también tiene los siguientes límites. No puedes solicitar un aumento de ninguno de los límites de la siguiente tabla:

Límite Valor
Número máximo de recursos FeatureGroup en un proyecto y una ubicación 250
Número máximo de recursos Feature en un FeatureGroup 10.000
Tamaño máximo de los datos de características por entidad 5 MB
Número de IDs de entidad por solicitud de publicación online (FetchFeatureValues) 1
Longitud máxima de un ID de entidad 4076 caracteres
Límite de almacenamiento de un nodo de entrega online optimizada 200 GB

Vertex AI Feature Store (antigua)

Las siguientes cuotas se aplican a un proyecto y una región concretos. Por ejemplo, en un solo proyecto, puedes tener 75 tareas por lotes simultáneas en us-central1 y otras 75 tareas en europe-west4.

Cuota Valor
Solicitudes de servicio online por minuto 300.000
Solicitudes de ingestión de streaming por minuto 60.000
Rendimiento de escritura de la ingestión en streaming por minuto 1,2 GB
Solicitudes de creación de funciones por minuto 100
Nodos de entrega online en todos los almacenes de características 30
Tareas por lotes simultáneas (ingestión, publicación y eliminación de valores de características combinadas) 75
Solicitudes simultáneas para eliminar valores de características 1
Tipos de entidades de todas las feature stores 75

Vertex AI Feature Store (antigua) también tiene los siguientes límites. No puedes solicitar un aumento de ninguno de los límites de la siguiente tabla:

Límite Valor
Límite de almacenamiento de un nodo de entrega online 5 TB
Total de datos en el almacenamiento sin conexión Ilimitado
Funciones por tipo de entidad 5000
Número de solicitudes de creación, actualización y eliminación de almacenes de características por día, proyecto y región 500
En el caso de la ingesta de datos en streaming, el tamaño por solicitud 1 MB
En la lectura de streaming, el número de entidades que se pueden incluir por solicitud 100
En el caso de la importación en lote, el número de archivos que se pueden incluir por solicitud 5000 para Avro o 500 para CSV
Para las solicitudes de servicio y las exportaciones en lote, el número de funciones que puedes solicitar 5000
En la ingestión por lotes y en la ingestión en streaming, la marca de tiempo más antigua para la que se pueden ingerir datos de características. 4000 días a partir de la fecha actual

El límite de conservación de datos en Vertex AI Feature Store (antigua) tiene el siguiente valor predeterminado, que puedes anular:

Valores predeterminados de conservación de datos Valor predeterminado
Conservación de datos en la tienda sin conexión (marca de tiempo del valor de la función más antiguo a partir del cual se eliminan los valores) 4000 días a partir de la fecha actual
Conservación de datos en la tienda online (la marca de tiempo del valor de la función más antiguo después del cual se eliminan los valores) 4000 días a partir de la fecha actual

Puede anular el límite de conservación de datos de las siguientes formas:

  • Para anular el límite de conservación de datos de la tienda online, defina el parámetro online_storage_ttl_days al crear o actualizar un almacén de características.

  • Para anular el límite de retención de datos de la tienda offline, defina el parámetro offline_storage_ttl_days al crear o actualizar un tipo de entidad.

.

Las cuotas que se describen a continuación se aplican a Vector Search de un proyecto concreto en cada región.

Cuota Valor
Operaciones de creación de índices simultáneas 5
Operaciones de actualización de índices simultáneas 5
Número de nodos de índice desplegados 50
Número de nodos N2D de índice desplegados 5
Número de índices 100
Solicitudes de actualización de streaming por minuto 6000
Rendimiento de actualización de streaming(en KB) por minuto 120.000

Vertex ML Metadata

Los siguientes límites se aplican a Vertex ML Metadata de un proyecto concreto en cada región.

Límite Valor
Tamaño máximo serializado del campo de metadatos de un recurso 204.800 bytes
Tamaño máximo serializado de los esquemas de metadatos 204.800 bytes

Vertex AI Pipelines

Las siguientes cuotas y límites se aplican a Vertex AI Pipelines en un proyecto concreto de cada región.

Cuota Valor
Ejecutar tareas de flujo de trabajo en paralelo* 600
Ejecuciones simultáneas de flujos de procesamiento* 300

* Las solicitudes de ejecución de flujos de trabajo y de tareas que superen este límite se pondrán en cola hasta que haya recursos disponibles.

Vertex AI Pipelines tiene los siguientes límites. Ten en cuenta que, a diferencia de las cuotas, no puedes solicitar un aumento de un límite.

Límite Valor
Número de tareas de flujo de procesamiento por trabajo 10.000
Artefactos de entrada y salida por tarea de flujo de procesamiento 100
Artefactos de entrada y salida por trabajo de flujo de procesamiento 10.000
Tamaño máximo de la carga útil de JSON que contiene parámetros de salida y artefactos por tarea de la canalización 131.072 bytes
Tiempo máximo de ejecución de una tarea de una canalización** 7 días

* Las tareas de la canalización que superen este límite se cancelarán.

Cuotas y límites de Colab Enterprise

Las cuotas y los límites de Colab Enterprise se indican por separado. Consulta las cuotas y los límites de Colab Enterprise.

Aumento de la cuota

Si quieres aumentar alguna de tus cuotas de Vertex AI, puedes solicitarlo a través de la Google Cloud consola.

Para obtener más información sobre cómo enviar una solicitud de aumento de cuota, consulta las siguientes secciones de Ver y gestionar cuotas:

Cuotas por región y modelo

Ver y editar las cuotas en la Google Cloud consola

Para ver y editar las cuotas en la Google Cloud consola, siga estos pasos:
  1. Ve a la página Cuotas y límites del sistema.
  2. Ir a Cuotas y límites del sistema

  3. Para ajustar la cuota, copie y pegue la propiedad aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model en el filtro. Pulsa Intro.
  4. Haz clic en los tres puntos que hay al final de la fila y selecciona Editar cuota.
  5. Introduce un nuevo valor de cuota en el panel y haz clic en Enviar solicitud.

Consulta las cuotas de solicitudes por minuto (RPM) por región y por modelo

De forma predeterminada, los modelos de Gemini 2.0 y versiones posteriores usan la cuota compartida dinámica (DSQ).

Elige una región para ver las cuotas de cada modelo disponible:

Aumentar las cuotas

Si quieres aumentar alguna de tus cuotas de IA generativa en Vertex AI, puedes solicitarlo a través de la Google Cloud consola.

Cuotas de RAG Engine

Para que cada servicio realice la generación aumentada de recuperación (RAG) con RAG Engine, se aplican las siguientes cuotas, que se miden como solicitudes por minuto (RPM).
Servicio Cuota Métrica
APIs de gestión de datos de RAG Engine 60 RPM VertexRagDataService requests per minute per region
RetrievalContexts API 600 RPM VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1500 RPM Online prediction requests per base model per minute per region per base_model

Otro filtro que puede especificar es base_model: textembedding-gecko
Se aplican los límites siguientes:
Servicio Límite Métrica
Solicitudes simultáneas de ImportRagFiles 3 RPM VertexRagService concurrent import requests per region
Número máximo de archivos por solicitud ImportRagFiles 10.000 VertexRagService import rag files requests per region

Para obtener más información sobre los límites de frecuencia y las cuotas, consulta los límites de frecuencia de la IA generativa en Vertex AI.

Solicitudes en lote

Las cuotas y los límites de los trabajos de inferencia por lotes son los mismos en todas las regiones.

Límites de tareas de inferencia por lotes simultáneas para modelos de Gemini

No hay límites de cuota predefinidos para la inferencia por lotes de los modelos de Gemini. En su lugar, el servicio de lote proporciona acceso a un gran conjunto de recursos compartidos que se asignan dinámicamente en función de la disponibilidad en tiempo real del modelo y de la demanda de todos los clientes de ese modelo. Cuando haya más clientes activos y se sature la capacidad del modelo, es posible que tus solicitudes por lotes se pongan en cola por falta de capacidad.

Cuotas de tareas de inferencia por lotes simultáneas para modelos que no son de Gemini

En la siguiente tabla se indican las cuotas del número de tareas de inferencia por lotes simultáneas, que no se aplican a los modelos de Gemini:
Cuota Valor
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs 4
Si el número de tareas enviadas supera la cuota asignada, las tareas se colocan en una cola y se procesan cuando la capacidad de la cuota esté disponible.

Cuotas de modelos entrenados personalizados

Las siguientes cuotas se aplican a los modelos ajustados de IA generativa en Vertex AI de un proyecto o región concretos:
Cuota Valor
Núcleos de pods de TPU V3 para entrenamiento de imágenes restringidas por región
* región admitida: europe-west4
64
Entrenamiento de imágenes restringidas con GPUs Nvidia A100 de 80 GB por región
* región admitida: us-central1
* región admitida: us-east4

8
2
* Los escenarios de ajuste tienen reservas de aceleradores en regiones específicas. Se admiten cuotas para la optimización, que deben solicitarse en regiones específicas.

Límites de inserción de texto

Cada solicitud puede tener hasta 250 textos de entrada (que generan una inserción por texto de entrada) y 20.000 tokens por solicitud. Solo se usan los primeros 2048 tokens de cada texto de entrada para calcular las inserciones. En el caso de gemini-embedding-001, la cuota se indica en el nombre gemini-embedding.

Tokens de entrada de contenido insertado por minuto y por modelo base

A diferencia de los modelos de inserción anteriores, que estaban limitados principalmente por las cuotas de RPM, la cuota del modelo de inserción de Gemini limita el número de tokens que se pueden enviar por minuto y por proyecto.

Cuota Valor
Tokens de entrada de contenido insertado por minuto 5.000.000

Cuotas de servicio del servicio de evaluación de la IA generativa

El servicio de evaluación de IA generativa usa gemini-2.0-flash como modelo de juez predeterminado para las métricas basadas en modelos. Una sola solicitud de evaluación de una métrica basada en modelos puede dar lugar a varias solicitudes subyacentes al servicio de evaluación de la IA generativa. La cuota de cada modelo se calcula por proyecto, lo que significa que las solicitudes dirigidas a gemini-2.0-flash para la inferencia de modelos y la evaluación basada en modelos contribuyen a la cuota. En la siguiente tabla se muestran las cuotas del servicio de evaluación de la IA generativa y del modelo de juez subyacente:
Solicitar cuota Cuota predeterminada
Solicitudes del servicio de evaluación de la IA generativa por minuto 1000 solicitudes por proyecto y región
Solicitudes de predicción online por minuto para
base_model: gemini-2.0-flash
Consulta las cuotas por región y modelo.

Si recibes un error relacionado con las cuotas al usar el servicio de evaluación de IA generativa, es posible que tengas que enviar una solicitud de aumento de cuota. Para obtener más información, consulta Ver y gestionar cuotas.

Límite Valor
Tiempo de espera de la solicitud del servicio de evaluación de la IA generativa 60 segundos

Cuando uses el servicio de evaluación de IA generativa por primera vez en un proyecto nuevo, puede que experimentes un retraso inicial de hasta dos minutos. Si la primera solicitud falla, espera unos minutos y vuelve a intentarlo. Las solicitudes de evaluación posteriores suelen completarse en un plazo de 60 segundos.

El número máximo de tokens de entrada y salida de las métricas basadas en modelos depende del modelo que se utilice como modelo de juez. Consulta los modelos de Google para ver una lista de modelos.

Cuotas de evaluación de flujos de procesamiento

Si recibes un error relacionado con las cuotas al usar el servicio de canalizaciones de evaluación, es posible que tengas que presentar una solicitud de aumento de cuota. Para obtener más información, consulta Ver y gestionar cuotas. El servicio de flujos de procesamiento de evaluación usa Vertex AI Pipelines para ejecutar PipelineJobs. Consulta las cuotas correspondientes de Vertex AI Pipelines. A continuación, se incluyen algunas recomendaciones generales sobre las cuotas:
Servicio Cuota Recomendación
API de Vertex AI Tareas de predicción por lotes de LLM simultáneas por región Por puntos: 1 * num_concurrent_pipelines

Por pares: 2 * num_concurrent_pipelines
API de Vertex AI Solicitudes de evaluación por minuto y región 1000 * num_concurrent_pipelines
Además, la cuota pertinente para las métricas basadas en modelos depende del modelo de juez que uses:
Tasks Cuota Modelo base Recomendación
summarization
question_answering
Solicitudes de predicción online por modelo base por minuto por región por base_model text-bison 60 * num_concurrent_pipelines

Vertex AI Agent Engine

Se aplican los siguientes límites a Vertex AI Agent Engine en cada región de un proyecto determinado:
Descripción Límite
Crear, eliminar o actualizar Vertex AI Agent Engine por minuto 10
Crear, eliminar o actualizar sesiones de Vertex AI Agent Engine por minuto 100
Query o StreamQuery Vertex AI Agent Engine por minuto 90
Añadir eventos a las sesiones de Vertex AI Agent Engine por minuto 300
Número máximo de recursos de Vertex AI Agent Engine 100
Crear, eliminar o actualizar recursos de memoria de Vertex AI Agent Engine por minuto 100
Obtener, enumerar o recuperar datos de Memory Bank de Vertex AI Agent Engine por minuto 300
Solicitudes de ejecución por minuto del entorno de pruebas (ejecución de código) 1000
Entidades de entorno aislado (ejecución de código) por región 1000

Solucionar el error 429

Para solucionar el error 429, consulta Código de error 429.

Siguientes pasos