Cuotas y límites de Vertex AI

Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud mediante la prevención de la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos Google Cloud .

El sistema de cuotas Cloud realiza las siguientes acciones:

En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.

Por lo general, las cuotas se aplican a nivel del proyecto de Google Cloud. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

También hay límites en los recursos de Vertex AI. Estos límites no están relacionados con el sistema de cuotas. Los límites no se pueden cambiar.

Cuotas de solicitudes

Las siguientes cuotas se aplican a las solicitudes de Vertex AI para un proyecto determinada y una región admitida. Por ejemplo, en un mismo proyecto, puedes tener hasta 30,000 solicitudes de predicción en línea por minuto en una región admitida y otras 30,000 en otra.

Tipo de solicitud Solicitudes por minuto
Solicitudes de administración de recursos (CRUD)1 600
Solicitudes de envío de trabajos u operaciones de larga duración (LRO) 60
Solicitudes de predicción en línea2 30,000
Capacidad de procesamiento de solicitudes de predicción en línea 1.5 GB
Solicitudes de explicación en línea 600
Solicitudes de lectura de series temporales de Vertex AI TensorBoard 60,000
Solicitudes de metadatos de AA (CRUD) 12,000
Solicitudes de almacenamiento en caché de IA generativa (CRUD) 200
Solicitudes Vertex AI Vizier (CRUD) 6,000
Solicitudes de entrega en línea de Vertex AI Feature Store 300,000
Solicitudes de Vertex ML Metadata 12,000
Cantidad de tokens de recuento o solicitudes de tokens de procesamiento 3,000

1 Las solicitudes de administración de recursos incluyen cualquier solicitud que no sea un trabajo, una LRO, una solicitud de predicción en línea, una solicitud de Vertex AI Vizier, una solicitud de metadatos de AA, una solicitud de lectura a la API de Timeseries Insights de Vertex AI TensorBoard, una solicitud de Vertex AI Feature Store, una solicitud de transmisión de Vertex AI Feature Store o una solicitud de Vector Search.

2 Esta cuota solo se aplica a los extremos públicos.

Los trabajos o las LRO incluyen las siguientes solicitudes:

  • Crea o borra un conjunto de datos.
  • Importa o exporta datos hacia o desde un conjunto de datos.
  • Crear un extremo.
  • Crea o borra un trabajo personalizado.
  • Crea o borra un trabajo de etiquetado de datos.
  • Crea o borra un trabajo de ajuste de hiperparámetros.
  • Crea o borra un trabajo de predicción por lotes.
  • Crea o borra un modelo.
  • Sube, borra o exporta un modelo.
  • Crea o borra una plantilla de entorno de ejecución de notebook.
  • Asigna, borra, inicia o actualiza un entorno de ejecución de notebook.
  • Crea, borra o actualiza un supervisor de modelos.
  • Crea o borra un trabajo de supervisión de modelos.


Si quieres obtener información sobre las cuotas para los modelos de IA generativa, consulta Cuotas y límites de IA generativa para Vertex AI.

Cuotas de un modelo de AutoML

Las siguientes cuotas se aplican a cualquier objetivo y tipo de datos para una región y proyecto determinados. Por ejemplo, en un proyecto o una región en particular, puedes implementar 10 modelos de clasificación de imágenes de AutoML y 10 modelos de detección de objetos en imágenes de AutoML, lo que da un total de 20 modelos implementados.

Imagen

Clasificación

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de entrenamiento simultáneos con Explainable AI 2
Trabajos de predicción por lotes simultáneos 5
Trabajos de implementación de modelos simultáneos 5
Trabajos de anulación de la implementación de modelos simultáneos 5
Cantidad de modelos implementados 10

Detección de objetos

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de predicción por lotes simultáneos 5
Cantidad de modelos implementados 10

Tabulares

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de predicción por lotes simultáneos 5
Cantidad de modelos implementados 30

Texto

Clasificación

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de predicción por lotes simultáneos 5
Cantidad de modelos implementados 10

Extracción de entidades

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de predicción por lotes simultáneos 5
Cantidad de modelos implementados 10

Análisis de opiniones

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de predicción por lotes simultáneos 5
Cantidad de modelos implementados 10

Video

Reconocimiento de acciones

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de predicción por lotes simultáneos 5

Clasificación

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de predicción por lotes simultáneos 5

Seguimiento de objetos

Cuota Valor
Trabajos de entrenamiento simultáneos 5
Trabajos de predicción por lotes simultáneos 5

Vertex AI Model Registry

El tamaño máximo de modelo que admite Vertex AI Model Registry es de 1 TB.

Límites de los modelos de AutoML

Los siguientes límites se aplican a cada tipo de datos para un proyecto y una región determinados. Por ejemplo, en un proyecto y una región en particular, puedes incluir un máximo de 1,000,000 de imágenes en una entrada de solicitud por lotes.

Imagen

Tipo de límite Valor
Tamaño de archivo de imagen Máximo: 30 MB
Imágenes por conjunto de datos Máximo: 1,000,000
Etiquetas por conjunto de datos Mínimo: 2
Máximo: 5,000
Imágenes por etiqueta Mínimo: 10
Recomendado: 1,000
Tamaño del archivo CSV de entrada por lotes Máximo: 100 MB
Cantidad de imágenes de la entrada por lotes Máximo: 1,000,000

Tabular

Tipo de límite Valor
Tamaño máximo 100GB
Cantidad de filas Entre 1,000 y 200,000,000 de filas
Cantidad de columnas Entre 2 y 1,000 columnas
Cantidad de importaciones de conjuntos de datos que se ejecutan de forma simultánea 5 importaciones
Tamaño del archivo CSV Máximo: 10 GB por archivo, hasta un máximo total de 100 GB

Texto

Los conteos de caracteres utilizan el formato UTF-8.

Tipo de límite Clasificación Extracción de entidades Análisis de opiniones
Elementos de entrenamiento De 10 a 1,000,000 De 50 a 100,000 De 10 a 100,000
Etiquetas por conjunto de datos De 2 a 5,000 De 1 a 100 De 2 a 11
Largo del nombre de la etiqueta De 1 a 32 De 1 a 32 Número entero del 0 al 10
Largo del intervalo anotado No disponible De 1 a 100 caracteres No disponible
Elementos de entrenamiento por etiqueta De 10 a 1,000,000 De 100 a 100,000 De 10 a 100,000
Tamaño del elemento de entrenamiento 10 MB
5,000,000 de caracteres
128 KB (texto); 20 MB (PDF)
Entre 10 y 300,000 caracteres (texto)
128 KB (texto); 2 MB (PDF)
60,000 caracteres
Elemento enviado para la predicción 128 KB (texto); 2 MB (PDF)
60,000 caracteres
20 MB 128 KB (texto); 2 MB (PDF)
60,000 caracteres
Elementos por solicitud por lotes 10,000 10,000 10,000

Video

Tipo de límite Valor
Duración máxima del video 3 horas
Tamaño máximo del archivo de video 50 GB
Cantidad mínima de etiquetas por conjunto de datos 2
Cantidad mínima de videos por etiqueta 10 (se recomiendan 1,000)
Tamaño del archivo CSV de entrada por lotes Máximo: 100 MB
Cantidad de segmentos de video en la entrada por lotes Máximo: 1,000

Cuotas de un modelo entrenado personalizado

Las siguientes cuotas se aplican a los modelos personalizados entrenados de Vertex AI para un proyecto y una región determinados.

Capacitación

Cuota Valor
Canalizaciones de entrenamiento personalizadas simultáneas 2,000
Cantidad de CPU N1 y E2 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 2,200
us-west2 20
us-west3 2,200
us-west4 20
us-central1 2,200
us-east1 2,200
us-east4 20
us-east5 450
us-south1 450
northamerica-northeast1 2,200
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 2,200
europe-west1 2,200
europe-west4 2,200
europe-west6 20
europe-west3 2,200
europe-north1europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1asia-south1 20
asia-southeast1 2,200
asia-southeast2 2,200
asia-east2 2,200
asia-east1 2,200
asia-northeast1 2,200
asia-northeast2 20
australia-southeast1 2,200
australia-southeast2 20
asia-northeast3 2,200
me-west1 450
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Cantidad de CPU N2 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450
Cantidad de CPU M1 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 0
us-west2 0
us-west3 0
us-west4 0
us-central1 0
us-east1 0
us-east4 0
us-east5 0
us-south1 0
northamerica-northeast1 0
northamerica-northeast2 0
southamerica-east1 0
southamerica-west1 0
europe-west2 0
europe-west1 0
europe-west4 0
europe-west6 0
europe-west3 0
europe-north1europe-central2 0
europe-west8 0
europe-west9 0
europe-southwest1asia-south1 0
asia-southeast1 0
asia-southeast2 0
asia-east2 0
asia-east1 0
asia-northeast1 0
asia-northeast2 0
australia-southeast1 0
australia-southeast2 0
asia-northeast3 0
me-west1 0
me-central1 0
me-central2 0
europe-west12 0
africa-south1 0
Cantidad de CPU C2 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 20
us-west2 20
us-west3 20
us-west4 20
us-central1 450
us-east1 20
us-east4 20
us-east5 450
us-south1 20
northamerica-northeast1 20
northamerica-northeast2 20
southamerica-east1 20
southamerica-west1 20
europe-west2 20
europe-west1 20
europe-west4 450
europe-west6 20
europe-west3 20
europe-north1europe-central2 20
europe-west8 20
europe-west9 450
europe-southwest1asia-south1 20
asia-southeast1 20
asia-southeast2 20
asia-east2 20
asia-east1 450
asia-northeast1 20
asia-northeast2 20
australia-southeast1 20
australia-southeast2 20
asia-northeast3 20
me-west1 20
me-central1 20
me-central2 20
europe-west12 20
africa-south1 20
Cantidad de CPU A2 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 Ilimitado
us-east1 Sin límite
us-east4 Sin límite
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 Sin límite
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 Sin límite
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 Sin límite
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de CPU A3 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 Sin límite
us-east1 No disponible
us-east4 No disponible
us-east5 Sin límite
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 Sin límite
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 Sin límite
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU P4 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 6
us-west3 No disponible
us-west4 No disponible
us-central1 6
us-east1 No disponible
us-east4 1
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 6
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 6
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 6
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 6
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU T4 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 2
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 12
us-east1 2
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 6
europe-west1 No disponible
europe-west4 2
europe-west6 No disponible
europe-west3 0
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 1
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 6
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 1
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de L4 GPU simultáneas para el entrenamiento, por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 0
us-east4 0
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 0
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 0
me-west1 No disponible
me-central1 No disponible
me-central2 0
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU P100 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 30
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 56
us-east1 30
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 30
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 30
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 6
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU V100 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 6
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 6
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 6
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 6
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU A100 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 8
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 8
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 8
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU A100 de 80 GB simultáneas para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 0
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible

Si te interesa, consulta la documentación de cuotas.

Cantidad de GPU H100 simultáneas para el entrenamiento, por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 0
us-east1 No disponible
us-east4 0
us-east5 0
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 0
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU H100 Mega simultáneas para el entrenamiento, por región
RegiónValor
us-west1 0
us-west2 No disponible
us-west3 No disponible
us-west4 0
us-central1 0
us-east1 No disponible
us-east4 0
us-east5 0
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 0
europe-west4 0
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 0
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 0
asia-northeast2 No disponible
australia-southeast1 0
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible

Si te interesa, consulta la documentación de cuotas.

Cantidad de núcleos de TPU V2 para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 8
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 8
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 8
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de núcleos de pods de TPU V2 para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 No disponible
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de núcleos de TPU V3 para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 8
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 8
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 8
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de núcleos de pods de TPU V3 para el entrenamiento, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 No disponible
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Uso de HDD (GB) durante el entrenamiento, por región
RegiónValor
us-west1 180,000
us-west2 3,600
us-west3 180,000
us-west4 3,600
us-central1 180,000
us-east1 180,000
us-east4 3,600
us-east5 3,600
us-south1 180,000
northamerica-northeast1 180,000
northamerica-northeast2 3,600
southamerica-east1 3,600
southamerica-west1 3,600
europe-west2 180,000
europe-west1 180,000
europe-west4 180,000
europe-west6 3,600
europe-west3 180,000
europe-north1europe-central2 3,600
europe-west8 3,600
europe-west9 180,000
europe-southwest1asia-south1 3,600
asia-southeast1 180,000
asia-southeast2 180,000
asia-east2 180,000
asia-east1 180,000
asia-northeast1 180,000
asia-northeast2 3,600
australia-southeast1 180,000
australia-southeast2 3,600
asia-northeast3 180,000
me-west1 180,000
me-central1 3,600
me-central2 3,600
europe-west12 3,600
africa-south1 3,600
Uso de SSD (GB) durante el entrenamiento, por región
RegiónValor
us-west1 75,000
us-west2 450
us-west3 75,000
us-west4 450
us-central1 75,000
us-east1 75,000
us-east4 450
us-east5 450
us-south1 75,000
northamerica-northeast1 75,000
northamerica-northeast2 450
southamerica-east1 450
southamerica-west1 450
europe-west2 75,000
europe-west1 75,000
europe-west4 75,000
europe-west6 450
europe-west3 75,000
europe-north1europe-central2 450
europe-west8 450
europe-west9 75,000
europe-southwest1asia-south1 450
asia-southeast1 75,000
asia-southeast2 75,000
asia-east2 75,000
asia-east1 75,000
asia-northeast1 75,000
asia-northeast2 450
australia-southeast1 75,000
australia-southeast2 450
asia-northeast3 75,000
me-west1 75,000
me-central1 450
me-central2 450
europe-west12 450
africa-south1 450

Entrega

Cuota Valor
Cantidad de réplicas de modelos personalizados implementadas 100
Cantidad de CPU para entregar, por región
RegiónValor
us-west1 2,200
us-west2 2,200
us-west3 2,200
us-west4 16
us-central1 2,200
us-east1 2,200
us-east4 2,200
us-east5 16
us-south1 450
northamerica-northeast1 2,200
northamerica-northeast2 450
southamerica-east1 2,200
southamerica-west1 450
europe-west2 2,200
europe-west1 2,200
europe-west4 2,200
europe-west6 2,200
europe-west3 2,200
europe-north1europe-central2 16
europe-west8 16
europe-west9 16
europe-southwest1asia-south1 16
asia-southeast1 2,200
asia-southeast2 2,200
asia-east2 2,200
asia-east1 2,200
asia-northeast1 2,200
asia-northeast2 16
australia-southeast1 2,200
australia-southeast2 16
asia-northeast3 2,200
me-west1 450
me-central1 16
me-central2 16
europe-west12 16
africa-south1 16
Cantidad de GPU P100 para entregar, por región
RegiónValor
us-west1 30
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 56
us-east1 30
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 30
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 30
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU P4 simultáneas para enviar, por región
RegiónValor
us-west1 No disponible
us-west2 6
us-west3 No disponible
us-west4 No disponible
us-central1 6
us-east1 No disponible
us-east4 6
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 6
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 6
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 6
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 6
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU T4 simultáneas para enviar, por región
RegiónValor
us-west1 12
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 12
us-east1 12
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 12
europe-west1 No disponible
europe-west4 12
europe-west6 No disponible
europe-west3 0
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 6
asia-southeast2 No disponible
asia-east2 12
asia-east1 6
asia-northeast1 6
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 6
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU L4 para entregar, por región
RegiónValor
us-west1 28
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 28
us-east1 28
us-east4 28
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 28
europe-west1 28
europe-west4 28
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 28
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 28
asia-northeast1 28
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU V100 simultáneas para enviar, por región
RegiónValor
us-west1 6
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 6
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 6
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU A100 para entregar, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 14
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 14
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 14
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 14
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 14
me-west1 1
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU A100 de 80 GB para entregar, por región
RegiónValor
us-west1 No disponible
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 1
us-east1 No disponible
us-east4 1
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 1
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 1
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de GPU H100 para entregar, por región
RegiónValor
us-west1 8
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 8
us-east1 No disponible
us-east4 0
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 8
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 8
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible
Cantidad de chips TPU v5e para entregar, por región
RegiónValor
us-west1 4
us-west2 No disponible
us-west3 No disponible
us-west4 No disponible
us-central1 No disponible
us-east1 No disponible
us-east4 No disponible
us-east5 No disponible
us-south1 No disponible
northamerica-northeast1 No disponible
northamerica-northeast2 No disponible
southamerica-east1 No disponible
southamerica-west1 No disponible
europe-west2 No disponible
europe-west1 No disponible
europe-west4 No disponible
europe-west6 No disponible
europe-west3 No disponible
europe-north1europe-central2 No disponible
europe-west8 No disponible
europe-west9 No disponible
europe-southwest1asia-south1 No disponible
asia-southeast1 No disponible
asia-southeast2 No disponible
asia-east2 No disponible
asia-east1 No disponible
asia-northeast1 No disponible
asia-northeast2 No disponible
australia-southeast1 No disponible
australia-southeast2 No disponible
asia-northeast3 No disponible
me-west1 No disponible
me-central1 No disponible
me-central2 No disponible
europe-west12 No disponible
africa-south1 No disponible

Límites de los modelos entrenados de forma personalizada

Los siguientes límites se aplican a los modelos personalizados entrenados de Vertex AI para un proyecto y una región determinados.

Entrega

Límite Valor
Cantidad de réplicas por proyecto 200
Cantidad de contenedores por clúster 25,000

Vertex AI Feature Store

En esta sección, se enumeran las cuotas y los límites de lo siguiente:

Vertex AI Feature Store

Las siguientes cuotas se aplican a un proyecto y una región determinados. Por ejemplo, en un solo proyecto, puedes tener 200 nodos de publicación en línea en us-central1 y otros 50 en us-east4.

Cuota Valor
Solicitudes de entrega en línea por minuto 300,000
Número máximo de instancias de FeatureOnlineStore 10
Cantidad máxima de solicitudes de búsqueda por minuto 6,000,000
Cantidad máxima de nodos de entrega en línea en todas las instancias de FeatureOnlineStore optimizadas del proyecto 80
Cantidad máxima de instancias FeatureView en las instancias de FeatureOnlineStore 30

Vertex AI Feature Store también tiene los siguientes límites. No puedes solicitar un aumento de ninguno de los límites de la siguiente tabla:

Límite Valor
Cantidad máxima de recursos FeatureGroup en un proyecto y una ubicación 250
Cantidad máxima de recursos Feature en un FeatureGroup 10,000
Tamaño máximo de los datos de los atributos por entidad 5 MB
Cantidad de IDs de las entidades por solicitud de entrega en línea (FetchFeatureValues) 1
Longitud máxima de un ID de entidad 4,076 caracteres
Límite de almacenamiento de un nodo de entrega en línea 200 GB

Vertex AI Feature Store (heredado)

Las siguientes cuotas se aplican a un proyecto y una región determinados. Por ejemplo, en un solo proyecto, puedes tener 75 trabajos por lotes simultáneos en us-central1 y otros 75 trabajos en europe-west4.

Cuota Valor
Solicitudes de entrega en línea por minuto 300,000
Solicitudes de transferencia de transmisión por minuto 60,000
Capacidad de procesamiento de escritura de transferencia de transmisión por minuto 1,2 GB
Solicitudes de creación de atributos por minuto 100
Entrega de nodos en línea en todos los almacenes de atributos 30
Trabajos por lotes simultáneos (transferencia, entrega y eliminación de valores de atributos combinados) 75
Solicitudes simultáneas para borrar valores de atributos 1
Tipos de entidad en todos los almacenes de atributos 75

El almacén de atributos de Vertex AI también tiene los siguientes límites. No puedes solicitar un aumento de ninguno de los límites de la siguiente tabla:

Límite Valor
Límite de almacenamiento de un nodo de entrega en línea 5 TB
Total de datos en el almacén sin conexión Ilimitado
Atributos por tipo de entidad 5,000
Cantidad de solicitudes de creación, actualización y eliminación de featurestores por día, por proyecto y por región 500
Para la transferencia de transmisión, el tamaño por solicitud 1 MB
Para la lectura de transmisión, la cantidad de entidades que se pueden incluir por solicitud 100
Para la importación por lotes, la cantidad de archivos que se pueden incluir por solicitud 5,000 para Avro o 500 para CSV
Para la entrega y las exportaciones por lotes, la cantidad de funciones que puedes solicitar 5,000
En el caso de la transferencia por lotes y de transmisión, la marca de tiempo más antigua para la que se pueden transferir los datos de atributos 4,000 días a partir de la fecha actual

El límite de retención de datos en Vertex AI Feature Store (heredado) tiene el siguiente valor predeterminado, que puedes anular:

Configuración predeterminada de retención de datos Valor predeterminado
Retención de datos en el almacenamiento sin conexión (marca de tiempo del valor de atributo más antiguo después de la cual se borran los valores) 4,000 días a partir de la fecha actual
Retención de datos en la tienda en línea (marca de tiempo del valor de atributo más antiguo después de la cual se borran los valores) 4,000 días a partir de la fecha actual

Puedes anular el límite de retención de datos de las siguientes maneras:

  • Para anular el límite de retención de datos de la tienda en línea, configura el parámetro online_storage_ttl_days mientras creas o actualizas un almacén de atributos.

  • Para anular el límite de retención de datos del almacén sin conexión, configura el parámetro offline_storage_ttl_days mientras creas o actualizas un tipo de entidad.

Las siguientes cuotas se aplican a Vector Search para un proyecto determinado en cada región.

Cuota Valor
Operaciones de creación de índice simultáneas 5
Operaciones de actualización de índice simultáneas 5
Cantidad de nodos de índice implementados 50
Cantidad de nodos N2D de índice implementados 5
Cantidad de índices 100
Solicitudes de actualización de transmisión por minuto 6,000
Capacidad de procesamiento de actualización de transmisión (en KB) por minuto 120,000

Vertex ML Metadata

Los siguientes límites se aplican a Vertex ML Metadata para un proyecto determinado en cada región.

Límite Valor
Es el tamaño máximo serializado del campo de metadatos dentro de un recurso. 204,800 bytes
Tamaño máximo serializado de los esquemas de metadatos 204,800 bytes

Vertex AI Pipelines

Los siguientes límites y cuotas se aplican a Vertex AI Pipelines para un proyecto determinado en cada región.

Cuota Valor
Ejecutar tareas de canalización en paralelo* 600
Ejecuciones simultáneas de canalizaciones* 300

* Las solicitudes de ejecución o tareas de canalizaciones que exceden este límite se ponen en cola hasta que los recursos están disponibles.

Vertex AI Pipelines tiene los siguientes límites. Ten en cuenta que, a diferencia de las cuotas, no puedes solicitar un aumento del límite.

Límite Valor
Cantidad de tareas de canalización por trabajo 10,000
Artefactos de entrada y salida por tarea de canalización 100
Artefactos de entrada y salida por trabajo de canalización 10,000
Tamaño máximo de la carga útil de JSON que contiene parámetros de salida y artefactos por tarea de canalización 131,072 bytes
Tiempo máximo de ejecución para una tarea de canalización** 7 días

* Las tareas de canalización que se ejecuten más allá de este límite se cancelarán.

Vertex AI Decision Optimization

Los siguientes límites y cuotas se aplican a Vertex AI Decision Optimization para un proyecto determinado en cada región.

Cuota Valor
Solicitud resuelta por minuto 30

Cuotas y límites de Colab Enterprise

Las cuotas y los límites de Colab Enterprise se enumeran por separado. Consulta Cuotas y límites de Colab Enterprise.

Aumentos de cuota

Si quieres aumentar tus cuotas para Vertex AI, puedes usar la consola de Google Cloud para solicitar un aumento de la cuota.

Si deseas obtener más información para enviar una solicitud de aumento de cuota, consulta las siguientes secciones en Trabaja con cuotas:

Cuotas por región y modelo

Consulta y edita las cuotas en la consola de Google Cloud

Para ver y editar las cuotas en la consola de Google Cloud, haz lo siguiente:
  1. Ve a la página Cuotas y límites del sistema.
  2. Ir a Cuotas y límites del sistema

  3. Para ajustar la cuota, copia y pega la propiedad aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model en Filtro. Presiona Intro.
  4. Haz clic en los tres puntos al final de la fila y selecciona Editar cuota.
  5. Ingresa un nuevo valor de cuota en el panel y haz clic en Enviar solicitud.

Consulta las cuotas de solicitudes por minuto (QPM) por región y por modelo

De forma predeterminada, los modelos 2.0 y versiones posteriores usan la cuota compartida dinámica (DSQ).

Elige una región para ver las cuotas de cada modelo disponible:

Aumenta las cuotas

Si quieres aumentar tus cuotas para IA generativa en Vertex AI, puedes usar la consola de Google Cloud para solicitar un aumento de la cuota.

Cuotas de RAG Engine

Para que cada servicio realice la generación de aumento de recuperación (RAG) con el motor de RAG, se aplican las siguientes cuotas, que se miden como solicitudes por minuto (RPM).
Servicio Cuota Métrica
APIs de administración de datos de RAG Engine 60 rpm VertexRagDataService requests per minute per region
API RetrievalContexts 1,500 RPM VertexRagService retrieve requests per minute per region
base_model: textembedding-gecko 1,500 RPM Online prediction requests per base model per minute per region per base_model

Un filtro adicional que puedes especificar es base_model: textembedding-gecko
Se aplican los siguientes límites:
Servicio Límite Métrica
Solicitudes ImportRagFiles simultáneas 3 rpm VertexRagService concurrent import requests per region
Cantidad máxima de archivos por solicitud ImportRagFiles 10,000 VertexRagService import rag files requests per region

Para obtener más información sobre los límites de frecuencia y las cuotas, consulta Límites de frecuencia de la IA generativa en Vertex AI.

Solicitudes por lotes

Las cuotas y los límites de las solicitudes de predicción por lotes son los mismos en todas las regiones.

Límites de solicitudes simultáneas de predicción por lotes

En la siguiente tabla, se enumeran los límites de la cantidad de solicitudes de predicción por lotes simultáneas:
Límite Valor
Modelos de Gemini 8
Si la cantidad de tareas enviadas excede el límite asignado, las tareas se colocan en una cola y se procesan cuando la capacidad del límite está disponible.

Cuotas de solicitudes simultáneas de predicción por lotes

En la siguiente tabla, se enumeran las cuotas de la cantidad de solicitudes de predicción por lotes simultáneas, que no se aplican a los modelos de Gemini:
Cuota Valor
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs 4
Si la cantidad de tareas enviadas excede la cuota asignada, las tareas se colocan en una cola y se procesan cuando la capacidad de la cuota está disponible.

Cuotas de un modelo entrenado personalizado

Las siguientes cuotas se aplican a los modelos generativos de IA de Vertex AI para un proyecto y una región determinados:
Cuota Valor
Núcleos de pods de TPU V3 de entrenamiento de imagen restringido por región
*Región compatible: europe-west4
64
GPU Nvidia A100 de 80 GB de entrenamiento de imagen restringido por región
* Región compatible: us-central1
* Región compatible: us-east4

8
2
* Las situaciones de ajuste tienen reservas de aceleradores en regiones específicas. Las cuotas para el ajuste son compatibles y deben solicitarse en regiones específicas.

Límites de embedding de texto

Cada solicitud de modelo de incorporación de texto puede tener hasta 250 textos de entrada (generando 1 incorporación por texto de entrada) y 20,000 tokens por solicitud. Solo se usan los primeros 2,048 tokens de cada texto de entrada para calcular las incorporaciones.

En el caso de text-embedding-large-exp-03-07, los primeros 8,192 tokens de cada texto de entrada se usan para calcular las incorporaciones, y cada solicitud solo puede incluir un texto de entrada. La cuota de este modelo aparece con el nombre text-embedding-large-001.

Cuotas de Gen AI Evaluation Service

El servicio de evaluación de Gen AI usa gemini-2.0-flash como modelo de juez predeterminado para las métricas basadas en modelos. Una sola solicitud de evaluación para una métrica basada en modelos puede dar como resultado varias solicitudes subyacentes al servicio de evaluación de IA generativa. La cuota de cada modelo se calcula por proyecto, lo que significa que cualquier solicitud dirigida a gemini-2.0-flash para la inferencia de modelo y la evaluación basada en modelos contribuyen a la cuota. Las cuotas del servicio de evaluación de IA generativa y del modelo de juez subyacente se muestran en la siguiente tabla:
Solicita una cuota Cuota predeterminada
Solicitudes de Gen AI Evaluation Service por minuto 1,000 solicitudes por proyecto y por región
Solicitudes de predicción en línea por minuto para
base_model: gemini-2.0-flash
Consulta Cuotas por región y modelo.

Si recibes un error relacionado con las cuotas mientras usas el servicio de evaluación de IA general, es posible que debas presentar una solicitud de aumento de cuota. Consulta Visualiza y administra las cuotas para obtener más información.

Límite Valor
Tiempo de espera de la solicitud de Gen AI Evaluation Service 60 segundos

Cuando uses el servicio de evaluación de IA generativa por primera vez en un proyecto nuevo, es posible que experimentes un retraso de configuración inicial de hasta dos minutos. Si tu primera solicitud falla, espera unos minutos y vuelve a intentarlo. Las solicitudes de evaluación posteriores suelen completarse en 60 segundos.

Los tokens de entrada y salida máximos para las métricas basadas en modelos dependen del modelo que se usa como modelo de juez. Consulta Modelos de Google para ver una lista de modelos.

Cuotas de evaluación de canalizaciones

Si recibes un error relacionado con las cuotas mientras usas el servicio de canalizaciones de evaluación, es posible que debas presentar una solicitud de aumento de cuota. Consulta Ver y administrar cuotas para obtener más información. El servicio de canalizaciones de evaluación usa Vertex AI Pipelines para ejecutar PipelineJobs. Consulta las cuotas relevantes para Vertex AI Pipelines. Las siguientes son recomendaciones generales de cuota:
Servicio Cuota Recomendación
La API de Vertex AI Trabajos de predicción por lotes de LLM simultáneos por región Por puntos: 1 * num_concurrent_pipelines

Por pares: 2 * num_concurrent_pipelines
La API de Vertex AI Solicitudes de evaluación por minuto, por región 1,000 * num_concurrent_pipelines
Además, la cuota relevante para las métricas basadas en modelos depende del modelo de juez que uses:
Tareas Cuota Modelo base Recomendación
summarization
question_answering
Solicitudes de predicción en línea por modelo base por minuto, por región y por base_model text-bison 60 * num_concurrent_pipelines

Motor de razonamiento Vertex AI

Los siguientes límites y cuotas se aplican a Vertex AI Reasoning Engine para un proyecto determinado en cada región.
Cuota Valor
Cantidad de veces que se crea, borra o actualiza Reasoning Engine por minuto 10
Motor de razonamiento de Query/StreamQuery por minuto 60
Cantidad máxima de recursos de Reasoning Engine 100

Cómo solucionar problemas relacionados con el código de error 429

Para solucionar el error 429, consulta Código de error 429.

¿Qué sigue?