Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios Google Cloud recursos.
El sistema de cuotas de Cloud hace lo siguiente:
- Monitoriza tu consumo de Google Cloud productos y servicios
- Restringe el consumo de esos recursos
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota.
En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.
Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También hay límites en los recursos de Vertex AI. Estos límites no están relacionados con el sistema de cuotas. Los límites no se pueden cambiar.
Cuotas de frecuencia
Las cuotas que se describen a continuación se aplican a las solicitudes de Vertex AI de un proyecto o región admitidos concretos. Por ejemplo, en un mismo proyecto puedes tener hasta 30.000 solicitudes de inferencia online por minuto en una región y otras 30.000 del mismo tipo por minuto en otra región admitida.
Tipo de solicitud | Solicitudes por minuto |
---|---|
Solicitudes de gestión de recursos (CRUD)1 | 600 |
Solicitudes de envío de tareas u operaciones de larga duración | 60 |
Solicitudes de inferencia online2 | 30.000 |
Rendimiento de solicitudes de inferencia online | 1,5 GB |
Solicitudes de explicación online | 600 |
Solicitudes de lectura de series temporales de Vertex AI TensorBoard | 60.000 |
Solicitudes de metadatos de aprendizaje automático (CRUD) | 12.000 |
Solicitudes de almacenamiento en caché (CRUD) de IA generativa | 200 |
Solicitudes de Vertex AI Vizier (CRUD) | 6000 |
Solicitudes de servicio online de Vertex AI Feature Store | 300.000 |
Solicitudes de Vertex ML Metadata | 12.000 |
Número de solicitudes de tokens de recuento o de tokens de computación | 3000 |
1Las solicitudes de gestión de recursos incluyen cualquier solicitud que no sea un trabajo, una operación de larga duración, una solicitud de inferencia online, una solicitud de Vertex AI Vizier, una solicitud de metadatos de AA, una solicitud de lectura de la API Timeseries Insights de Vertex AI TensorBoard, una solicitud de Vertex AI Feature Store, una solicitud de streaming de Vertex AI Feature Store o una solicitud de búsqueda vectorial.
2 Esta cuota solo se aplica a los endpoints públicos.
Las tareas u operaciones de larga duración incluyen las siguientes solicitudes:
- Crea o elimina un conjunto de datos.
- Importar o exportar datos a un conjunto de datos o desde él.
- Crea un endpoint.
- Crea o elimina una tarea personalizada.
- Crear o eliminar una tarea de etiquetado de datos.
- Crea o elimina una tarea de ajuste de hiperparámetros.
- Crea o elimina una tarea de inferencia por lotes.
- Crea o elimina un modelo.
- Subir, eliminar o exportar un modelo.
- Crea o elimina una plantilla de tiempo de ejecución de cuaderno.
- Asigna, elimina, inicia o actualiza un entorno de ejecución de un cuaderno.
- Crea, elimina o actualiza un monitor de modelo.
- Crea o elimina una tarea de monitorización de modelos.
Para obtener información sobre las cuotas de los modelos de IA generativa, consulta
Cuotas y límites de la IA generativa en Vertex AI.
Cuotas de modelos de AutoML
Las siguientes cuotas se aplican a todos los objetivos y tipos de datos de un proyecto o región concretos. Por ejemplo, en un proyecto o región determinados, puedes desplegar 10 modelos de clasificación de imágenes de AutoML y 10 modelos de detección de objetos de imágenes de AutoML, lo que da lugar a un total de 20 modelos desplegados.
Imagen
Clasificación
Cuota | Valor |
---|---|
Tareas de entrenamiento simultáneas | 5 |
Tareas de entrenamiento simultáneas con Explainable AI | 2 |
Tareas de inferencia por lotes simultáneas | 5 |
Tareas de implementación de modelos simultáneas | 5 |
Tareas simultáneas de anulación del despliegue de modelos | 5 |
Número de modelos desplegados | 10 |
Detección de objetos
Cuota | Valor |
---|---|
Tareas de entrenamiento simultáneas | 5 |
Tareas de inferencia por lotes simultáneas | 5 |
Número de modelos desplegados | 10 |
Contenido tabular
Cuota | Valor |
---|---|
Tareas de entrenamiento simultáneas | 5 |
Tareas de inferencia por lotes simultáneas | 5 |
Número de modelos desplegados | 30 |
Registro de modelos de Vertex AI
El tamaño máximo de modelo admitido por el registro de modelos de Vertex AI es de 1 TB.
Límites de modelos de AutoML
Los siguientes límites se aplican a todos los tipos de datos de un proyecto o región concretos. Por ejemplo, en un proyecto y una región concretos, puedes incluir un máximo de 1.000.000 de imágenes en la entrada de una solicitud en lote.
Imagen
Tipo de límite | Valor |
---|---|
Tamaño de archivo de imagen | Máximo: 30 MB |
Imágenes por conjunto de datos | Máximo: 1.000.000 |
Etiquetas por conjunto de datos | Mínimo: 2 Máximo: 5000 |
Imágenes por etiqueta | Mínimo: 10 Recomendado: 1000 |
Tamaño de archivo CSV de la entrada por lotes | Máximo: 100 MB |
Número de imágenes de la entrada en lote | Máximo: 1.000.000 |
Tabular
Tipo de límite | Valor |
---|---|
Tamaño máximo | 100 GB |
Número de filas | Entre 1000 y 100.000.000 filas |
Número de columnas | Entre 2 y 1000 columnas |
Número de importaciones de conjuntos de datos que se ejecutan simultáneamente | 5 importaciones |
Tamaño del archivo CSV | Máximo: 10 GB por archivo, hasta un total de 100 GB |
Vídeo
Tipo de límite | Valor |
---|---|
Duración máxima de vídeo | 3 horas |
Tamaño máximo de archivo de vídeo | 50 GB |
Etiquetas mínimas por conjunto de datos | 2 |
Vídeos mínimos por etiqueta | 10 (el valor recomendado es 1000) |
Tamaño de archivo CSV de la entrada por lotes | Máximo: 100 MB |
Número de segmentos de vídeo de la entrada por lotes | Máximo: 1000 |
Cuotas de modelos entrenados personalizados
Las siguientes cuotas se aplican a los modelos entrenados personalizados de Vertex AI de un proyecto o región concretos.
Formación
Cuota | Valor |
---|---|
Flujos de procesamiento de entrenamiento personalizados simultáneos | 2000 |
Número de CPU N1 y E2 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 2200 |
us-west2 | 20 |
us-west3 | 2200 |
us-west4 | 20 |
us-central1 | 2200 |
us-east1 | 2200 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 450 |
northamerica-northeast1 | 2200 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 2200 |
europe-west1 | 2200 |
europe-west4 | 2200 |
europe-west6 | 20 |
europe-west3 | 2200 |
europe-north1 | 20 |
europe-central2 | 450 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 2200 |
asia-south2 | 20 |
asia-southeast1 | 2200 |
asia-southeast2 | 2200 |
asia-east2 | 2200 |
asia-east1 | 2200 |
asia-northeast1 | 2200 |
asia-northeast2 | 20 |
australia-southeast1 | 2200 |
australia-southeast2 | 20 |
asia-northeast3 | 2200 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Número de CPU N2 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-south2 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Número de CPU M1 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 0 |
us-west2 | 0 |
us-west3 | 0 |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | 0 |
northamerica-northeast1 | 0 |
northamerica-northeast2 | 0 |
southamerica-east1 | 0 |
southamerica-west1 | 0 |
europe-west2 | 0 |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | 0 |
europe-west3 | 0 |
europe-north1 | 0 |
europe-central2 | 0 |
europe-west8 | 0 |
europe-west9 | 0 |
europe-southwest1 | 0 |
asia-south1 | 0 |
asia-south2 | 0 |
asia-southeast1 | 0 |
asia-southeast2 | 0 |
asia-east2 | 0 |
asia-east1 | 0 |
asia-northeast1 | 0 |
asia-northeast2 | 0 |
australia-southeast1 | 0 |
australia-southeast2 | 0 |
asia-northeast3 | 0 |
me-west1 | 0 |
me-central1 | 0 |
me-central2 | 0 |
europe-west12 | 0 |
africa-south1 | 0 |
Número de CPU C2 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 20 |
us-west2 | 20 |
us-west3 | 20 |
us-west4 | 20 |
us-central1 | 450 |
us-east1 | 20 |
us-east4 | 20 |
us-east5 | 450 |
us-south1 | 20 |
northamerica-northeast1 | 20 |
northamerica-northeast2 | 20 |
southamerica-east1 | 20 |
southamerica-west1 | 20 |
europe-west2 | 20 |
europe-west1 | 20 |
europe-west4 | 450 |
europe-west6 | 20 |
europe-west3 | 20 |
europe-north1 | 20 |
europe-central2 | 20 |
europe-west8 | 20 |
europe-west9 | 450 |
europe-southwest1 | 20 |
asia-south1 | 20 |
asia-south2 | 20 |
asia-southeast1 | 20 |
asia-southeast2 | 20 |
asia-east2 | 20 |
asia-east1 | 450 |
asia-northeast1 | 20 |
asia-northeast2 | 20 |
australia-southeast1 | 20 |
australia-southeast2 | 20 |
asia-northeast3 | 20 |
me-west1 | 20 |
me-central1 | 20 |
me-central2 | 20 |
europe-west12 | 20 |
africa-south1 | 20 |
Número de CPU A2 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | Ilimitado |
us-east1 | Ilimitado |
us-east4 | Ilimitado |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | Ilimitado |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | Ilimitado |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | Ilimitado |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de CPU A3 simultáneas para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | Ilimitado |
us-west2 | Ilimitado |
us-west3 | Ilimitado |
us-west4 | Ilimitado |
us-central1 | Ilimitado |
us-east1 | Ilimitado |
us-east4 | Ilimitado |
us-east5 | Ilimitado |
us-south1 | Ilimitado |
northamerica-northeast1 | Ilimitado |
northamerica-northeast2 | Ilimitado |
southamerica-east1 | Ilimitado |
southamerica-west1 | Ilimitado |
europe-west2 | Ilimitado |
europe-west1 | Ilimitado |
europe-west4 | Ilimitado |
europe-west6 | Ilimitado |
europe-west3 | Ilimitado |
europe-north1 | Ilimitado |
europe-central2 | Ilimitado |
europe-west8 | Ilimitado |
europe-west9 | Ilimitado |
europe-southwest1 | Ilimitado |
asia-south1 | Ilimitado |
asia-south2 | Ilimitado |
asia-southeast1 | Ilimitado |
asia-southeast2 | Ilimitado |
asia-east2 | Ilimitado |
asia-east1 | Ilimitado |
asia-northeast1 | Ilimitado |
asia-northeast2 | Ilimitado |
australia-southeast1 | Ilimitado |
australia-southeast2 | Ilimitado |
asia-northeast3 | Ilimitado |
me-west1 | Ilimitado |
me-central1 | Ilimitado |
me-central2 | Ilimitado |
europe-west12 | Ilimitado |
africa-south1 | Ilimitado |
Número de GPUs H200 simultáneas para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 0 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | 8 |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | 0 |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | 8 |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPU P4 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | 6 |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 6 |
us-east1 | No disponible |
us-east4 | 1 |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | 6 |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 6 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 6 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | 6 |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPU T4 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 2 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 12 |
us-east1 | 2 |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | 6 |
europe-west1 | No disponible |
europe-west4 | 2 |
europe-west6 | No disponible |
europe-west3 | 0 |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | 6 |
asia-south2 | No disponible |
asia-southeast1 | 1 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | 6 |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | 1 |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs L4 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 0 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | 0 |
us-east4 | 0 |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | 0 |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 0 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | 0 |
asia-south2 | No disponible |
asia-southeast1 | 0 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | 0 |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | 0 |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPU P100 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 30 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | 30 |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | 30 |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | 6 |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs V100 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 6 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 6 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 6 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | 6 |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs A100 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 8 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 8 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 8 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPU A100 de 80 GB simultáneas para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | 0 |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 0 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 0 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Para obtener más información, consulta Ver y gestionar cuotas.
Número de GPUs H100 simultáneas para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 0 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 0 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 0 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | 0 |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPU B200 simultáneas para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs GB200 simultáneas para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs H100 Mega simultáneas para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | 0 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 0 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | 0 |
asia-northeast2 | No disponible |
australia-southeast1 | 0 |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Para obtener más información, consulta Ver y gestionar cuotas.
Número de núcleos de TPU V2 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 0 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | 0 |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de núcleos de pods de TPU V2 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | No disponible |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de núcleos de TPU V3 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 0 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | 0 |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de núcleos de pods de TPU V3 para el entrenamiento por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | No disponible |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Uso de HDD (GB) durante el entrenamiento, por región | |
---|---|
Región | Valor |
us-west1 | 180.000 |
us-west2 | 3600 |
us-west3 | 180.000 |
us-west4 | 3600 |
us-central1 | 180.000 |
us-east1 | 180.000 |
us-east4 | 3600 |
us-east5 | 3600 |
us-south1 | 180.000 |
northamerica-northeast1 | 180.000 |
northamerica-northeast2 | 3600 |
southamerica-east1 | 3600 |
southamerica-west1 | 3600 |
europe-west2 | 180.000 |
europe-west1 | 180.000 |
europe-west4 | 180.000 |
europe-west6 | 3600 |
europe-west3 | 180.000 |
europe-north1 | 3600 |
europe-central2 | 180.000 |
europe-west8 | 3600 |
europe-west9 | 180.000 |
europe-southwest1 | 3600 |
asia-south1 | 180.000 |
asia-south2 | 3600 |
asia-southeast1 | 180.000 |
asia-southeast2 | 180.000 |
asia-east2 | 180.000 |
asia-east1 | 180.000 |
asia-northeast1 | 180.000 |
asia-northeast2 | 3600 |
australia-southeast1 | 180.000 |
australia-southeast2 | 3600 |
asia-northeast3 | 180.000 |
me-west1 | 180.000 |
me-central1 | 3600 |
me-central2 | 3600 |
europe-west12 | 3600 |
africa-south1 | 3600 |
Uso de SSD (GB) durante el entrenamiento, por región | |
---|---|
Región | Valor |
us-west1 | 75.000 |
us-west2 | 450 |
us-west3 | 75.000 |
us-west4 | 450 |
us-central1 | 75.000 |
us-east1 | 75.000 |
us-east4 | 450 |
us-east5 | 450 |
us-south1 | 75.000 |
northamerica-northeast1 | 75.000 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 75.000 |
europe-west1 | 75.000 |
europe-west4 | 75.000 |
europe-west6 | 450 |
europe-west3 | 75.000 |
europe-north1 | 450 |
europe-central2 | 75.000 |
europe-west8 | 450 |
europe-west9 | 75.000 |
europe-southwest1 | 450 |
asia-south1 | 75.000 |
asia-south2 | 450 |
asia-southeast1 | 75.000 |
asia-southeast2 | 75.000 |
asia-east2 | 75.000 |
asia-east1 | 75.000 |
asia-northeast1 | 75.000 |
asia-northeast2 | 450 |
australia-southeast1 | 75.000 |
australia-southeast2 | 450 |
asia-northeast3 | 75.000 |
me-west1 | 75.000 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
Uso de Hyperdisk Balanced (GB) durante el entrenamiento, por región | |
---|---|
Región | Valor |
us-west1 | 75.000 |
us-west2 | 450 |
us-west3 | 450 |
us-west4 | 450 |
us-central1 | 75.000 |
us-east1 | 450 |
us-east4 | 75.000 |
us-east5 | 450 |
us-south1 | 75.000 |
northamerica-northeast1 | 450 |
northamerica-northeast2 | 450 |
southamerica-east1 | 450 |
southamerica-west1 | 450 |
europe-west2 | 450 |
europe-west1 | 75.000 |
europe-west4 | 75.000 |
europe-west6 | 450 |
europe-west3 | 450 |
europe-north1 | 450 |
europe-central2 | 450 |
europe-west8 | 450 |
europe-west9 | 450 |
europe-southwest1 | 450 |
asia-south1 | 75.000 |
asia-south2 | 450 |
asia-southeast1 | 450 |
asia-southeast2 | 450 |
asia-east2 | 450 |
asia-east1 | 450 |
asia-northeast1 | 450 |
asia-northeast2 | 450 |
australia-southeast1 | 450 |
australia-southeast2 | 450 |
asia-northeast3 | 450 |
me-west1 | 450 |
me-central1 | 450 |
me-central2 | 450 |
europe-west12 | 450 |
africa-south1 | 450 |
sirviendo
Cuota | Valor |
---|---|
Número de réplicas de modelos personalizados desplegadas | 100 |
Número de CPUs para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 2200 |
us-west2 | 2200 |
us-west3 | 2200 |
us-west4 | 16 |
us-central1 | 2200 |
us-east1 | 2200 |
us-east4 | 2200 |
us-east5 | 16 |
us-south1 | 450 |
northamerica-northeast1 | 2200 |
northamerica-northeast2 | 450 |
southamerica-east1 | 2200 |
southamerica-west1 | 450 |
europe-west2 | 2200 |
europe-west1 | 2200 |
europe-west4 | 2200 |
europe-west6 | 2200 |
europe-west3 | 2200 |
europe-north1 | 16 |
europe-central2 | 450 |
europe-west8 | 16 |
europe-west9 | 16 |
europe-southwest1 | 16 |
asia-south1 | 2200 |
asia-south2 | 16 |
asia-southeast1 | 2200 |
asia-southeast2 | 2200 |
asia-east2 | 2200 |
asia-east1 | 2200 |
asia-northeast1 | 2200 |
asia-northeast2 | 16 |
australia-southeast1 | 2200 |
australia-southeast2 | 16 |
asia-northeast3 | 2200 |
me-west1 | 450 |
me-central1 | 16 |
me-central2 | 16 |
europe-west12 | 16 |
africa-south1 | 16 |
Número de GPUs H200 simultáneas para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 0 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | 0 |
us-east5 | No disponible |
us-south1 | 8 |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | 0 |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | 8 |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPU P100 para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 30 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 56 |
us-east1 | 30 |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | 30 |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | 30 |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs P4 para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | 6 |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 6 |
us-east1 | No disponible |
us-east4 | 6 |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | 6 |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 6 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 6 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | 6 |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs T4 para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 12 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 12 |
us-east1 | 12 |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | 12 |
europe-west1 | No disponible |
europe-west4 | 12 |
europe-west6 | No disponible |
europe-west3 | 0 |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | 6 |
asia-south2 | No disponible |
asia-southeast1 | 6 |
asia-southeast2 | No disponible |
asia-east2 | 12 |
asia-east1 | 6 |
asia-northeast1 | 6 |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | 6 |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs L4 para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 28 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 28 |
us-east1 | 28 |
us-east4 | 28 |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | 28 |
europe-west1 | 28 |
europe-west4 | 28 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 28 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | 28 |
asia-northeast1 | 28 |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs V100 para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 6 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 6 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 6 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs A100 para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 14 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 14 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 14 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | 14 |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | 14 |
me-west1 | 1 |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs A100 de 80 GB para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 1 |
us-east1 | No disponible |
us-east4 | 1 |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 1 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 1 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPU B200 simultáneas para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs GB200 simultáneas para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | No disponible |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de GPUs H100 para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 8 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | 16 |
us-east1 | No disponible |
us-east4 | 0 |
us-east5 | 16 |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 16 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 16 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de mega-GPUs H100 para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 0 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | 0 |
us-central1 | 0 |
us-east1 | No disponible |
us-east4 | 0 |
us-east5 | 0 |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | 0 |
europe-west4 | 0 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 0 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | 0 |
asia-northeast2 | No disponible |
australia-southeast1 | 0 |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de chips de TPU v5e para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | 4 |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | 0 |
us-central1 | 32 |
us-east1 | No disponible |
us-east4 | No disponible |
us-east5 | No disponible |
us-south1 | 32 |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 32 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | 32 |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | No disponible |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Número de chips de TPU v6e para el servicio, por región | |
---|---|
Región | Valor |
us-west1 | No disponible |
us-west2 | No disponible |
us-west3 | No disponible |
us-west4 | No disponible |
us-central1 | No disponible |
us-east1 | 0 |
us-east4 | No disponible |
us-east5 | 0 |
us-south1 | No disponible |
northamerica-northeast1 | No disponible |
northamerica-northeast2 | No disponible |
southamerica-east1 | No disponible |
southamerica-west1 | No disponible |
europe-west2 | No disponible |
europe-west1 | No disponible |
europe-west4 | 8 |
europe-west6 | No disponible |
europe-west3 | No disponible |
europe-north1 | No disponible |
europe-central2 | No disponible |
europe-west8 | No disponible |
europe-west9 | No disponible |
europe-southwest1 | No disponible |
asia-south1 | No disponible |
asia-south2 | No disponible |
asia-southeast1 | No disponible |
asia-southeast2 | No disponible |
asia-east2 | No disponible |
asia-east1 | No disponible |
asia-northeast1 | 0 |
asia-northeast2 | No disponible |
australia-southeast1 | No disponible |
australia-southeast2 | No disponible |
asia-northeast3 | No disponible |
me-west1 | No disponible |
me-central1 | No disponible |
me-central2 | No disponible |
europe-west12 | No disponible |
africa-south1 | No disponible |
Límites de modelos con entrenamiento personalizado
Los siguientes límites se aplican a los modelos con entrenamiento personalizado de Vertex AI de un proyecto o región concretos.
sirviendo
Límite | Valor |
---|---|
Número de réplicas por proyecto | 200 |
Número de contenedores por clúster | 25.000 |
Vertex AI Feature Store
En esta sección se indican las cuotas y los límites de los siguientes elementos:
Vertex AI Feature Store
Las siguientes cuotas se aplican a un proyecto y una región concretos. Por ejemplo, en un mismo proyecto, puedes tener 200 nodos de entrega online en us-central1
y otros 50 nodos en us-east4
.
Cuota | Valor |
---|---|
Solicitudes de servicio online por minuto | 300.000 |
Número máximo de instancias de FeatureOnlineStore |
10 |
Número máximo de solicitudes de búsqueda por minuto | 6.000.000 |
Número máximo de nodos de entrega online en todas las instancias de FeatureOnlineStore optimizadas del proyecto |
80 |
Número máximo de instancias de FeatureView en todas las instancias de FeatureOnlineStore |
30 |
Vertex AI Feature Store también tiene los siguientes límites. No puedes solicitar un aumento de ninguno de los límites de la siguiente tabla:
Límite | Valor |
---|---|
Número máximo de recursos FeatureGroup en un proyecto y una ubicación |
250 |
Número máximo de recursos Feature en un FeatureGroup |
10.000 |
Tamaño máximo de los datos de características por entidad | 5 MB |
Número de IDs de entidad por solicitud de publicación online (FetchFeatureValues ) |
1 |
Longitud máxima de un ID de entidad | 4076 caracteres |
Límite de almacenamiento de un nodo de entrega online optimizada | 200 GB |
Vertex AI Feature Store (antigua)
Las siguientes cuotas se aplican a un proyecto y una región concretos. Por ejemplo, en un solo proyecto, puedes tener 75 tareas por lotes simultáneas en us-central1
y otras 75 tareas en europe-west4
.
Cuota | Valor |
---|---|
Solicitudes de servicio online por minuto | 300.000 |
Solicitudes de ingestión de streaming por minuto | 60.000 |
Rendimiento de escritura de la ingestión en streaming por minuto | 1,2 GB |
Solicitudes de creación de funciones por minuto | 100 |
Nodos de entrega online en todos los almacenes de características | 30 |
Tareas por lotes simultáneas (ingestión, publicación y eliminación de valores de características combinadas) | 75 |
Solicitudes simultáneas para eliminar valores de características | 1 |
Tipos de entidades de todas las feature stores | 75 |
Vertex AI Feature Store (antigua) también tiene los siguientes límites. No puedes solicitar un aumento de ninguno de los límites de la siguiente tabla:
Límite | Valor |
---|---|
Límite de almacenamiento de un nodo de entrega online | 5 TB |
Total de datos en el almacenamiento sin conexión | Ilimitado |
Funciones por tipo de entidad | 5000 |
Número de solicitudes de creación, actualización y eliminación de almacenes de características por día, proyecto y región | 500 |
En el caso de la ingesta de datos en streaming, el tamaño por solicitud | 1 MB |
En la lectura de streaming, el número de entidades que se pueden incluir por solicitud | 100 |
En el caso de la importación en lote, el número de archivos que se pueden incluir por solicitud | 5000 para Avro o 500 para CSV |
Para las solicitudes de servicio y las exportaciones en lote, el número de funciones que puedes solicitar | 5000 |
En la ingestión por lotes y en la ingestión en streaming, la marca de tiempo más antigua para la que se pueden ingerir datos de características. | 4000 días a partir de la fecha actual |
El límite de conservación de datos en Vertex AI Feature Store (antigua) tiene el siguiente valor predeterminado, que puedes anular:
Valores predeterminados de conservación de datos | Valor predeterminado |
---|---|
Conservación de datos en la tienda sin conexión (marca de tiempo del valor de la función más antiguo a partir del cual se eliminan los valores) | 4000 días a partir de la fecha actual |
Conservación de datos en la tienda online (la marca de tiempo del valor de la función más antiguo después del cual se eliminan los valores) | 4000 días a partir de la fecha actual |
Puede anular el límite de conservación de datos de las siguientes formas:
Para anular el límite de conservación de datos de la tienda online, defina el parámetro
online_storage_ttl_days
al crear o actualizar un almacén de características.Para anular el límite de retención de datos de la tienda offline, defina el parámetro
offline_storage_ttl_days
al crear o actualizar un tipo de entidad.
Vector Search
Las cuotas que se describen a continuación se aplican a Vector Search de un proyecto concreto en cada región.
Cuota | Valor |
---|---|
Operaciones de creación de índices simultáneas | 5 |
Operaciones de actualización de índices simultáneas | 5 |
Número de nodos de índice desplegados | 50 |
Número de nodos N2D de índice desplegados | 5 |
Número de índices | 100 |
Solicitudes de actualización de streaming por minuto | 6000 |
Rendimiento de actualización de streaming(en KB) por minuto | 120.000 |
Vertex ML Metadata
Los siguientes límites se aplican a Vertex ML Metadata de un proyecto concreto en cada región.
Límite | Valor |
---|---|
Tamaño máximo serializado del campo de metadatos de un recurso | 204.800 bytes |
Tamaño máximo serializado de los esquemas de metadatos | 204.800 bytes |
Vertex AI Pipelines
Las siguientes cuotas y límites se aplican a Vertex AI Pipelines en un proyecto concreto de cada región.
Cuota | Valor |
---|---|
Ejecutar tareas de flujo de trabajo en paralelo* | 600 |
Ejecuciones simultáneas de flujos de procesamiento* | 300 |
* Las solicitudes de ejecución de flujos de trabajo y de tareas que superen este límite se pondrán en cola hasta que haya recursos disponibles.
Vertex AI Pipelines tiene los siguientes límites. Ten en cuenta que, a diferencia de las cuotas, no puedes solicitar un aumento de un límite.
Límite | Valor |
---|---|
Número de tareas de flujo de procesamiento por trabajo | 10.000 |
Artefactos de entrada y salida por tarea de flujo de procesamiento | 100 |
Artefactos de entrada y salida por trabajo de flujo de procesamiento | 10.000 |
Tamaño máximo de la carga útil de JSON que contiene parámetros de salida y artefactos por tarea de la canalización | 131.072 bytes |
Tiempo máximo de ejecución de una tarea de una canalización** | 7 días |
* Las tareas de la canalización que superen este límite se cancelarán.
Cuotas y límites de Colab Enterprise
Las cuotas y los límites de Colab Enterprise se indican por separado. Consulta las cuotas y los límites de Colab Enterprise.
Aumento de la cuota
Si quieres aumentar alguna de tus cuotas de Vertex AI, puedes solicitarlo a través de la Google Cloud consola.
Para obtener más información sobre cómo enviar una solicitud de aumento de cuota, consulta las siguientes secciones de Ver y gestionar cuotas:
Cuotas por región y modelo
Ver y editar las cuotas en la Google Cloud consola
Para ver y editar las cuotas en la Google Cloud consola, siga estos pasos:- Ve a la página Cuotas y límites del sistema.
- Para ajustar la cuota, copie y pegue la propiedad
aiplatform.googleapis.com/generate_content_requests_per_minute_per_project_per_base_model
en el filtro. Pulsa Intro. - Haz clic en los tres puntos que hay al final de la fila y selecciona Editar cuota.
- Introduce un nuevo valor de cuota en el panel y haz clic en Enviar solicitud.
Ir a Cuotas y límites del sistema
Consulta las cuotas de solicitudes por minuto (RPM) por región y por modelo
De forma predeterminada, los modelos de Gemini 2.0 y versiones posteriores usan la cuota compartida dinámica (DSQ).
Elige una región para ver las cuotas de cada modelo disponible:
Aumentar las cuotas
Si quieres aumentar alguna de tus cuotas de IA generativa en Vertex AI, puedes solicitarlo a través de la Google Cloud consola.
Cuotas de RAG Engine
Para que cada servicio realice la generación aumentada de recuperación (RAG) con RAG Engine, se aplican las siguientes cuotas, que se miden como solicitudes por minuto (RPM).Servicio | Cuota | Métrica |
---|---|---|
APIs de gestión de datos de RAG Engine | 60 RPM | VertexRagDataService requests per minute per region |
RetrievalContexts API |
600 RPM | VertexRagService retrieve requests per minute per region |
base_model: textembedding-gecko |
1500 RPM | Online prediction requests per base model per minute per region per base_model Otro filtro que puede especificar es base_model: textembedding-gecko |
Servicio | Límite | Métrica |
---|---|---|
Solicitudes simultáneas de ImportRagFiles |
3 RPM | VertexRagService concurrent import requests per region |
Número máximo de archivos por solicitud ImportRagFiles |
10.000 | VertexRagService import rag files requests per region |
Para obtener más información sobre los límites de frecuencia y las cuotas, consulta los límites de frecuencia de la IA generativa en Vertex AI.
Solicitudes en lote
Las cuotas y los límites de los trabajos de inferencia por lotes son los mismos en todas las regiones.Límites de tareas de inferencia por lotes simultáneas para modelos de Gemini
No hay límites de cuota predefinidos para la inferencia por lotes de los modelos de Gemini. En su lugar, el servicio de lote proporciona acceso a un gran conjunto de recursos compartidos que se asignan dinámicamente en función de la disponibilidad en tiempo real del modelo y de la demanda de todos los clientes de ese modelo. Cuando haya más clientes activos y se sature la capacidad del modelo, es posible que tus solicitudes por lotes se pongan en cola por falta de capacidad.Cuotas de tareas de inferencia por lotes simultáneas para modelos que no son de Gemini
En la siguiente tabla se indican las cuotas del número de tareas de inferencia por lotes simultáneas, que no se aplican a los modelos de Gemini:Cuota | Valor |
---|---|
aiplatform.googleapis.com/textembedding_gecko_concurrent_batch_prediction_jobs |
4 |
Cuotas de modelos entrenados personalizados
Las siguientes cuotas se aplican a los modelos ajustados de IA generativa en Vertex AI de un proyecto o región concretos:Cuota | Valor |
---|---|
Núcleos de pods de TPU V3 para entrenamiento de imágenes restringidas por región * región admitida: europe-west4 |
64 |
Entrenamiento de imágenes restringidas con GPUs Nvidia A100 de 80 GB por región * región admitida: us-central1 * región admitida: us-east4 |
8 2 |
Límites de inserción de texto
Cada solicitud puede tener hasta 250 textos de entrada (que generan una inserción por texto de entrada) y 20.000 tokens por solicitud. Solo se usan los primeros 2048 tokens de cada texto de entrada para calcular las inserciones. En el caso degemini-embedding-001
, la cuota se indica en el nombre gemini-embedding
.
Tokens de entrada de contenido insertado por minuto y por modelo base
A diferencia de los modelos de inserción anteriores, que estaban limitados principalmente por las cuotas de RPM, la cuota del modelo de inserción de Gemini limita el número de tokens que se pueden enviar por minuto y por proyecto.
Cuota | Valor |
---|---|
Tokens de entrada de contenido insertado por minuto | 5.000.000 |
Cuotas de servicio del servicio de evaluación de la IA generativa
El servicio de evaluación de IA generativa usagemini-2.0-flash
como modelo de juez predeterminado para las métricas basadas en modelos.
Una sola solicitud de evaluación de una métrica basada en modelos puede dar lugar a varias solicitudes subyacentes al servicio de evaluación de la IA generativa. La cuota de cada modelo se calcula por proyecto, lo que significa que las solicitudes dirigidas a gemini-2.0-flash
para la inferencia de modelos y la evaluación basada en modelos contribuyen a la cuota.
En la siguiente tabla se muestran las cuotas del servicio de evaluación de la IA generativa y del modelo de juez subyacente:
Solicitar cuota | Cuota predeterminada |
---|---|
Solicitudes del servicio de evaluación de la IA generativa por minuto | 1000 solicitudes por proyecto y región |
Solicitudes de predicción online por minuto parabase_model: gemini-2.0-flash |
Consulta las cuotas por región y modelo. |
Si recibes un error relacionado con las cuotas al usar el servicio de evaluación de IA generativa, es posible que tengas que enviar una solicitud de aumento de cuota. Para obtener más información, consulta Ver y gestionar cuotas.
Límite | Valor |
---|---|
Tiempo de espera de la solicitud del servicio de evaluación de la IA generativa | 60 segundos |
Cuando uses el servicio de evaluación de IA generativa por primera vez en un proyecto nuevo, puede que experimentes un retraso inicial de hasta dos minutos. Si la primera solicitud falla, espera unos minutos y vuelve a intentarlo. Las solicitudes de evaluación posteriores suelen completarse en un plazo de 60 segundos.
El número máximo de tokens de entrada y salida de las métricas basadas en modelos depende del modelo que se utilice como modelo de juez. Consulta los modelos de Google para ver una lista de modelos.
Cuotas de evaluación de flujos de procesamiento
Si recibes un error relacionado con las cuotas al usar el servicio de canalizaciones de evaluación, es posible que tengas que presentar una solicitud de aumento de cuota. Para obtener más información, consulta Ver y gestionar cuotas. El servicio de flujos de procesamiento de evaluación usa Vertex AI Pipelines para ejecutarPipelineJobs
. Consulta las cuotas correspondientes de Vertex AI Pipelines. A continuación, se incluyen algunas recomendaciones generales sobre las cuotas:
Servicio | Cuota | Recomendación |
---|---|---|
API de Vertex AI | Tareas de predicción por lotes de LLM simultáneas por región | Por puntos: 1 * num_concurrent_pipelines Por pares: 2 * num_concurrent_pipelines |
API de Vertex AI | Solicitudes de evaluación por minuto y región | 1000 * num_concurrent_pipelines |
Tasks | Cuota | Modelo base | Recomendación |
---|---|---|---|
summarization question_answering |
Solicitudes de predicción online por modelo base por minuto por región por base_model | text-bison |
60 * num_concurrent_pipelines |
Vertex AI Agent Engine
Se aplican los siguientes límites a Vertex AI Agent Engine en cada región de un proyecto determinado:Descripción | Límite |
---|---|
Crear, eliminar o actualizar Vertex AI Agent Engine por minuto | 10 |
Crear, eliminar o actualizar sesiones de Vertex AI Agent Engine por minuto | 100 |
Query o StreamQuery Vertex AI Agent Engine por minuto |
90 |
Añadir eventos a las sesiones de Vertex AI Agent Engine por minuto | 300 |
Número máximo de recursos de Vertex AI Agent Engine | 100 |
Crear, eliminar o actualizar recursos de memoria de Vertex AI Agent Engine por minuto | 100 |
Obtener, enumerar o recuperar datos de Memory Bank de Vertex AI Agent Engine por minuto | 300 |
Solicitudes de ejecución por minuto del entorno de pruebas (ejecución de código) | 1000 |
Entidades de entorno aislado (ejecución de código) por región | 1000 |
Solucionar el error 429
Para solucionar el error 429, consulta Código de error 429.
Siguientes pasos
- Consulta más información sobre las cuotas y los límites de la IA generativa en Vertex AI.