Cuotas y límites

En este documento se indican las cuotas y los límites del sistema que se aplican a las aplicaciones de IA.

  • Las cuotas especifican la cantidad de un recurso compartido y contable que puedes usar. Las cuotas se definen por Google Cloud servicios como Aplicaciones de IA.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios Google Cloud recursos.

El sistema de cuotas de Cloud hace lo siguiente:

En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.

Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

También hay límites del sistema en los recursos de las aplicaciones de IA. Los límites del sistema no se pueden cambiar.

Cuotas de asignación

Las siguientes cuotas no se restablecen con el tiempo. En su lugar, se liberan cuando liberas el recurso. Si la cuota predeterminada no es suficiente, puedes solicitar un aumento.

Cuota Valor
Número total de almacenes de datos por proyecto 100*
Número total de motores por proyecto 150
Número de operaciones de importación de larga duración pendientes por proyecto 300
Número de operaciones de larga duración pendientes de purga de documentos por proyecto 100
Número de controles de servicio por proyecto 1000
Número de controles de publicación de impulso por configuración de publicación 100
Número de controles de publicación de filtros por configuración de publicación 100
Número de controles de publicación de redirecciones por configuración de publicación 100
Número de controles de publicación de sinónimos por configuración de publicación 100
Número regional de almacenes de datos por proyecto y por ubicación (global, EE. UU. y UE) 100
Número regional de documentos por proyecto y por ubicación (global, EE. UU. y UE) 10.000.000
Número regional de motores por proyecto y ubicación (global, EE. UU. y UE) 150
Número regional de eventos de usuario por proyecto y ubicación (Global, EE. UU. y UE) 40.000.000.000

* Debido a una limitación técnica, la cuota máxima de almacenes de datos es de 500 por proyecto. Si necesitas más almacenes de datos, usa proyectos nuevos.

Debido a una limitación técnica, la cuota máxima de los motores es de 500 por proyecto. Si necesitas más, usa proyectos nuevos.

Cuotas de frecuencia

Las siguientes cuotas se aplican a las solicitudes de la API AI Applications. Si la cuota predeterminada no es suficiente, puedes solicitar un aumento de la cuota.

Cuota Valor
Solicitudes de consultas completas por minuto y proyecto 300
Solicitudes de lectura de búsqueda conversacional por minuto y proyecto 300
Solicitudes de escritura de búsqueda conversacional por minuto y proyecto 300
Solicitudes de documentos en lote (como importación y purga insertadas) por minuto y proyecto 100
Solicitudes de importación asíncrona de documentos (Cloud Storage, BigQuery, etc.) por minuto y proyecto 5
Solicitudes de purga de documentos por minuto y proyecto 100
Solicitudes de lectura de documentos por minuto y proyecto 300
Solicitudes de escritura de documentos por minuto y proyecto 12.000
Solicitudes de creación de evaluaciones por día y proyecto 5
Solicitudes de lectura de evaluación por minuto y proyecto 100
Solicitudes de escritura de evaluación por minuto y proyecto 100
Solicitudes de consulta de LLM (resumen de búsqueda, búsqueda multirrespuesta) por minuto y proyecto 60
Número de escrituras pendientes de FHIR o BigQuery en streaming por minuto 6000
Número de conjuntos de consultas de ejemplo por proyecto 100
Solicitudes a la API Ranking por minuto y proyecto 500
Solicitudes de recomendación por minuto y proyecto 60.000
Solicitudes de lectura de consultas de ejemplo por minuto y proyecto 200
Solicitudes de lectura de conjuntos de consultas de ejemplo por minuto y proyecto 100
Solicitudes de escritura de conjuntos de consultas de ejemplo por minuto y proyecto 100
Solicitudes de escritura de consultas de ejemplo por minuto y proyecto 200
Solicitudes de lectura de esquemas por minuto y proyecto 100
Solicitudes de escritura de esquemas por minuto y proyecto 100
Solicitudes de búsqueda regional por minuto, proyecto y ubicación (global, EE. UU. y UE) 300
Solicitudes en lote de eventos de usuario (como importaciones y purgas) por minuto y proyecto 100
Solicitudes de recogida de eventos de usuario por minuto, proyecto y usuario 240
Solicitudes de escritura de eventos de usuario por minuto y proyecto 60.000

Cuota de indexación de páginas web

Si tienes un almacén de datos con la opción Indexación avanzada de sitios web activada, cada página web que indexas se tiene en cuenta en la cuota "Número de documentos por proyecto" de la lista Cuotas de asignación. También puedes ver el número de páginas de tu proyecto y la cuota de páginas de ese proyecto en el campo Páginas del proyecto frente a cuota de la página Datos de un almacén de datos.

Si añade sitios web a un almacén de datos de un proyecto y las páginas web de esos sitios superan la cuota del proyecto, los sitios web no se indexarán. Si tiene sitios web en su almacén de datos que ya están indexados, seguirán indexándose como antes. Puedes solicitar un aumento de tu cuota en cualquier momento.

Solicitar un aumento de cuota

Para ajustar la mayoría de las cuotas, usa la Google Cloud consola. Para obtener más información, consulta Solicitar un ajuste de cuota.