En este documento se indican las cuotas y los límites del sistema que se aplican a las aplicaciones de IA.
- Las cuotas especifican la cantidad de un recurso compartido y contable que puedes usar. Las cuotas se definen por Google Cloud servicios como Aplicaciones de IA.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios Google Cloud recursos.
El sistema de cuotas de Cloud hace lo siguiente:
- Monitoriza tu consumo de Google Cloud productos y servicios
- Restringe el consumo de esos recursos
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota.
En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.
Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También hay límites del sistema en los recursos de las aplicaciones de IA. Los límites del sistema no se pueden cambiar.
Cuotas de asignación
Las siguientes cuotas no se restablecen con el tiempo. En su lugar, se liberan cuando liberas el recurso. Si la cuota predeterminada no es suficiente, puedes solicitar un aumento.
Cuota | Valor |
---|---|
Número total de almacenes de datos por proyecto | 100* |
Número total de motores por proyecto | 150† |
Número de operaciones de importación de larga duración pendientes por proyecto | 300 |
Número de operaciones de larga duración pendientes de purga de documentos por proyecto | 100 |
Número de controles de servicio por proyecto | 1000 |
Número de controles de publicación de impulso por configuración de publicación | 100 |
Número de controles de publicación de filtros por configuración de publicación | 100 |
Número de controles de publicación de redirecciones por configuración de publicación | 100 |
Número de controles de publicación de sinónimos por configuración de publicación | 100 |
Número regional de almacenes de datos por proyecto y por ubicación (global, EE. UU. y UE) | 100 |
Número regional de documentos por proyecto y por ubicación (global, EE. UU. y UE) | 10.000.000 |
Número regional de motores por proyecto y ubicación (global, EE. UU. y UE) | 150 |
Número regional de eventos de usuario por proyecto y ubicación (Global, EE. UU. y UE) | 40.000.000.000 |
* Debido a una limitación técnica, la cuota máxima de almacenes de datos es de 500 por proyecto. Si necesitas más almacenes de datos, usa proyectos nuevos.
† Debido a una limitación técnica, la cuota máxima de los motores es de 500 por proyecto. Si necesitas más, usa proyectos nuevos.
Cuotas de frecuencia
Las siguientes cuotas se aplican a las solicitudes de la API AI Applications. Si la cuota predeterminada no es suficiente, puedes solicitar un aumento de la cuota.
Cuota | Valor |
---|---|
Solicitudes de consultas completas por minuto y proyecto | 300 |
Solicitudes de lectura de búsqueda conversacional por minuto y proyecto | 300 |
Solicitudes de escritura de búsqueda conversacional por minuto y proyecto | 300 |
Solicitudes de documentos en lote (como importación y purga insertadas) por minuto y proyecto | 100 |
Solicitudes de importación asíncrona de documentos (Cloud Storage, BigQuery, etc.) por minuto y proyecto | 5 |
Solicitudes de purga de documentos por minuto y proyecto | 100 |
Solicitudes de lectura de documentos por minuto y proyecto | 300 |
Solicitudes de escritura de documentos por minuto y proyecto | 12.000 |
Solicitudes de creación de evaluaciones por día y proyecto | 5 |
Solicitudes de lectura de evaluación por minuto y proyecto | 100 |
Solicitudes de escritura de evaluación por minuto y proyecto | 100 |
Solicitudes de consulta de LLM (resumen de búsqueda, búsqueda multirrespuesta) por minuto y proyecto | 60 |
Número de escrituras pendientes de FHIR o BigQuery en streaming por minuto | 6000 |
Número de conjuntos de consultas de ejemplo por proyecto | 100 |
Solicitudes a la API Ranking por minuto y proyecto | 500 |
Solicitudes de recomendación por minuto y proyecto | 60.000 |
Solicitudes de lectura de consultas de ejemplo por minuto y proyecto | 200 |
Solicitudes de lectura de conjuntos de consultas de ejemplo por minuto y proyecto | 100 |
Solicitudes de escritura de conjuntos de consultas de ejemplo por minuto y proyecto | 100 |
Solicitudes de escritura de consultas de ejemplo por minuto y proyecto | 200 |
Solicitudes de lectura de esquemas por minuto y proyecto | 100 |
Solicitudes de escritura de esquemas por minuto y proyecto | 100 |
Solicitudes de búsqueda regional por minuto, proyecto y ubicación (global, EE. UU. y UE) | 300 |
Solicitudes en lote de eventos de usuario (como importaciones y purgas) por minuto y proyecto | 100 |
Solicitudes de recogida de eventos de usuario por minuto, proyecto y usuario | 240 |
Solicitudes de escritura de eventos de usuario por minuto y proyecto | 60.000 |
Cuota de indexación de páginas web
Si tienes un almacén de datos con la opción Indexación avanzada de sitios web activada, cada página web que indexas se tiene en cuenta en la cuota "Número de documentos por proyecto" de la lista Cuotas de asignación. También puedes ver el número de páginas de tu proyecto y la cuota de páginas de ese proyecto en el campo Páginas del proyecto frente a cuota de la página Datos de un almacén de datos.
Si añade sitios web a un almacén de datos de un proyecto y las páginas web de esos sitios superan la cuota del proyecto, los sitios web no se indexarán. Si tiene sitios web en su almacén de datos que ya están indexados, seguirán indexándose como antes. Puedes solicitar un aumento de tu cuota en cualquier momento.
Solicitar un aumento de cuota
Para ajustar la mayoría de las cuotas, usa la Google Cloud consola. Para obtener más información, consulta Solicitar un ajuste de cuota.