En este documento, se enumeran las cuotas y los límites del sistema que se aplican a las aplicaciones basadas en IA.
- Las cuotas especifican la cantidad de un recurso compartido contable que puedes usar. Las cuotas se definen en los servicios de Google Cloud , como las aplicaciones basadas en IA.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. Las cuotas también te ayudan a administrar tus propios recursos de Google Cloud .
El sistema de cuotas Cloud realiza las siguientes acciones:
- Supervisa tu consumo de Google Cloud productos y servicios
- Restringe el consumo de esos recursos.
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota.
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.
Por lo general, las cuotas se aplican a nivel del Google Cloud proyecto. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También existen límites del sistema para los recursos de AI Applications. Los límites del sistema no se pueden cambiar.
Cuotas de asignación
Las siguientes cuotas no se restablecen con el tiempo. En su lugar, se liberan cuando liberas el recurso. Puedes solicitar un aumento de la cuota si la cuota predeterminada no es suficiente.
Cuota | Valor |
---|---|
Cantidad de documentos por proyecto | 10,000,000 |
Cantidad de almacenes de datos por proyecto | 100* |
Cantidad de motores por proyecto | 150† |
Cantidad de operaciones de larga duración de importación pendientes por proyecto | 300 |
Cantidad de operaciones de larga duración pendientes de eliminación de documentos por proyecto | 100 |
Cantidad de controles de entrega por proyecto | 1,000 |
Cantidad de controles de entrega de refuerzo por configuración de entrega | 100 |
Cantidad de controles de entrega de filtros por configuración de entrega | 100 |
Cantidad de controles de entrega de redireccionamientos por configuración de entrega | 100 |
Cantidad de controles de entrega de sinónimos por configuración de entrega | 100 |
Cantidad de eventos del usuario por proyecto | 40,000,000,000 |
Cantidad regional de almacenes de datos por proyecto y ubicación para Global o global |
100 |
Cantidad regional de almacenes de datos por proyecto y por ubicación para la multirregión de la UE o eu |
100 |
Cantidad regional de almacenes de datos por proyecto y por ubicación para la multirregión de EE.UU. o us |
100 |
Cantidad regional de documentos por proyecto y por ubicación para Global o global |
10,000,000 |
Cantidad regional de documentos por proyecto y por ubicación para la multirregión de la UE o eu |
10,000,000 |
Cantidad regional de documentos por proyecto y por ubicación para la multirregión de EE.UU. o us |
10,000,000 |
Cantidad regional de motores por proyecto y por ubicación para Global o global |
150 |
Cantidad regional de motores por proyecto y por ubicación para la multirregión de la UE o eu |
150 |
Cantidad regional de motores por proyecto y por ubicación para la multirregión de EE.UU. o us |
150 |
Cantidad regional de eventos del usuario por proyecto y ubicación para Global o global |
40,000,000,000 |
Cantidad regional de eventos del usuario por proyecto y ubicación para la multirregión de la UE o eu |
40,000,000,000 |
Cantidad regional de eventos del usuario por proyecto y ubicación para la multirregión de EE.UU. o us |
40,000,000,000 |
* Debido a una limitación técnica, la cuota máxima para los almacenes de datos es de 500 por proyecto. Si necesitas más almacenes de datos, usa proyectos nuevos.
† Debido a una limitación técnica, la cuota máxima para los motores es de 500 por proyecto. Si necesitas más motores, usa proyectos nuevos.
Cuotas de solicitudes
Las siguientes cuotas se aplican a las solicitudes a la API de AI Applications. Puedes solicitar un aumento de la cuota si la cuota predeterminada no es suficiente.
Cuota | Valor |
---|---|
Solicitudes de consultas completas por minuto y por proyecto | 300 |
Solicitudes de lectura de búsqueda conversacional por minuto y por proyecto | 300 |
Solicitudes de escritura de búsqueda conversacional por minuto y por proyecto | 300 |
Solicitudes por lotes de documentos (como importación y eliminación intercaladas) por minuto y por proyecto | 100 |
Solicitudes de importación asíncrona de documentos (Cloud Storage, BigQuery, etc.) por minuto por proyecto | 5 |
Solicitudes de eliminación de documentos por minuto por proyecto | 100 |
Solicitudes de lectura de documentos por minuto y por proyecto | 300 |
Solicitudes de escritura de documentos por minuto y por proyecto | 12,000 |
Solicitudes de creación de evaluaciones por día y por proyecto | 5 |
Solicitudes de lectura de evaluación por minuto y por proyecto | 100 |
Solicitudes de escritura de evaluación por minuto y por proyecto | 100 |
Solicitudes de consultas a LLM (resumen de búsqueda, búsqueda de varios turnos) por minuto y por proyecto | 60 |
Cantidad de escrituras pendientes de FHIR o de transmisión de BigQuery por minuto | 6,000 |
Cantidad de conjuntos de consultas de muestra por proyecto | 100 |
Solicitudes a la API de Ranking por minuto y por proyecto | 500 |
Solicitudes de recomendaciones por minuto por proyecto | 60,000 |
Ejemplo de solicitudes de lectura de consultas por minuto y por proyecto | 200 |
Solicitudes de lectura de conjuntos de muestras de consultas por minuto y por proyecto | 100 |
Solicitudes de escritura de conjuntos de muestras de consultas por minuto y por proyecto | 100 |
Ejemplo de solicitudes de escritura de consultas por minuto y por proyecto | 200 |
Solicitudes de lectura de esquema por minuto y por proyecto | 100 |
Solicitudes de escritura de esquemas por minuto y por proyecto | 100 |
Solicitudes de búsqueda por minuto por proyecto | 300 |
Solicitudes por lotes de eventos del usuario (como importaciones y purgas) por minuto y por proyecto | 100 |
Solicitudes de recopilación de eventos del usuario por minuto, por proyecto y por usuario | 240 |
Solicitudes de escritura de eventos del usuario por minuto y por proyecto | 60,000 |
Cuota para la indexación de páginas web
Cuando tienes un almacén de datos con la indexación de sitios web avanzada activada, cada página web que indexas se incluye en la cuota de "Cantidad de documentos por proyecto" de la lista de cuotas de asignación. También puedes ver la cantidad de páginas de tu proyecto y la cuota de páginas para ese proyecto en el campo Páginas del proyecto frente a la cuota de la página Datos de un almacén de datos.
Si agregas sitios web a un almacén de datos en un proyecto y las páginas web de esos sitios superan la cuota del proyecto, los sitios web no se indexarán. Si tienes sitios web en tu almacén de datos que ya están indexados, estos seguirán indexándose como antes. Puedes solicitar que se actualice tu cuota en cualquier momento.
Solicita un aumento de la cuota
Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud . Para obtener más información, consulta Solicita un ajuste de cuota.