Cuotas y límites

En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Gemini para Google Cloud.

  • Las cuotas especifican la cantidad de un recurso compartido contable que puedes usar. Las cuotas se definen según los servicios de Google Cloud, como Gemini para Google Cloud.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso de Google Cloud que puede usar tu proyecto de Google Cloud. Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios de Google Cloud mediante la prevención de la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud.

El sistema de cuotas Cloud realiza las siguientes acciones:

  • Supervisa el consumo de productos y servicios de Google Cloud.
  • Restringe el consumo de esos recursos.
  • Proporciona un medio para solicitar cambios en el valor de la cuota.

En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.

Por lo general, las cuotas se aplican a nivel del proyecto de Google Cloud. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

También existen límites del sistema para los recursos de Gemini. Los límites del sistema no se pueden cambiar.

Solicitudes por segundo

Gemini para Google Cloud aplica cuotas a las solicitudes por segundo para cada usuario de un proyecto.

Cuota Valor
Solicitudes por segundo 2

Solicitudes por día

Gemini para Google Cloud aplica cuotas para la cantidad total de solicitudes por día de cada usuario en un proyecto.

Cuota Valor
Solicitudes por día para Gemini Code Assist o Gemini en solicitudes de código de BigQuery, como la generación y finalización de código. 6000
Solicitudes por día para chat, visualización, análisis de tablas de estadísticas de datos y otras solicitudes que muestran respuestas en el panel Gemini en la consola de Google Cloud y los IDEs. 240

Cuotas de Gemini Code Assist

Gemini Code Assist aplica cuotas para ciertas funciones.

Cuota Valor
Reconocimiento de la base de código local Ventana de contexto de 128,000 tokens
Repositorios de personalización de código 950

Cuotas de Gemini en BigQuery

En el caso de los clientes que usan Gemini en BigQuery con la edición Enterprise Plus de BigQuery, las cuotas se proporcionan en función del uso promedio diario de las horas de las ranuras de Enterprise Plus durante el último mes calendario completo. Esta cuota se aplica a nivel de la organización y está disponible para todos los proyectos de esa organización que tengan asignados espacios para la edición Enterprise Plus. Las cuotas se redondean al uso de 100 ranuras-hora más cercano.

Cuotas por 100 ranuras-hora (uso promedio diario de la edición Enterprise Plus) Valor
Solicitudes de finalización de código por día 150
Solicitudes de generación de código por día 10
Solicitudes por día para chat, visualización, análisis de tablas y otras solicitudes que muestran respuestas en el panel Gemini de la consola de Google Cloud. 5

Ejemplo: Una organización que tiene una reserva de la edición Enterprise Plus con 100 ranuras como modelo de referencia usará un promedio de 2,400 ranuras-hora por día (100 ranuras × 24 horas = 2,400 ranuras-hora). Como resultado, en el mes siguiente, obtiene las siguientes cuotas diarias:

  • 3,600 solicitudes de finalización de código por día
  • 240 solicitudes de generación de código por día
  • 120 análisis de tablas de chat, visualización y estadísticas de datos por día

Si tu organización no compró ninguna reserva de la edición Enterprise Plus de BigQuery hasta ahora, después de que compres una reserva de la edición Enterprise Plus, recibirás la cuota predeterminada de lo siguiente para el primer mes calendario completo:

  • 7,500 solicitudes de finalización de código por día
  • 500 solicitudes de generación de código por día
  • 250 análisis de tablas de chat, visualizaciones y estadísticas de datos por día

Si comienzas a usar las reservas de la edición Enterprise Plus a mitad de mes, se aplicará la cuota predeterminada hasta el final del mes siguiente.

Solicitar un aumento de cuota

Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud. Para obtener más información, consulta Solicita un ajuste de cuota.