En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Gemini para Google Cloud.
- Las cuotas especifican la cantidad de un recurso compartido contable que puedes usar. Las cuotas se definen por los servicios de Google Cloud , como Gemini para Google Cloud.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu proyecto de Google Cloud . Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud evitando la sobrecarga de los servicios. Las cuotas también te ayudan a administrar tus propios recursos de Google Cloud .
El sistema de cuotas Cloud realiza las siguientes acciones:
- Supervisa tu consumo de Google Cloud productos y servicios
- Restringe el consumo de esos recursos.
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota.
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.
Por lo general, las cuotas se aplican a nivel del Google Cloud proyecto. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También existen límites del sistema para los recursos de Gemini. Los límites del sistema no se pueden cambiar.
Solicitudes por segundo
Gemini para Google Cloud aplica cuotas en las solicitudes por segundo para cada usuario de un proyecto.
Cuota | Valor |
---|---|
Solicitudes por segundo | 2 |
Solicitudes por día
Gemini para Google Cloud aplica cuotas para la cantidad total de solicitudes por día para cada usuario de un proyecto.
Cuota | Valor |
---|---|
Solicitudes por día para Gemini Code Assist o Gemini en BigQuery, como la generación y la finalización de código | 6000 |
Solicitudes por día para el chat, la visualización, los análisis de tablas de estadísticas de datos, la generación de metadatos, la preparación de datos y otras solicitudes que muestran respuestas en el panel de Cloud Assist en la consola de Google Cloud y los IDE. | 960 |
Cuotas de Gemini Code Assist
Gemini Code Assist aplica cuotas para ciertas funciones.
Cuota | Valor |
---|---|
Reconocimiento de la base de código local | Ventana de contexto de 128,000 tokens |
Repositorios de personalización de código | 20,000 |
Cuotas para el modo de agente y Gemini CLI
Las cuotas para las solicitudes del modo de agente de Gemini Code Assist y de la CLI de Gemini se combinan. Cuando se usa el modo de agente o la CLI de Gemini, una instrucción puede generar varias solicitudes.
Cuota | Edición de Gemini Code Assist | Valor |
---|---|---|
Solicitudes por usuario por minuto | Estándar | 120 |
Enterprise | 120 | |
Solicitudes por usuario por día | Estándar | 1500 |
Enterprise | 2000 |
Cuotas de Gemini en BigQuery
En el caso de las funciones de asistencia para el código, la cuota de Gemini Code Assist y Gemini en las solicitudes de código de BigQuery para funciones como la finalización y la generación de código es la misma.
Para los clientes que usan Gemini en BigQuery con procesamiento según demanda de BigQuery o con las ediciones Enterprise o Enterprise Plus, las cuotas para las funciones avanzadas, como las estadísticas de datos, se proporcionan en función del uso promedio diario de TiB analizados o de las ranuras-hora del último mes calendario completo. Esta cuota se aplica a nivel de la organización y está disponible para todos los proyectos de esa organización. Las cuotas se redondean a la centena de horas de uso más cercana.
Cuotas por cada 100 ranuras-hora (uso promedio diario de la edición Enterprise o Enterprise Plus) o por cada TiB analizado con el modelo de procesamiento según demanda | Valor |
---|---|
Son las solicitudes por día para el chat, la visualización, los análisis de tablas y otras solicitudes que muestran respuestas en el panel de Cloud Assist en la consola de Google Cloud . | 5 |
Ejemplo: Una organización que tiene una reserva de la edición Enterprise con 100 ranuras como referencia usará un promedio de 2,400 horas de ranura por día (100 ranuras * 24 horas = 2,400 horas de ranura). Como resultado, en el mes siguiente, obtienen las siguientes cuotas diarias:
- 120 chats, visualizaciones, análisis de tablas de estadísticas de datos y generaciones de metadatos automatizadas por día
Si tu organización no compró ninguna edición Enterprise o Enterprise Plus de BigQuery, ni capacidad de procesamiento según demanda (TiB) hasta ahora, después de tu primer uso, recibirás la cuota predeterminada de lo siguiente para el primer mes calendario completo:
- 250 chats, visualizaciones, análisis de tablas de estadísticas de datos y generaciones de metadatos automatizadas por día
Si comienzas a usar reservas de edición Enterprise o Enterprise Plus, o bien recursos de procesamiento según demanda a mitad de mes, se aplicará la cuota predeterminada hasta el final del mes siguiente.
Solicita un aumento de la cuota
Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud . Para obtener más información, consulta Solicita un ajuste de cuota.