En este documento se indican las cuotas y los límites del sistema que se aplican a Gemini para Google Cloud.
- Las cuotas especifican la cantidad de un recurso compartido y contable que puedes usar. Las cuotas se definen por Google Cloud servicios como Gemini for Google Cloud.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de unGoogle Cloud recurso que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una serie de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir el número de llamadas a una API enviadas a un servicio, el número de balanceadores de carga que usa tu proyecto de forma simultánea o el número de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud al evitar que se sobrecarguen los servicios. Las cuotas también te ayudan a gestionar tus propios Google Cloud recursos.
El sistema de cuotas de Cloud hace lo siguiente:
- Monitoriza tu consumo de Google Cloud productos y servicios
- Restringe el consumo de esos recursos
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota.
En la mayoría de los casos, cuando intentas consumir más recursos de los que permite la cuota, el sistema bloquea el acceso al recurso y la tarea que intentas realizar falla.
Las cuotas se aplican generalmente a nivel de Google Cloud proyecto. El uso que hagas de un recurso en un proyecto no afectará a la cuota disponible en otro proyecto. En un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También hay límites del sistema en los recursos de Gemini. Los límites del sistema no se pueden cambiar.
Solicitudes por segundo
Gemini para Google Cloud aplica cuotas a las solicitudes por segundo de cada usuario de un proyecto.
Cuota | Valor |
---|---|
Solicitudes por segundo | 2 |
Solicitudes diarias
Gemini para Google Cloud aplica cuotas al número total de solicitudes por día de cada usuario de un proyecto.
Cuota | Valor |
---|---|
Solicitudes al día de Gemini Code Assist o Gemini en BigQuery para código, como la generación y la finalización de código. | 6000 |
Peticiones al día de chat, visualización, análisis de tablas de estadísticas de datos, generación de metadatos, preparación de datos y otras peticiones que muestran respuestas en el panel Asistente de Cloud de la consola y los IDEs de Google Cloud . | 960 |
Cuotas de Gemini Code Assist
Gemini Code Assist aplica cuotas a determinadas funciones.
Cuota | Valor |
---|---|
Concienciación sobre código base local | Ventana de contexto de 1.000.000 de tokens |
Repositorios de personalización de código | 20.000 |
Cuotas del modo Agente y de Gemini CLI
Las cuotas de las solicitudes del modo Agente de Gemini Code Assist y de la CLI de Gemini se combinan. Cuando se usa el modo Agente o la interfaz de línea de comandos de Gemini, una petición puede dar lugar a varias solicitudes.
Cuota | Edición de Gemini Code Assist | Valor |
---|---|---|
Solicitudes por usuario y minuto | Estándar | 120 |
Empresa | 120 | |
Solicitudes por usuario al día | Estándar | 1500 |
Empresa | 2000 |
Cuotas de Gemini en BigQuery
En el caso de las funciones de asistencia de código, la cuota de Gemini Code Assist y de las solicitudes de código de Gemini en BigQuery para funciones como la finalización y la generación de código es la misma.
En el caso de los clientes que usen Gemini en BigQuery con la opción de computación bajo demanda de BigQuery o con las ediciones Enterprise o Enterprise Plus, las cuotas de las funciones avanzadas, como las estadísticas de datos, se proporcionan en función del uso medio diario de TiB analizados o de las horas de ranura del último mes natural completo. Esta cuota se aplica a nivel de organización y está disponible para todos los proyectos de esa organización. Las cuotas se redondean al alza a las 100 horas de ranura más próximas.
Cuotas por cada 100 horas de ranura (uso medio diario de la edición Enterprise o Enterprise Plus) o por cada TiB analizado con el modelo de computación bajo demanda | Valor |
---|---|
Solicitudes por día de chat, visualización, análisis de tablas y otras solicitudes que muestran respuestas en el panel Asistencia de Cloud de la consola de Google Cloud . | 5 |
Ejemplo: Una organización que tenga una reserva de la edición Enterprise con 100 espacios como base usará una media de 2400 horas de espacio cada día (100 espacios × 24 horas = 2400 horas de espacio). Por lo tanto, al mes siguiente, obtendrán las siguientes cuotas diarias:
- 120 chats, visualizaciones, análisis de tablas de datos y generaciones de metadatos automatizadas al día
Si tu organización no ha comprado ningún slot de BigQuery Enterprise edition, Enterprise Plus edition ni computación bajo demanda (TiB) hasta ahora, después de tu primer uso recibirás la cuota predeterminada de lo siguiente durante el primer mes natural completo:
- 250 chats, visualizaciones, análisis de tablas de estadísticas de datos y generaciones de metadatos automatizadas al día
Si empiezas a usar la computación bajo demanda o las reservas de la edición Enterprise o Enterprise Plus a mitad de mes, se aplicará la cuota predeterminada hasta el final del mes siguiente.
Solicitar un aumento de cuota
Para ajustar la mayoría de las cuotas, usa la Google Cloud consola. Para obtener más información, consulta Solicitar un ajuste de cuota.