En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Gemini para Google Cloud.
- Las cuotas especifican la cantidad de un recurso compartido contable que puedes usar. Las cuotas se definen según Google Cloud servicios como Gemini para Google Cloud.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud mediante la prevención de la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos Google Cloud .
El sistema de cuotas Cloud realiza las siguientes acciones:
- Supervisa el consumo de Google Cloud productos y servicios
- Restringe el consumo de esos recursos.
- Proporciona una forma de solicitar cambios en el valor de la cuota y automatizar los ajustes de la cuota.
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.
Por lo general, las cuotas se aplican a nivel del proyecto de Google Cloud. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También existen límites del sistema para los recursos de Gemini. Los límites del sistema no se pueden cambiar.
Solicitudes por segundo
Gemini para Google Cloud aplica cuotas en las solicitudes por segundo para cada usuario en un proyecto.
Cuota | Valor |
---|---|
Solicitudes por segundo | 2 |
Solicitudes por día
Gemini para Google Cloud aplica cuotas para la cantidad total de solicitudes por día de cada usuario en un proyecto.
Cuota | Valor |
---|---|
Solicitudes por día para Gemini Code Assist o Gemini en solicitudes de código de BigQuery, como la generación y finalización de código. | 6000 |
Solicitudes por día para chat, visualización, análisis de tablas de estadísticas de datos, generación de metadatos, preparación de datos y otras solicitudes que muestran respuestas en el panel Cloud Assist en la consola de Google Cloud y los IDEs. | 960 |
Cuotas de Gemini Code Assist
Gemini Code Assist aplica cuotas para ciertas funciones.
Cuota | Valor |
---|---|
Reconocimiento de la base de código local | Ventana de contexto de 128,000 tokens |
Repositorios de personalización de código | 20,000 |
Cuotas de Gemini en BigQuery
En el caso de las funciones de asistencia de código, la cuota de Gemini Code Assist y Gemini en BigQuery para las solicitudes de código de funciones como la finalización y la generación de código es la misma.
En el caso de los clientes que usan Gemini en BigQuery con el procesamiento según demanda de BigQuery o con las ediciones Enterprise o Enterprise Plus, las cuotas para las funciones avanzadas, como las estadísticas de datos, se proporcionan en función del uso promedio diario de TiB analizados o las ranuras-hora del último mes calendario completo. Esta cuota se aplica a nivel de la organización y está disponible para todos los proyectos de esa organización. Las cuotas se redondean al uso de 100 períodos de tiempo de la ranura más cercano.
Cuotas por 100 ranuras-hora (uso promedio diario de la edición Enterprise o Enterprise Plus) o por TiB analizado con el modelo de procesamiento según demanda | Valor |
---|---|
Solicitudes por día para chat, visualización, análisis de tablas y otras solicitudes que muestran respuestas en el panel Cloud Assist de la consola de Google Cloud. | 5 |
Ejemplo: Una organización que tiene una reserva de la edición Enterprise con 100 ranuras como modelo de referencia usará un promedio de 2,400 ranuras-hora por día (100 ranuras × 24 horas = 2,400 ranuras-hora). Como resultado, en el mes siguiente, obtiene las siguientes cuotas diarias:
- 120 análisis de chats, visualizaciones, tablas de estadísticas de datos y generaciones de metadatos automatizados por día
Si tu organización no compró ninguna ranura de la edición Enterprise, de la edición Enterprise Plus ni procesamiento según demanda (TiB) hasta ahora, después de tu primer uso, recibirás la cuota predeterminada de lo siguiente para el primer mes calendario completo:
- 250 análisis de chats, visualizaciones, tablas de estadísticas de datos y generaciones de metadatos automatizados por día
Si comienzas a usar el procesamiento on demand, las reservas de la edición Enterprise o Enterprise Plus a mediados de mes, se aplicará la cuota predeterminada hasta el final del mes siguiente.
Solicita un aumento de la cuota
Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud. Para obtener más información, consulta Solicita un ajuste de cuota.