Cuotas y límites

Este documento enumera las cuotas y los límites del sistema que se aplican a Gemini para Google Cloud.

  • Las cuotas especifican la cantidad de un recurso compartido contable que se puede usar. Las cuotas se definen por Google Cloud servicios como Gemini para Google Cloud.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud utiliza cuotas para garantizar la equidad y reducir los picos en el uso y la disponibilidad de recursos. Una cuota restringe la cantidad de unGoogle Cloud Recursos para usted Google Cloud El proyecto puede usar. Las cuotas se aplican a diversos tipos de recursos, como hardware, software y componentes de red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API a un servicio, la cantidad de balanceadores de carga que usa el proyecto simultáneamente o la cantidad de proyectos que se pueden crear. Las cuotas protegen la comunidad de...Google Cloud usuarios al evitar la sobrecarga de servicios. Las cuotas también te ayudan a gestionar tus propios... Google Cloud recursos.

El sistema de cuotas en la nube hace lo siguiente:

En la mayoría de los casos, cuando intenta consumir más de un recurso de lo que su cuota permite, el sistema bloquea el acceso al recurso y la tarea que está intentando realizar falla.

Las cuotas generalmente se aplican en el Google Cloud nivel de proyecto. El uso de un recurso en un proyecto no afecta la cuota disponible en otro. Dentro de un Google Cloud proyecto, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

También existen límites del sistema para los recursos de Gemini. Estos límites no se pueden modificar.

Solicitudes por segundo

Géminis para Google Cloud Aplica cuotas de solicitudes por segundo para cada usuario de un proyecto.

Cuota Valor
Solicitudes por segundo 2

Solicitudes por día

Géminis para Google Cloud Aplica cuotas para la cantidad total de solicitudes por día para cada usuario de un proyecto.

Cuota Valor
Solicitudes por día para Gemini Code Assist o Gemini en solicitudes de código de BigQuery, como generación de código y finalización de código. 6000
Solicitudes por día para chat, visualización, escaneo de tablas de información de datos, generación de metadatos, preparación de datos y otras solicitudes que muestran respuestas en el panel Cloud Assist en el Google Cloud consola e IDE. 960

Cuotas para Gemini Code Assist

Gemini Code Assist aplica cuotas para determinadas funciones.

Cuota Valor
Conocimiento de la base de código local Ventana de contexto de 128.000 tokens
Repositorios de personalización de código 20.000

Cuotas para Gemini en BigQuery

Para las funciones de asistencia de código, la cuota para Gemini Code Assist y Gemini en solicitudes de código de BigQuery para funciones como finalización de código y generación de código es la misma.

Para los clientes que usan Gemini en BigQuery con BigQuery on-demand computing o con las ediciones Enterprise o Enterprise Plus, las cuotas para funciones avanzadas, como la información de datos, se proporcionan en función del uso promedio diario de TiB escaneados o de las horas de uso del último mes calendario completo. Esta cuota se aplica a la organización y está disponible para todos los proyectos de esa organización. Las cuotas se redondean al alza al centésimo uso de horas de uso más cercano.

Cuotas por cada 100 horas de ranura (uso promedio diario de la edición Enterprise o Enterprise Plus) o por TiB escaneado mediante el modelo de cómputo a pedido Valor
Solicitudes por día de chat, visualización, escaneo de tablas y otras solicitudes que muestran respuestas en el panel Cloud Assist en el Google Cloud consola. 5

Ejemplo : Una organización con una reserva de edición Enterprise de 100 franjas horarias como base utilizará un promedio de 2400 franjas horarias al día (100 franjas horarias * 24 horas = 2400 franjas horarias). Como resultado, al mes siguiente obtendrá las siguientes cuotas diarias:

  • 120 chats, visualizaciones, escaneos de tablas de información de datos y generaciones automatizadas de metadatos por día

Si su organización no ha adquirido ninguna ranura de la edición BigQuery Enterprise, la edición Enterprise Plus o computación bajo demanda (TiB) hasta ahora, luego de su primer uso recibirá la cuota predeterminada de lo siguiente para el primer mes calendario completo:

  • 250 chats, visualizaciones, escaneos de tablas de información de datos y generaciones automatizadas de metadatos por día

Si comienza a utilizar las reservas de computación bajo demanda, edición Enterprise o edición Enterprise Plus a mediados de mes, la cuota predeterminada se aplicará hasta el final del mes siguiente.

Solicitar un aumento de cuota

Para ajustar la mayoría de las cuotas, utilice el Google Cloud consola. Para obtener más información, consulte Solicitar un ajuste de cuota .