Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Neste documento, listamos as cotas e os limites do sistema que se aplicam aos
aplicativos de IA.
As cotas especificam a quantidade de um recurso compartilhado e contável que
pode ser usado. As cotas são definidas por serviços Google Cloud , como
aplicativos de IA.
Os limites do sistema são valores fixos que não podem ser alterados.
Google Cloud usa cotas para garantir a imparcialidade e reduzir
picos no uso e na disponibilidade de recursos. Uma cota restringe quanto de um
recurso doGoogle Cloud seu projeto do Google Cloud pode usar. As cotas
se aplicam a vários tipos de recursos, incluindo hardware, software e componentes de rede. Por exemplo, as cotas podem restringir o número de chamadas de API para um
serviço, o número de balanceadores de carga usados simultaneamente pelo projeto ou o
número de projetos que podem ser criados. As cotas protegem a comunidade de
usuários doGoogle Cloud , impedindo a sobrecarga de serviços. As cotas também ajudam você a gerenciar seus próprios recursos Google Cloud .
O sistema de cotas do Cloud faz o seguinte:
Monitora o consumo de Google Cloud produtos e serviços
Na maioria dos casos, quando você tenta consumir mais de um recurso do que a cota
permite, o sistema bloqueia o acesso ao recurso e a tarefa que
você está tentando executar falha.
As cotas geralmente se aplicam ao nível do projeto Google Cloud . O uso de um recurso em um projeto não afeta
a cota disponível em outro. Em um Google Cloud projeto, as cotas
são compartilhadas entre todos os aplicativos e endereços IP.
Também há limites de sistemas nos recursos do AI Applications.
Não é possível alterar os limites.
cotas de alocação.
As cotas a seguir não são redefinidas com o tempo. Em vez disso, elas são liberadas quando você
libera o recurso. Se a cota padrão não for suficiente, solicite um aumento.
Cota
Valor
Número de documentos por projeto
10.000.000
Número de repositórios de dados por projeto
100*
Número de mecanismos por projeto
150†
Número de operações pendentes de longa duração para importação por projeto
300
Número de operações de longa duração pendentes de exclusão de documentos por projeto
100
Número de controles de veiculação por projeto
1.000
Número de controles de exibição de reforço por configuração de exibição
100
Número de controles de veiculação de filtros por configuração de veiculação
100
Número de controles de exibição de redirecionamento por configuração de exibição
100
Número de controles de veiculação de sinônimos por configuração de veiculação
100
Número de eventos do usuário por projeto
40.000.000.000
Número regional de repositórios de dados por projeto e local para Global ou global
100
Número regional de repositórios de dados por projeto e local para multirregião da UE ou eu
100
Número regional de armazenamentos de dados por projeto e local para multirregião dos EUA ou us
100
Número regional de documentos por projeto e por local para Global ou global
10.000.000
Número regional de documentos por projeto e local para multirregião da UE ou eu
10.000.000
Número regional de documentos por projeto e local para multirregião dos EUA ou us
10.000.000
Número regional de mecanismos por projeto e por local para Global ou global
150
Número regional de mecanismos por projeto e local para multirregião da UE ou eu
150
Número regional de mecanismos por projeto e local para multirregião dos EUA ou us
150
Número regional de eventos do usuário por projeto e local para Global ou global
40.000.000.000
Número regional de eventos do usuário por projeto e por local para multirregião da UE ou eu
40.000.000.000
Número regional de eventos do usuário por projeto e por local para multirregião dos EUA ou us
40.000.000.000
* Devido a uma limitação técnica, a cota máxima para repositórios de dados é de 500 por projeto. Se você precisar de mais repositórios de dados, use novos projetos.
† Devido a uma limitação técnica, a cota máxima para mecanismos é de 500 por projeto. Se você precisar de mais mecanismos, use novos projetos.
cotas de taxa.
As cotas a seguir se aplicam às solicitações da API AI Applications. Se a cota padrão não for suficiente, é possível solicitar um aumento.
Cota
Valor
Solicitações de consulta completa por minuto por projeto
300
Solicitações de leitura de pesquisa por conversa por minuto por projeto
300
Solicitações de gravação de pesquisa por conversa por minuto por projeto
300
Solicitações em lote de documentos (como importação e remoção inline) por minuto e projeto
100
Documentar solicitações de importação assíncrona (Cloud Storage, BigQuery etc.) por minuto por projeto
5
Solicitações de exclusão de documentos por minuto por projeto
100
Solicitações de leitura de documentos por minuto por projeto
300
Solicitações de gravação de documentos por minuto por projeto
12.000
Solicitações de criação de avaliação por dia e por projeto
5
Solicitações de leitura de avaliação por minuto por projeto
100
Solicitações de gravação de avaliação por minuto por projeto
100
Consultas de LLM (resumo da pesquisa, pesquisa em várias etapas) por minuto por projeto
60
Número de gravações pendentes de streaming do FHIR ou do BigQuery por minuto
6.000
Número de conjuntos de consultas de amostra por projeto
100
Solicitações de API de classificação por minuto e projeto
500
Solicitações de recomendação por minuto por projeto
60.000
Exemplo de solicitações de leitura de consultas por minuto por projeto
200
Exemplo de solicitações de leitura de conjunto de consultas por minuto por projeto
100
Exemplo de solicitações de gravação de conjunto de consultas por minuto por projeto
100
Exemplo de solicitações de gravação de consultas por minuto por projeto
200
Solicitações de leitura de esquema por minuto por projeto
100
Solicitações de gravação de esquema por minuto por projeto
100
Solicitações de pesquisa por minuto por projeto
300
Solicitações em lote de eventos do usuário (como importação e exclusão) por minuto e por projeto
100
Solicitações de coleta de eventos do usuário por minuto, projeto e usuário
240
Solicitações de gravação de eventos do usuário por minuto por projeto
60.000
Cota para indexação de páginas da Web
Quando você tem um repositório de dados com a Indexação avançada de sites ativada, cada página da Web indexada conta para a cota "Número de documentos por projeto" na lista Cotas de alocação. Você também pode conferir o número de páginas no seu projeto e a cota de páginas dele no campo Páginas do projeto x cota na página Dados de um repositório de dados.
Se você adicionar sites a um repositório de dados em um projeto e as páginas da Web nesses sites excederem a cota do projeto, os sites não serão indexados. Se você tiver sites no seu repositório de dados que já estão indexados, eles vão continuar sendo indexados como antes. É possível solicitar um upgrade da sua cota a qualquer momento.
Solicitar aumento de cota
Para ajustar a maioria das cotas, use o console do Google Cloud .
Para mais informações, consulte
Solicitar um ajuste de cota.
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-08-19 UTC."],[[["\u003cp\u003eQuotas define the amount of shared resources, like hardware, software, and network components, that a Google Cloud project can use within Vertex AI Agent Builder, and they are set by Google Cloud services to ensure fairness and prevent overloading.\u003c/p\u003e\n"],["\u003cp\u003eSystem limits are fixed constraints on Vertex AI Agent Builder resources that cannot be altered, unlike quotas, which can be increased upon request.\u003c/p\u003e\n"],["\u003cp\u003eThere are two types of quotas detailed: allocation quotas, which are released when the resource is no longer in use and include limits like the number of documents or data stores per project, and request quotas, which apply to API requests and involve limits on requests like document read/write, search, and user events per minute.\u003c/p\u003e\n"],["\u003cp\u003eIndexing web pages in a data store with Advanced website indexing enabled counts towards the "Number of documents per project" quota, and exceeding this quota will prevent new web pages from being indexed, though already indexed pages will continue as before.\u003c/p\u003e\n"],["\u003cp\u003eYou can request increases to most quotas, but system limits cannot be modified, and you can go to the "Request a quota adjustment" page on the Google cloud console for more information.\u003c/p\u003e\n"]]],[],null,["This document lists the quotas and system limits that apply to\nAI Applications.\n\n- *Quotas* specify the amount of a countable, shared resource that you can use. Quotas are defined by Google Cloud services such as AI Applications.\n- *System limits* are fixed values that cannot be changed.\n\nGoogle Cloud uses quotas to help ensure fairness and reduce\nspikes in resource use and availability. A quota restricts how much of a\nGoogle Cloud resource your Google Cloud project can use. Quotas\napply to a range of resource types, including hardware, software, and network\ncomponents. For example, quotas can restrict the number of API calls to a\nservice, the number of load balancers used concurrently by your project, or the\nnumber of projects that you can create. Quotas protect the community of\nGoogle Cloud users by preventing the overloading of services. Quotas also\nhelp you to manage your own Google Cloud resources.\n\nThe Cloud Quotas system does the following:\n\n- Monitors your consumption of Google Cloud products and services\n- Restricts your consumption of those resources\n- Provides a way to [request changes to the quota value](/docs/quotas/help/request_increase) and [automate quota adjustments](/docs/quotas/quota-adjuster)\n\nIn most cases, when you attempt to consume more of a resource than its quota\nallows, the system blocks access to the resource, and the task that\nyou're trying to perform fails.\n\nQuotas generally apply at the Google Cloud project\nlevel. Your use of a resource in one project doesn't affect\nyour available quota in another project. Within a Google Cloud project, quotas\nare shared across all applications and IP addresses.\n\n\nThere are also *system limits* on AI Applications resources.\nSystem limits can't be changed.\n| **Note:** Google Cloud products that use the Discovery Engine API, AI Applications (also known as Vertex AI Search) and Google Agentspace, share quotas. This means that your search and recommendations apps in Vertex AI Search share quotas with your apps in Google Agentspace.\n\nAllocation quotas\n\nThe following quotas don't reset over time. Instead, they're released when you\nrelease the resource. You can [request a quota increase](#request-a-quota-increase)\nif the default quota isn't enough.\n\n| Quota | Value |\n|--------------------------------------------------------------------------|----------------|\n| Total number of data stores per project | 100^\\*^ |\n| Total number of engines per project | 150^†^ |\n| Number of pending import long running operations per project | 300 |\n| Number of pending purge documents long running operations per project | 100 |\n| Number of serving controls per project | 1,000 |\n| Number of boost serving controls per serving config | 100 |\n| Number of filter serving controls per serving config | 100 |\n| Number of redirect serving controls per serving config | 100 |\n| Number of synonym serving controls per serving config | 100 |\n| Regional number of data stores per project per location (Global, US, EU) | 100 |\n| Regional number of documents per project per location (Global, US, EU) | 10,000,000 |\n| Regional number of engines per project per location (Global, US, EU) | 150 |\n| Regional number of user events per project per location (Global, US, EU) | 40,000,000,000 |\n\n\n^\\*^ Due to a technical limitation, the maximum quota for data stores is\n500 per project. If you need more data stores, use new projects.\n\n\n^†^ Due to a technical limitation, the maximum quota for engines is 500\nper project. If you need more engines, use new projects.\n| **Note:** The number of data stores, documents, user events, and engines across all locations can't exceed the total per-project quota for that resource. For example, if you already have 60 data stores in the `eu` multi-region and 40 in the `us` multi-region, you can't create another data store because the overall data store quota for the project is 100.\n\nRate quotas\n\nThe following quotas apply to AI Applications API requests. You can\n[request a quota increase](#request-a-quota-increase) if the default quota\nisn't enough.\n\n| Quota | Value |\n|---------------------------------------------------------------------------------------|--------|\n| Complete query requests per minute per project | 300 |\n| Conversational search read requests per minute per project | 300 |\n| Conversational search write requests per minute per project | 300 |\n| Document batch requests (such as inline import and purge) per minute per project | 100 |\n| Document async import (Cloud Storage, BigQuery, etc.) requests per minute per project | 5 |\n| Document purge requests per minute per project | 100 |\n| Document read requests per minute per project | 300 |\n| Document write requests per minute per project | 12,000 |\n| Evaluation create requests per day per project | 5 |\n| Evaluation read requests per minute per project | 100 |\n| Evaluation write requests per minute per project | 100 |\n| LLM query requests (search summarization, multi-turn search) per minute per project | 60 |\n| Number of pending FHIR or BigQuery streaming writes per minute | 6,000 |\n| Number of sample query sets per project | 100 |\n| Ranking API requests per minute per project | 500 |\n| Recommend requests per minute per project | 60,000 |\n| Sample query read requests per minute per project | 200 |\n| Sample query set read requests per minute per project | 100 |\n| Sample query set write requests per minute per project | 100 |\n| Sample query write requests per minute per project | 200 |\n| Schema read requests per minute per project | 100 |\n| Schema write requests per minute per project | 100 |\n| Regional search requests per minute per project per location (Global, US, EU) | 300 |\n| User event batch requests (such as import and purge) per minute per project | 100 |\n| User event collect requests per minute per project per user | 240 |\n| User event write requests per minute per project | 60,000 |\n\nQuota for web page indexing\n\nWhen you have a data store with\n[Advanced website indexing](/generative-ai-app-builder/docs/about-advanced-features#advanced-website-indexing)\nturned on, every web page that you index counts towards the \"Number of documents\nper project\" quota in the [Allocation quotas](#allocation-quotas) list. You can\nalso see the number of pages in your project and the page quota for that project\nin the **Project pages vs quota** field in the **Data** page for a data store.\n\nIf you add websites to a data store in a project and the web pages in those\nwebsites exceed the project's quota, the websites are not\nindexed. If you have websites in your data store that are already indexed, those\nwebsites continue to be indexed as before. You can request to [upgrade your\nquota](#request-a-quota-increase) at any time.\n\nRequest a quota increase\n\nTo adjust most quotas, use the Google Cloud console.\nFor more information, see\n[Request a quota adjustment](/docs/quotas/help/request_increase)."]]