A partir de 29 de abril de 2025, os modelos Gemini 1.5 Pro e Gemini 1.5 Flash não estarão disponíveis em projetos que não os usaram antes, incluindo novos projetos. Para mais detalhes, consulte Versões e ciclo de vida do modelo.
Capacidade de processamento provisionada de zona única
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Com a capacidade de processamento provisionada de zona única, é possível reservar capacidade de processamento em regiões específicas em que apenas uma zona está disponível. Essa opção oferece
desempenho previsível para modelos do Gemini em casos de uso que exigem
processamento de ML.
Para conferir a lista de modelos e regiões compatíveis, consulte
Implantações e endpoints. Para conferir a lista de regiões e modelos que oferecem suporte ao processamento de ML, consulte Processamento de ML.
Recursos da capacidade de processamento provisionada de zona única
Nesta seção, descrevemos os principais recursos da capacidade de processamento provisionada de zona única:
Os preços e as unidades são consistentes com a capacidade de processamento provisionada padrão:
a capacidade de processamento provisionada de zona única usa a mesma medida de capacidade de processamento (GSUs),
preços e termos da
capacidade de processamento provisionada padrão.
A capacidade de transmissão provisionada de zona única oferece suporte ao processamento de ML na região: todas as solicitações são processadas na região comprada, incluindo o tráfego que excede a quantidade de capacidade de transmissão comprada. Esse tráfego é cobrado na taxa de pagamento conforme o uso usando a capacidade de buffer na região.
Você controla os excedentes: é possível
controlar o tráfego de overflow
usando os mesmos cabeçalhos da capacidade de processamento provisionada padrão.
Em regiões sem processamento de ML, a latência da capacidade de processamento provisionada de zona única pode ser maior do que a capacidade de processamento provisionada padrão ou o pagamento por uso.
Comprar capacidade de processamento provisionada de zona única
[[["Fácil de entender","easyToUnderstand","thumb-up"],["Meu problema foi resolvido","solvedMyProblem","thumb-up"],["Outro","otherUp","thumb-up"]],[["Difícil de entender","hardToUnderstand","thumb-down"],["Informações incorretas ou exemplo de código","incorrectInformationOrSampleCode","thumb-down"],["Não contém as informações/amostras de que eu preciso","missingTheInformationSamplesINeed","thumb-down"],["Problema na tradução","translationIssue","thumb-down"],["Outro","otherDown","thumb-down"]],["Última atualização 2025-09-02 UTC."],[],[],null,["# Single Zone Provisioned Throughput lets you reserve\nthroughput in specific regions where only one [zone](/docs/geography-and-regions) is\navailable. This option provides\npredictable performance for Gemini models in use cases where ML\nprocessing is required.\n\nTo view the list of supported models and regions, see\n[Deployments and endpoints](/vertex-ai/generative-ai/docs/learn/locations). For the list of\nregions and models that support ML processing, see\n[ML processing](/vertex-ai/generative-ai/docs/learn/locations#canada).\n\nFeatures of Single Zone Provisioned Throughput\n----------------------------------------------\n\nThis section outlines the key features of Single Zone Provisioned Throughput:\n\n- **Pricing and units are consistent with standard Provisioned Throughput** :\n Single Zone Provisioned Throughput uses the same measure of throughput ([GSUs](/vertex-ai/generative-ai/docs/provisioned-throughput/measure-provisioned-throughput#gsu-burndown-rate)),\n [pricing](/vertex-ai/generative-ai/pricing#provisioned-throughput), and terms as\n standard [Provisioned Throughput](/vertex-ai/generative-ai/docs/provisioned-throughput/purchase-provisioned-throughput).\n\n- **Single Zone Provisioned Throughput supports in-region ML processing** : All requests are processed in the\n purchased region, including traffic that exceeds your purchased amount of\n throughput. This traffic is billed at the\n [pay-as-you-go rate](/vertex-ai/generative-ai/pricing#provisioned-throughput)\n using buffer capacity in the region.\n\n- **You control the overages** : You can\n [control overflow traffic](/vertex-ai/generative-ai/docs/provisioned-throughput/use-provisioned-throughput#use-rest-api)\n using the same headers as with standard Provisioned Throughput.\n\n- **You can monitor your order** : You can monitor your Single Zone Provisioned Throughput order using the existing\n [Provisioned Throughput monitoring](/vertex-ai/generative-ai/docs/provisioned-throughput/use-provisioned-throughput#monitor_provisioned_throughput) capabilities.\n\nLimitations\n-----------\n\nSingle Zone Provisioned Throughput has the following limitations:\n\n- Single Zone Provisioned Throughput is not a Covered Service and is excluded from the\n [Gemini Online Inference on Vertex AI Service Level Agreement](/vertex-ai/generative-ai/sla).\n\n- Single Zone Provisioned Throughput does not integrate with or support\n [Batch requests](/vertex-ai/generative-ai/docs/multimodal/batch-prediction-gemini#batch_prediction_use_case)\n or [Fine Tuning](/vertex-ai/generative-ai/docs/models/tune-models).\n\n- In regions without ML processing, latency for Single Zone Provisioned Throughput might be higher than\n standard Provisioned Throughput or pay-as-you-go.\n\nPurchase Single Zone Provisioned Throughput\n-------------------------------------------\n\nFor assistance with purchasing Single Zone Provisioned Throughput, [contact your Google Cloud account representative](/contact).\n\nWhat's next\n-----------\n\n- [Purchase standard Provisioned Throughput.](/vertex-ai/generative-ai/docs/purchase-provisioned-throughput)"]]