Capacidade de processamento provisionada de zona única

Com a capacidade de processamento provisionada de zona única, é possível reservar capacidade de processamento em regiões específicas em que apenas uma zona está disponível. Essa opção oferece desempenho previsível para modelos do Gemini em casos de uso que exigem processamento de ML.

Para conferir a lista de modelos e regiões compatíveis, consulte Implantações e endpoints. Para conferir a lista de regiões e modelos que oferecem suporte ao processamento de ML, consulte Processamento de ML.

Recursos da capacidade de processamento provisionada de zona única

Nesta seção, descrevemos os principais recursos da capacidade de processamento provisionada de zona única:

  • Os preços e as unidades são consistentes com a capacidade de processamento provisionada padrão: a capacidade de processamento provisionada de zona única usa a mesma medida de capacidade de processamento (GSUs), preços e termos da capacidade de processamento provisionada padrão.

  • A capacidade de transmissão provisionada de zona única oferece suporte ao processamento de ML na região: todas as solicitações são processadas na região comprada, incluindo o tráfego que excede a quantidade de capacidade de transmissão comprada. Esse tráfego é cobrado na taxa de pagamento conforme o uso usando a capacidade de buffer na região.

  • Você controla os excedentes: é possível controlar o tráfego de overflow usando os mesmos cabeçalhos da capacidade de processamento provisionada padrão.

  • Monitore seu pedido: é possível monitorar seu pedido de capacidade de processamento provisionada de zona única usando os recursos atuais de monitoramento de capacidade de processamento provisionada.

Limitações

A Capacidade de processamento provisionada de zona única tem as seguintes limitações:

Comprar capacidade de processamento provisionada de zona única

Para receber ajuda com a compra de taxa de transferência provisionada de zona única, entre em contato com seu representante da conta Google Cloud .

A seguir