Esta página foi traduzida pela API Cloud Translation.

Capacidade de processamento provisionada de zona única

Com a capacidade de processamento provisionada de zona única, é possível reservar capacidade de processamento em regiões específicas em que apenas uma zona está disponível. Essa opção oferece desempenho previsível para modelos do Gemini em casos de uso que exigem processamento de ML.

Para conferir a lista de modelos e regiões compatíveis, consulte Implantações e endpoints. Para conferir a lista de regiões e modelos que oferecem suporte ao processamento de ML, consulte Processamento de ML.

Recursos da capacidade de processamento provisionada de zona única

Nesta seção, descrevemos os principais recursos da capacidade de processamento provisionada de zona única:

Os preços e as unidades são consistentes com a capacidade de processamento provisionada padrão: a capacidade de processamento provisionada de zona única usa a mesma medida de capacidade de processamento (GSUs), preços e termos da capacidade de processamento provisionada padrão.
A capacidade de transmissão provisionada de zona única oferece suporte ao processamento de ML na região: todas as solicitações são processadas na região comprada, incluindo o tráfego que excede a quantidade de capacidade de transmissão comprada. Esse tráfego é cobrado na taxa de pagamento conforme o uso usando a capacidade de buffer na região.
Você controla os excedentes: é possível controlar o tráfego de overflow usando os mesmos cabeçalhos da capacidade de processamento provisionada padrão.
Monitore seu pedido: é possível monitorar seu pedido de capacidade de processamento provisionada de zona única usando os recursos atuais de monitoramento de capacidade de processamento provisionada.

Limitações

A Capacidade de processamento provisionada de zona única tem as seguintes limitações:

O throughput provisionado de zona única não é um serviço coberto e está excluído do contrato de nível de serviço da inferência on-line do Gemini na Vertex AI.
O throughput provisionado de zona única não se integra nem é compatível com solicitações em lote ou ajuste refinado.
Em regiões sem processamento de ML, a latência da capacidade de processamento provisionada de zona única pode ser maior do que a capacidade de processamento provisionada padrão ou o pagamento por uso.

Comprar capacidade de processamento provisionada de zona única

Para receber ajuda com a compra de taxa de transferência provisionada de zona única, entre em contato com seu representante da conta Google Cloud .

A seguir

Compre a capacidade de processamento provisionada padrão.

Capacidade de processamento provisionada de zona única Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Recursos da capacidade de processamento provisionada de zona única

Limitações

Comprar capacidade de processamento provisionada de zona única

A seguir

Capacidade de processamento provisionada de zona única