El procesamiento aprovisionado de una sola zona te permite reservar capacidad de procesamiento en regiones específicas en las que solo hay una zona disponible. Esta opción proporciona un rendimiento predecible para los modelos de Gemini en casos de uso en los que se requiere procesamiento de AA.
Para ver la lista de modelos y regiones admitidos, consulta Implementaciones y extremos. Para obtener la lista de regiones y modelos que admiten el procesamiento de AA, consulta Procesamiento de AA.
Características de la capacidad de procesamiento aprovisionada de zona única
En esta sección, se describen las características clave del procesamiento aprovisionado de una sola zona:
Los precios y las unidades son coherentes con la capacidad de procesamiento aprovisionada estándar: La capacidad de procesamiento aprovisionada de una sola zona usa la misma medida de capacidad de procesamiento (GSU), los mismos precios y las mismas condiciones que la capacidad de procesamiento aprovisionada estándar.
El rendimiento aprovisionado de una sola zona admite el procesamiento de AA en la región: Todas las solicitudes se procesan en la región comprada, incluido el tráfico que supera la cantidad de rendimiento que compraste. Este tráfico se factura a la tarifa de pago por uso con la capacidad de búfer de la región.
Tú controlas los excesos: Puedes controlar el tráfico de desbordamiento con los mismos encabezados que con el rendimiento aprovisionado estándar.
Puedes supervisar tu pedido: Puedes supervisar tu pedido de capacidad de procesamiento aprovisionada de una sola zona con las capacidades existentes de supervisión de la capacidad de procesamiento aprovisionada.
Limitaciones
El rendimiento aprovisionado de una sola zona tiene las siguientes limitaciones:
El rendimiento aprovisionado de zona única no es un Servicio Cubierto y se excluye del Acuerdo de Nivel de Servicio de Gemini Online Inference en Vertex AI.
El Single Zone Provisioned Throughput no se integra con las solicitudes por lotes ni con la optimización, y no los admite.
En las regiones sin procesamiento de AA, la latencia de la capacidad de procesamiento aprovisionada de una sola zona puede ser mayor que la de la capacidad de procesamiento aprovisionada estándar o la del pago por uso.
Compra capacidad de procesamiento aprovisionada de una sola zona
Si necesitas ayuda para comprar el rendimiento aprovisionado de una sola zona, comunícate con tu Google Cloud representante de cuenta.