Esta página se ha traducido con Cloud Translation API.

Información sobre las predicciones online

de GDC.

Vertex AI ofrece predicciones online en Google Distributed Cloud (GDC) aislado mediante la API Online Prediction. Una predicción es el resultado de un modelo de aprendizaje automático entrenado. En concreto, las predicciones online son solicitudes síncronas que se envían al endpoint de tu modelo.

La predicción online te permite subir, desplegar, servir y hacer solicitudes con tus propios modelos de predicción en un conjunto de contenedores compatibles. Usa la predicción online cuando hagas solicitudes en respuesta a la entrada de una aplicación o en situaciones que requieran inferencias oportunas.

Puedes usar la API Online Prediction aplicando recursos personalizados de Kubernetes al clúster de predicción específico que tu operador de infraestructura (IO) crea para ti.

Antes de obtener predicciones online, debes exportar los artefactos del modelo y desplegar el modelo en un endpoint. Esta acción asocia recursos de computación al modelo para ofrecer predicciones online con baja latencia.

Después, puedes obtener predicciones online a partir de un modelo con entrenamiento personalizado dando formato y enviando una solicitud.

Imágenes de contenedor disponibles

En la siguiente tabla se muestra la lista de contenedores admitidos para la predicción online en Distributed Cloud:

Framework de aprendizaje automático	Versión	Aceleradores compatibles	Imágenes compatibles
TensorFlow	2.14	CPU	tf2-cpu.2-14
TensorFlow	2.14	GPU	tf2-gpu.2-14
PyTorch	2,4	CPU	pytorch-cpu.2-4
	2,4	GPU	pytorch-gpu.2-4
	2.1 (OBSOLETO)	CPU	pytorch-cpu.2-1
	2.1 (OBSOLETO)	GPU	pytorch-gpu.2-1