Esta página foi traduzida pela API Cloud Translation.

Saiba mais sobre as previsões on-line

A Vertex AI oferece previsões on-line no Google Distributed Cloud (GDC) isolado por ar usando a API Online Prediction. Uma previsão é a saída de um modelo de machine learning treinado. Especificamente, as previsões on-line são solicitações síncronas feitas no endpoint do modelo.

Com a previsão on-line, é possível fazer upload, implantar, veicular e fazer solicitações usando seus próprios modelos de previsão em um conjunto de contêineres compatíveis. Use a previsão on-line ao fazer solicitações em resposta à entrada do aplicativo ou em situações que exigem inferência em tempo hábil.

É possível usar a API Online Prediction aplicando recursos personalizados do Kubernetes ao cluster de previsão dedicado que o operador de infraestrutura (IO) cria para você.

Antes de receber previsões on-line, é necessário exportar os artefatos do modelo e implantar o modelo em um endpoint. Essa ação associa recursos de computação ao modelo para veicular previsões on-line com baixa latência.

Em seguida, é possível receber previsões on-line de um modelo treinado personalizado formatando e enviando uma solicitação.

Imagens de contêiner disponíveis

A tabela a seguir contém a lista de contêineres compatíveis com a previsão on-line no Distributed Cloud:

Framework de ML	Versão	Aceleradores compatíveis	Imagens compatíveis
TensorFlow	2.14	CPU	tf2-cpu.2-14
TensorFlow	2.14	GPU	tf2-gpu.2-14
PyTorch	2.4	CPU	pytorch-cpu.2-4
	2.4	GPU	pytorch-gpu.2-4
	2.1 (DESCONTINUADO)	CPU	pytorch-cpu.2-1
	2.1 (DESCONTINUADO)	GPU	pytorch-gpu.2-1