Visão geral de como receber previsões na Vertex AI

Uma previsão é a saída de um modelo de machine learning treinado. Nesta página, fornecemos uma visão geral do fluxo de trabalho para receber previsões dos seus modelos na Vertex AI.

A Vertex AI oferece dois métodos para receber previsões:

As previsões on-line são solicitações síncronas feitas em um modelo que é implantado em um endpoint. Portanto, antes de enviar uma solicitação, é necessário implantar o recurso Model para um endpoint. Isso associa recursos de computação ao modelo para que ele possa exibir previsões on-line com baixa latência. Use as previsões on-line ao fazer solicitações em resposta a uma entrada de aplicativo ou em situações que exigem inferência em tempo hábil.
As predições em lote são solicitações assíncronas feitas em um modelo que não está implantado em um endpoint. Você envia a solicitação (como um recurso BatchPredictionsJob) diretamente ao recurso Model. Use as previsões em lote quando não precisar de uma resposta imediata e quiser processar dados acumulados com uma única solicitação.

Receba previsões de modelos treinados personalizados

Para receber previsões, primeiro importe seu modelo. Depois de importada, ela se torna um recurso Model visível no Vertex AI Model Registry.

Em seguida, leia a seguinte documentação para saber como receber previsões:

Receber predições de modelos do AutoML

Ao contrário dos modelos treinados personalizados, os modelos do AutoML são importados automaticamente para o Vertex AI Model Registry após o treinamento.

Fora isso, o fluxo de trabalho para os modelos do AutoML é semelhante, mas varia um pouco com base no tipo de dados e no objetivo do modelo. A documentação para receber previsões do AutoML está localizada ao lado da outra documentação do AutoML. Estes são os links para a documentação:

Imagem

Saiba como receber previsões dos seguintes tipos de modelos de imagem do AutoML:

Tabular

Saiba como receber previsões dos seguintes tipos de modelos tabulares do AutoML:

Modelos de classificação e regressão tabulares
- Previsões on-line
- Previsões em lote
Modelos de previsão tabular (somente previsões em lote)

Texto

Saiba como receber previsões dos seguintes tipos de modelos de texto do AutoML:

Vídeo

Saiba como receber previsões dos seguintes tipos de modelos de vídeo do AutoML:

Modelos de reconhecimento de ações em vídeo (somente previsões em lote)
Modelos de classificação de vídeo (somente previsões em lote)
Modelos de rastreamento de objetos de vídeo (somente previsões em lote)

Receber previsões de modelos do BigQuery ML

Há duas maneiras de fazer previsões com os modelos do BigQuery ML:

É possível solicitar predições em lote diretamente do modelo no BigQuery ML.
É possível registrar os modelos diretamente no Model Registry, sem exportá-los do BigQuery ML ou importá-los para o Model Registry.

Visão geral de como receber previsões na Vertex AI Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.