Package prediction.aiplatform.gdc.goog.v1

Índice

PredictionService

Um serviço para previsões e explicações on-line.

Prever

rpc Predict(PredictRequest) returns (PredictResponse)

Realiza uma predição on-line.

RawPredict

rpc RawPredict(RawPredictRequest) returns (HttpBody)

Fazer uma previsão on-line com um payload HTTP arbitrário.

A resposta inclui os seguintes cabeçalhos HTTP:

  • X-Vertex-AI-Endpoint-Id: ID do endpoint que veiculou essa previsão.

  • X-Vertex-AI-Deployed-Model-Id: ID do DeployedModel do endpoint que veiculou essa previsão.

PredictRequest

Mensagem de solicitação para PredictionService.Predict.

Campos
endpoint

string

Obrigatório. O nome do endpoint solicitado para disponibilizar a previsão. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

instances[]

Value

Obrigatório. As instâncias que são a entrada da chamada de previsão. Um DeployedModel pode ter um limite máximo para o número de instâncias que ele aceita por solicitação. No caso de modelos criados pelo cliente, o comportamento é documentado por esse modelo. O esquema de qualquer instância pode ser especificado em DeployedModels do endpoint.

parameters

Value

Os parâmetros que regem a previsão. O esquema dos parâmetros pode ser especificado nos DeployedModels do endpoint.

PredictResponse

Mensagem de resposta para PredictionService.Predict.

Campos
predictions[]

Value

As previsões geradas pela chamada de previsão. O esquema de qualquer previsão pode ser especificado nos DeployedModels do endpoint.

deployed_model_id

string

ID do DeployedModel do endpoint que veiculou essa previsão.

model

string

Apenas saída. O nome do recurso do modelo que é implantado como o DeployedModel que essa previsão atinge.

model_version_id

string

Apenas saída. O código da versão do modelo que é implantado como o DeployedModel que essa previsão atinge.

model_display_name

string

Apenas saída. O nome de exibição do modelo que está implantado como o DeployedModel que essa previsão atinge.

metadata

Value

Apenas saída. Metadados no nível da solicitação retornados pelo modelo. O tipo de metadados depende da implementação do modelo.

RawPredictRequest

Mensagem de solicitação para PredictionService.RawPredict.

Campos
endpoint

string

Obrigatório. O nome do endpoint solicitado para disponibilizar a previsão. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

http_body

HttpBody

A entrada de previsão. Compatível com cabeçalhos HTTP e payload de dados arbitrários.

Um DeployedModel pode ter um limite máximo para o número de instâncias que ele aceita por solicitação. Quando esse limite é excedido para um modelo do AutoML, o método RawPredict retorna um erro. Quando esse limite é excedido para um modelo treinado de forma personalizada, o comportamento varia de acordo com o modelo.

É possível especificar o esquema de cada instância no campo "PredictSchemata" ao criar um modelo. Esse esquema se aplica quando você implanta o Model como um DeployedModel em um endpoint e usa o método RawPredict.