Package prediction.aiplatform.gdc.goog.v1

Índice

PredictionService

Es un servicio para obtener predicciones y explicaciones en línea.

Predecir

rpc Predict(PredictRequest) returns (PredictResponse)

Realiza una predicción en línea.

RawPredict

rpc RawPredict(RawPredictRequest) returns (HttpBody)

Realiza una predicción en línea con una carga útil de HTTP arbitraria.

La respuesta incluye los siguientes encabezados HTTP:

  • X-Vertex-AI-Endpoint-Id: Es el ID del extremo que entregó esta predicción.

  • X-Vertex-AI-Deployed-Model-Id: Es el ID del DeployedModel del extremo que entregó esta predicción.

PredictRequest

Mensaje de solicitud para PredictionService.Predict.

Campos
endpoint

string

Obligatorio. Es el nombre del extremo solicitado para entregar la predicción. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

instances[]

Value

Obligatorio. Son las instancias que se ingresan en la llamada de predicción. Un DeployedModel puede tener un límite superior en la cantidad de instancias que admite por solicitud. En el caso de los modelos creados por el cliente, el comportamiento es el que se documenta en ese modelo. El esquema de cualquier instancia única se puede especificar en los DeployedModels del extremo.

parameters

Value

Son los parámetros que rigen la predicción. El esquema de los parámetros se puede especificar en los DeployedModels del extremo.

PredictResponse

Mensaje de respuesta para PredictionService.Predict.

Campos
predictions[]

Value

Son las predicciones que son el resultado de la llamada de predicciones. El esquema de cualquier predicción única se puede especificar en los DeployedModels del extremo.

deployed_model_id

string

ID del DeployedModel del extremo que entregó esta predicción.

model

string

Solo salida. El nombre de recurso del modelo que se implementa como el DeployedModel que alcanza esta predicción.

model_version_id

string

Solo salida. El ID de versión del modelo que se implementa como el DeployedModel que alcanza esta predicción.

model_display_name

string

Solo salida. El nombre visible del modelo que se implementa como el DeployedModel que alcanza esta predicción.

metadata

Value

Solo salida. Son los metadatos a nivel de la solicitud que devuelve el modelo. El tipo de metadatos dependerá de la implementación del modelo.

RawPredictRequest

Mensaje de solicitud para PredictionService.RawPredict.

Campos
endpoint

string

Obligatorio. Es el nombre del extremo solicitado para entregar la predicción. Formato: projects/{project}/locations/{location}/endpoints/{endpoint}

http_body

HttpBody

Es la entrada de predicción. Admite encabezados HTTP y cargas útiles de datos arbitrarias.

Un DeployedModel puede tener un límite superior en la cantidad de instancias que admite por solicitud. Cuando se supera este límite para un modelo de AutoML, el método RawPredict devuelve un error. Cuando se supera este límite para un modelo entrenado de forma personalizada, el comportamiento varía según el modelo.

Puedes especificar el esquema de cada instancia en el campo PredictSchemata cuando creas un modelo. Este esquema se aplica cuando implementas Model como DeployedModel en un extremo y usas el método RawPredict.