Package prediction.aiplatform.gdc.goog.v1

索引

PredictionService

用于在线预测和说明的服务。

预测

rpc Predict(PredictRequest) returns (PredictResponse)

执行在线预测。

RawPredict

rpc RawPredict(RawPredictRequest) returns (HttpBody)

使用任意 HTTP 载荷执行在线预测。

响应包括以下 HTTP 标头:

  • X-Vertex-AI-Endpoint-Id:提供此预测的端点的 ID。

  • X-Vertex-AI-Deployed-Model-Id:提供此预测的端点的 DeployedModel 的 ID。

PredictRequest

PredictionService.Predict 的请求消息。

字段
endpoint

string

必需。被请求执行预测的端点的名称。格式:projects/{project}/locations/{location}/endpoints/{endpoint}

instances[]

Value

必需。作为预测调用的输入的实例。DeployedModel 可能对每个请求支持的实例数量有上限。对于客户创建的模型,其行为与该模型记录的行为一致。任何单个实例的架构都可在端点的 DeployedModels 中指定。

parameters

Value

用于控制预测的参数。可在端点的 DeployedModels 上指定参数的架构。

PredictResponse

PredictionService.Predict 的响应消息。

字段
predictions[]

Value

作为预测调用的输出的预测结果。任何单个预测的架构都可在端点的 DeployedModels 上指定。

deployed_model_id

string

提供此预测的端点的 DeployedModel 的 ID。

model

string

仅限输出。部署为此预测命中的 DeployedModel 模型的资源名称。

model_version_id

string

仅限输出。部署为此预测命中的 DeployedModel 模型的版本 ID。

model_display_name

string

仅限输出。部署为此预测命中的 DeployedModel 模型的显示名称。

metadata

Value

仅限输出。模型返回的请求级元数据。元数据类型将取决于模型实现。

RawPredictRequest

PredictionService.RawPredict 的请求消息。

字段
endpoint

string

必需。被请求执行预测的端点的名称。格式:projects/{project}/locations/{location}/endpoints/{endpoint}

http_body

HttpBody

预测输入。支持 HTTP 标头和任意数据载荷。

DeployedModel 可能对每个请求支持的实例数量有上限。如果 AutoML 模型的此限制被超出,RawPredict 方法会返回错误。如果自定义训练的模型超出此限制,行为会因模型而异。

创建模型时,您可以在 PredictSchemata 字段中为每个实例指定架构。当您将 Model 作为 DeployedModel 部署到端点并使用 RawPredict 方法时,此架构适用。