Package prediction.aiplatform.gdc.goog.v1

색인

PredictionService

온라인 예측 및 설명을 위한 서비스입니다.

예측

rpc Predict(PredictRequest) returns (PredictResponse)

온라인 예측을 실행합니다.

RawPredict

rpc RawPredict(RawPredictRequest) returns (HttpBody)

임의의 HTTP 페이로드로 온라인 예측을 수행합니다.

응답에는 다음 HTTP 헤더가 포함됩니다.

  • X-Vertex-AI-Endpoint-Id: 이 예측을 제공한 엔드포인트의 ID입니다.

  • X-Vertex-AI-Deployed-Model-Id: 이 예측을 제공한 엔드포인트의 DeployedModel ID입니다.

PredictRequest

PredictionService.Predict에 대한 요청 메시지입니다.

필드
endpoint

string

필수 항목입니다. 예측 제공을 요청한 엔드포인트의 이름입니다. 형식: projects/{project}/locations/{location}/endpoints/{endpoint}

instances[]

Value

필수 항목입니다. 예측 호출에 입력되는 인스턴스입니다. DeployedModel에는 요청당 지원하는 인스턴스 수에 상한이 있을 수 있습니다. 고객이 만든 모델의 경우 동작은 해당 모델에 문서화된 대로입니다. 단일 인스턴스의 스키마는 Endpoint's DeployedModels에서 지정할 수 있습니다.

parameters

Value

예측을 제어하는 파라미터입니다. 매개변수의 스키마는 Endpoint's DeployedModels에서 지정할 수 있습니다.

PredictResponse

PredictionService.Predict의 응답 메시지입니다.

필드
predictions[]

Value

예측 호출의 출력인 예측입니다. 단일 예측의 스키마는 Endpoint's DeployedModels에서 지정할 수 있습니다.

deployed_model_id

string

이 예측을 서빙한 엔드포인트의 DeployedModel ID입니다.

model

string

출력 전용입니다. 이 예측이 조회하는 DeployedModel로 배포되는 모델의 리소스 이름입니다.

model_version_id

string

출력 전용입니다. 이 예측이 조회하는 DeployedModel로 배포된 모델의 버전 ID입니다.

model_display_name

string

출력 전용입니다. 이 예측이 조회하는 DeployedModel로 배포된 모델의 표시 이름입니다.

metadata

Value

출력 전용입니다. 모델에서 반환된 요청 수준 메타데이터입니다. 메타데이터 유형은 모델 구현에 따라 달라집니다.

RawPredictRequest

PredictionService.RawPredict에 대한 요청 메시지입니다.

필드
endpoint

string

필수 항목입니다. 예측 제공을 요청한 엔드포인트의 이름입니다. 형식: projects/{project}/locations/{location}/endpoints/{endpoint}

http_body

HttpBody

예측 입력입니다. HTTP 헤더와 임의 데이터 페이로드를 지원합니다.

DeployedModel에는 요청당 지원하는 인스턴스 수에 상한이 있을 수 있습니다. AutoML 모델의 이 한도를 초과하면 RawPredict 메서드가 오류를 반환합니다. 커스텀 학습 모델의 경우 이 한도를 초과하면 모델에 따라 동작이 달라집니다.

모델을 만들 때 PredictSchemata 필드에서 각 인스턴스의 스키마를 지정할 수 있습니다. 이 스키마는 Model을 엔드포인트에 DeployedModel로 배포하고 RawPredict 메서드를 사용하는 경우에 적용됩니다.