배포된 애플리케이션 관리

기본 작업

ReasoningEngine 인스턴스를 나열하거나, ReasoningEngine 인스턴스를 가져오거나, ReasoningEngine 인스턴스를 삭제할 수 있습니다.

ReasoningEngine 인스턴스 나열

Vertex AI SDK for Python

다음 명령어는 주어진 프로젝트 및 위치의 모든 ReasoningEngine 인스턴스를 나열합니다.

reasoning_engines.ReasoningEngine.list()

다음 코드는 display_name으로 ReasoningEngine 인스턴스 목록을 필터링합니다.

reasoning_engines.ReasoningEngine.list(filter='display_name="DISPLAY_NAME"')

예를 들면 다음과 같습니다.

reasoning_engines.ReasoningEngine.list(filter='display_name="Demo Langchain Application"')

REST

다음 curl 명령어를 실행하여 특정 프로젝트 및 위치의 모든 ReasoningEngine 인스턴스를 나열합니다.

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines

ReasoningEngine 인스턴스 가져오기

ReasoningEngine 인스턴스에는 고유한 RESOURCE_ID 식별자가 있습니다. 자세한 내용은 애플리케이션 배포를 참조하세요.

Vertex AI SDK for Python

다음 코드를 사용하면 특정 ReasoningEngine 리소스를 가져올 수 있습니다.

remote_app = reasoning_engines.ReasoningEngine("RESOURCE_ID")

또는 전체 리소스 이름을 제공할 수 있습니다.

remote_app = reasoning_engines.ReasoningEngine(
"projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID"
)

REST

다음 curl 명령어를 실행하여 특정 ReasoningEngine 리소스를 가져옵니다.

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

ReasoningEngine 인스턴스 업데이트

Python용 Vertex AI SDK

다음 코드를 사용하면 remote_app 변수로 설정된 ReasoningEngine 인스턴스를 업데이트할 수 있습니다.

remote_app.update(
    reasoning_engine=UPDATED_AGENT_INSTANCE,  # Optional.
    requirements=REQUIREMENTS,                # Optional.
    display_name="DISPLAY_NAME",              # Optional.
    description="DESCRIPTION",                # Optional.
    extra_packages=EXTRA_PACKAGES,            # Optional.
)

인수는 애플리케이션을 배포할 때와 동일합니다. 자세한 내용은 API 참조를 참고하세요.

REST

다음 curl 명령어를 실행하여 ReasoningEngine 리소스의 표시 이름과 설명을 업데이트합니다.

curl \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID?update_mask="display_name,description" \
-d '{ "displayName": "DISPLAY_NAME", "description": "DESCRIPTION" }'

ReasoningEngine 인스턴스 삭제

Vertex AI SDK for Python

다음 코드를 사용하면 remote_app 변수로 설정된 ReasoningEngine 인스턴스를 삭제할 수 있습니다.

remote_app.delete()

REST

ReasoningEngine 인스턴스에는 고유한 RESOURCE_ID 식별자가 있습니다. 자세한 내용은 애플리케이션 배포를 참조하세요.

다음 curl 명령어를 실행하여 특정 ReasoningEngine 인스턴스를 삭제합니다.

curl \
-X DELETE \
-H "Authorization: Bearer $(gcloud auth print-access-token)" \
-H "Content-Type: application/json" \
https://LOCATION-aiplatform.googleapis.com/v1beta1/projects/PROJECT_ID/locations/LOCATION/reasoningEngines/RESOURCE_ID

LangchainAgent 인스턴스 추적

LangchainAgent 애플리케이션의 추적을 사용 설정하려면 애플리케이션을 개발할 때 enable_tracing=True를 지정합니다. 예를 들면 다음과 같습니다.

agent = reasoning_engines.LangchainAgent(
    model=model,                # Required.
    tools=[get_exchange_rate],  # Optional.
    enable_tracing=True,        # [New] Optional.
)

agent.query(input="What is the exchange rate from US dollars to Swedish currency?")

이렇게 하면 Google Cloud 프로젝트 설정의 프로젝트 아래에 있는 Cloud Trace로 트레이스가 내보내집니다.

추적 보기

Trace Explorer에서 trace를 찾을 수 있습니다.

Trace 탐색기로 이동

다음 Gantt 차트는 애플리케이션 개발의 예시 애플리케이션의 트레이스 결과를 보여줍니다.

쿼리의 샘플 트레이스 

Gantt 차트의 첫 번째 행은 trace이며, trace의 각 스팬에 대해 하나의 행이 있으며, 각 하위 작업에 걸린 시간을 나타냅니다.

자세한 내용은 Trace Explorer 문서를 참고하세요.

맞춤 애플리케이션에 대한 추적 사용 설정

맞춤 애플리케이션의 추적을 사용 설정하려면 OpenTelemetry Google Cloud IntegrationOpenInference 또는 OpenLLMetry와 같은 계측 프레임워크와 함께 사용하면 됩니다.

할당량 및 한도

일부 속성 값은 할당량 한도에 도달하면 잘릴 수 있습니다. 자세한 내용은 Cloud Trace 할당량을 참고하세요.

비용

Cloud Trace에는 무료 등급이 있습니다. 무료 등급을 초과하는 경우 Cloud Trace 가격 책정을 참고하세요.