이 페이지는 Cloud Translation API를 통해 번역되었습니다.

프롬프트 캐싱

Anthropic Claude 모델은 여러 요청에서 동일한 콘텐츠를 재사용할 때 지연 시간과 비용을 줄이기 위해 프롬프트 캐싱을 제공합니다. 쿼리를 보낼 때 입력의 전체 또는 특정 부분을 캐시하여 후속 쿼리에서 이전 요청의 캐시된 결과를 사용할 수 있습니다. 이렇게 하면 추가 컴퓨팅 및 네트워크 비용이 발생하지 않습니다. 캐시는 Google Cloud 프로젝트에만 고유하며 다른 프로젝트에서는 사용할 수 없습니다.

프롬프트의 구조를 지정하는 방법에 관한 자세한 내용은 Anthropic 프롬프트 캐싱 문서를 참조하세요.

지원되는 Anthropic Claude 모델

Vertex AI는 다음 Anthropic Claude 모델의 프롬프트 캐싱을 지원합니다.

데이터 처리

Anthropic 명시적 프롬프트 캐싱은 Anthropic Claude 모델의 기능입니다. 이러한 Anthropic 모델의 Vertex AI 제품은 Anthropic 문서에 설명된 대로 작동합니다.

프롬프트 캐싱은 선택적 기능입니다. 클라우드는 키 캐싱 요청의 해시(디지털 지문)를 계산합니다. 이러한 해시는 캐싱이 사용 설정된 요청에 대해서만 계산됩니다.

프롬프트 캐싱은 Claude 모델에서 구현한 기능이지만 데이터 처리 관점에서 Google은 이러한 해시를 '사용자 메타데이터'의 한 유형으로 간주합니다. 이러한 데이터는 Google Cloud개인정보처리방침에 따라 고객 '서비스 데이터'로 취급되며 Cloud 데이터 처리 추가 조항(고객)에 따라 '고객 데이터'로 취급되지 않습니다. 특히 '고객 데이터'에 대한 추가 보호 조치는 이러한 해시에 적용되지 않습니다. Google은 이러한 해시를 다른 용도로 사용하지 않습니다.

이 프롬프트 캐싱 기능을 완전히 사용 중지하고 특정 Google Cloud 프로젝트에서 사용할 수 없도록 하려면 고객 지원팀에 문의하여 관련 프로젝트 번호를 제공하면 됩니다. 프로젝트에 대해 명시적 캐싱이 사용 중지되면 프롬프트 캐싱이 사용 설정된 프로젝트의 요청이 거부됩니다.