이 페이지에서는 모델, 재순위 지정, 벡터 스토리지 등 사용하는 Vertex AI RAG Engine 구성요소를 기반으로 Vertex AI RAG Engine 가격 책정 및 청구를 설명합니다.
자세한 내용은 Vertex AI RAG Engine 개요 페이지를 참고하세요.
가격 책정 및 결제
Vertex AI RAG Engine은 무료로 사용할 수 있습니다. 하지만 Vertex AI RAG Engine 구성요소를 구성하면 청구에 영향을 미칠 수 있습니다.
이 표에서는 RAG 구성요소를 사용할 때 청구가 어떻게 이루어지는지 설명합니다.
구성요소 | Vertex AI RAG Engine의 청구 방식 |
---|---|
데이터 수집 | Vertex AI RAG 엔진은 다양한 데이터 소스에서 데이터를 수집하는 것을 지원합니다. 예를 들어 로컬 파일, Cloud Storage, Google Drive를 업로드합니다. Vertex AI RAG Engine에서 이러한 데이터 소스의 파일에 액세스하는 것은 무료이지만 데이터 소스에서 데이터 전송에 요금을 청구할 수 있습니다. 예를 들어 데이터 이그레스 비용이 있습니다. |
데이터 변환 (파일 파싱) |
|
데이터 변환 (파일 청크) | 무료인 고정 크기 청크를 지원합니다. |
임베딩 생성 | Vertex AI RAG Engine은 지정한 임베딩 모델을 사용하여 임베딩 생성을 오케스트레이션하며, 프로젝트에 해당 모델과 관련된 비용이 청구됩니다. 자세한 가격 정보는 Vertex AI에서 AI 모델을 빌드하고 배포하는 데 드는 비용을 참고하세요. |
데이터 색인 생성 및 검색 |
RAG Engine은 벡터 검색을 위해 두 가지 카테고리의 벡터 데이터베이스를 지원합니다.
RAG 관리 데이터베이스에는 두 가지 목적이 있습니다.
RAG 관리 데이터베이스는 Spanner 인스턴스를 백엔드로 사용합니다. 각 프로젝트에 대해 Vertex AI RAG Engine은 고객별 Google Cloud 프로젝트를 프로비저닝하고 Vertex AI RAG Engine에 저장된 RAG 관리 리소스를 관리하여 데이터가 물리적으로 격리되도록 합니다.
프로젝트의 RAG 코퍼스에서 벡터 검색에 RAG 관리형 데이터베이스를 사용하도록 선택하면 RAG 관리형 Spanner 인스턴스에 요금이 청구됩니다. Vertex AI RAG Engine은 해당 RAG 관리 프로젝트의 Spanner 비용을 Google Cloud 프로젝트에 표시하므로 Spanner 인스턴스 비용을 확인하고 지불할 수 있습니다. Spanner 가격 책정 세부정보는 Spanner 가격 책정을 참고하세요. |
Vertex AI RAG Engine 순위 조정 | 검색 후 지원되는 순위 지정 도구는 다음과 같습니다.
|
Vertex AI RAG Engine 삭제
다음 코드 샘플은 Google Cloud 콘솔, Python, REST에서 Vertex AI RAG 엔진을 삭제하는 방법을 보여줍니다.
다음 단계
- Vertex AI SDK를 사용하여 Vertex AI RAG Engine 태스크를 실행하는 방법은 Python용 RAG 빠른 시작을 참조하세요.
- 그라운딩에 대한 자세한 내용은 그라운딩 개요를 참조하세요.
- RAG의 응답에 대해 자세히 알아보려면 Vertex AI RAG 엔진의 검색 및 생성 출력을 참조하세요.
- RAG 아키텍처에 대해 알아보려면 다음을 참조하세요.