이 페이지에서는 Vertex AI RAG Engine에서 지원되는 벡터 데이터베이스를 소개합니다. 벡터 데이터베이스(벡터 저장소)를 RAG 코퍼스에 연결하는 방법도 확인할 수 있습니다.
벡터 데이터베이스는 RAG 애플리케이션을 위한 검색을 지원하는 데 중요한 역할을 합니다. 벡터 데이터베이스는 시맨틱 의미와 관계를 포착하는 텍스트 또는 기타 데이터의 수학적 표현인 벡터 임베딩을 저장하고 쿼리하는 특수한 방법을 제공합니다. 벡터 임베딩을 사용하면 RAG 시스템이 복잡하거나 미묘한 쿼리를 처리할 때도 방대한 기술 자료에서 가장 관련성 높은 정보를 빠르고 정확하게 찾을 수 있습니다. 벡터 데이터베이스를 임베딩 모델과 결합하면 LLM의 한계를 극복하고 더 정확하고 관련성 높은 포괄적인 응답을 제공하는 데 도움이 됩니다.
지원되는 벡터 데이터베이스
RAG 코퍼스를 만들 때 Vertex AI RAG Engine은 추가 프로비저닝이나 관리가 필요하지 않은 엔터프라이즈용 RagManagedDb
를 기본 벡터 데이터베이스로 제공합니다.
RagManagedDb
는 KNN 및 ANN 검색 옵션을 모두 제공하며 빠른 프로토타입 제작 및 실험을 위해 기본 등급으로 전환할 수 있습니다.
RagManagedDb
에서 검색 전략을 선택하거나 등급을 업데이트하는 방법을 자세히 알아보려면 RAG와 함께 RagManagedDb
사용을 참조하세요. Vertex AI RAG Engine이 벡터 데이터베이스를 자동으로 생성하고 관리하도록 하려면 RAG 코퍼스 만들기를 참조하세요.
Vertex AI RAG Engine을 사용하면 기본 RagManagedDb
외에도 RAG 코퍼스 내에서 벡터 데이터베이스를 프로비저닝하고 사용할 수 있습니다. 이 경우 벡터 데이터베이스의 수명 주기와 확장성에 대한 책임은 사용자에게 있습니다.
벡터 데이터베이스 옵션 비교
이 표에는 Vertex AI RAG Engine에서 지원되는 벡터 데이터베이스의 선택사항이 나열되어 있으며 RAG 코퍼스 내에서 벡터 데이터베이스를 사용하는 방법을 설명하는 페이지로 연결되는 링크가 제공됩니다.
벡터 데이터베이스 | 이점 | 권장 | 단점 | 지원되는 거리 측정항목 | 검색 유형 | 출시 단계 |
---|---|---|---|---|---|---|
RagManagedDb (기본값)는 매우 높은 일관성과 고가용성을 제공하며 벡터 검색에 사용할 수 있는 지역별로 분산된 확장 가능한 데이터베이스 서비스입니다.
쉽고 간편하고 빠른 |
|
|
|
cosine |
KNN(기본값) 및 ANN | 프리뷰 |
벡터 검색은 머신러닝 작업에 최적화된 Vertex AI 내의 벡터 데이터베이스 서비스입니다. |
|
|
|
cosine dot-product |
ANN | 일반 안정화 버전 |
Vertex AI Feature Store는 머신러닝 특성을 구성, 저장, 제공하기 위한 관리형 서비스입니다. |
|
|
|
cosine dot-product L2 squared |
ANN | 프리뷰 |
Weaviate는 유연하고 모듈식인 오픈소스 벡터 데이터베이스입니다. |
|
|
|
cosine dot-product L2 squared hamming manhattan |
ANN + 하이브리드 검색 지원 | 프리뷰 |
Pinecone은 고성능 유사성 검색을 위해 설계된 완전 관리형 클라우드 네이티브 벡터 데이터베이스입니다. |
|
|
|
cosine euclidean dot-product |
ANN | 일반 안정화 버전 |
다음 단계
- RAG 코퍼스를 만들려면 RAG 코퍼스 만들기 예시를 참조하세요.
- 모든 RAG 코퍼스를 나열하려면 RAG 코퍼스 목록 예시를 참조하세요.