이 페이지는 Cloud Translation API를 통해 번역되었습니다.

PostgreSQL용 AlloyDB에서 벡터 쿼리 성능 조정

PostgreSQL용 AlloyDB에서 다음 벡터 색인을 조정하여 더 빠른 쿼리 성능과 더 나은 재현율을 달성하는 방법을 알아봅니다.

쿼리를 분석하고 벡터 색인 측정항목을 확인하여 쿼리 성능을 모니터링하고 개선할 수도 있습니다.

`IVF` 색인 조정

애플리케이션 성능 최적화에는 lists, ivf.probes, quantizer 파라미터에 설정한 값을 조정하는 것이 도움이 될 수 있습니다.

조정 파라미터	설명	파라미터 유형
`lists`	색인 빌드 중에 생성된 목록 수입니다. 이 값을 설정하는 시작점은 행 수가 100만 개 이하일 경우 `(rows)/1000`, 100만 개를 초과할 경우 `sqrt(rows)`입니다.	색인 생성
`quantizer`	K-평균 트리에서 사용할 양자화기의 유형입니다. 기본값은 쿼리 성능 향상을 위한 `SQ8`입니다. 더 나은 재현율을 원하면 `FLAT`으로 설정하세요.	색인 생성
`ivf.probes`	검색 중에 탐색할 최근접 목록 수입니다. 이 값의 시작점은 `sqrt(lists)`입니다.	쿼리 런타임

다음은 조정 파라미터가 설정된 IVF 색인을 보여주는 예시입니다.

SET LOCAL ivf.probes = 10;

CREATE INDEX my-ivf-index ON my-table
  USING ivf (vector_column cosine)
  WITH (lists = 100, quantizer = 'SQ8');

쿼리 분석

다음 예시 SQL 쿼리에서와 같이 EXPLAIN ANALYZE 명령어를 사용해 쿼리 통계를 분석합니다.

  EXPLAIN ANALYZE SELECT result-column
  FROM my-table
  ORDER BY EMBEDDING_COLUMN <=> embedding('text-embedding-005', 'What is a database?')::vector
  LIMIT 1;

예시 응답의 QUERY PLAN에는 소요 시간, 스캔되거나 반환된 행 수, 사용된 리소스 등의 정보가 포함됩니다.

Limit  (cost=0.42..15.27 rows=1 width=32) (actual time=0.106..0.132 rows=1 loops=1)
  ->  Index Scan using my-scann-index on my-table  (cost=0.42..858027.93 rows=100000 width=32) (actual time=0.105..0.129 rows=1 loops=1)
        Order By: (embedding_column <=> embedding('text-embedding-005', 'What is a database?')::vector(768))
        Limit value: 1
Planning Time: 0.354 ms
Execution Time: 0.141 ms

벡터 색인 측정항목 보기

벡터 색인 측정항목을 사용하면 벡터 색인의 성능을 검토하고, 개선이 필요한 영역을 식별하며, 필요할 경우 해당 측정항목에 따라 색인을 조정할 수 있습니다.

모든 벡터 색인 측정항목을 보려면 pg_stat_ann_indexes 뷰를 사용하는 다음 SQL 쿼리를 실행하세요.

SELECT * FROM pg_stat_ann_indexes;

다음과 비슷한 출력이 표시됩니다.

-[ RECORD 1 ]----------+---------------------------------------------------------------------------
relid                  | 271236
indexrelid             | 271242
schemaname             | public
relname                | t1
indexrelname           | t1_ix1
indextype              | scann
indexconfig            | {num_leaves=100,quantizer=SQ8}
indexsize              | 832 kB
indexscan              | 0
insertcount            | 250
deletecount            | 0
updatecount            | 0
partitioncount         | 100
distribution           | {"average": 3.54, "maximum": 37, "minimum": 0, "outliers": [37, 12, 11, 10, 10, 9, 9, 9, 9, 9]}
distributionpercentile |{"10": { "num_vectors": 0, "num_partitions": 0 }, "25": { "num_vectors": 0, "num_partitions": 30 }, "50": { "num_vectors": 3, "num_partitions": 30 }, "75": { "num_vectors": 5, "num_partitions": 19 }, "90": { "num_vectors": 7, "num_partitions": 11 }, "95": { "num_vectors": 9, "num_partitions": 5 }, "99": { "num_vectors": 12, "num_partitions": 4 }, "100": { "num_vectors": 37, "num_partitions": 1 }}

전체 측정항목 목록에 대한 자세한 내용은 벡터 색인 측정항목을 참조하세요.

다음 단계

벡터 색인 유지보수
임베딩 워크플로 예시에 대해 알아봅니다.

PostgreSQL용 AlloyDB에서 벡터 쿼리 성능 조정

IVF 색인 조정

쿼리 분석

벡터 색인 측정항목 보기

다음 단계

`IVF` 색인 조정