APPROX_COUNT_DISTINCT
APPROX_COUNT_DISTINCT
함수는 필드 하나에 있는 고유 항목의 대략적인 개수를 집계합니다.
구문
APPROX_COUNT_DISTINCT(X)
매개변수
field_expression
- 계산할 항목을 포함하는 필드 또는 표현식
APPROX_COUNT_DISTINCT
함수의 작동 방식
APPROX_COUNT_DISTINCT
함수에서는 매개변수 하나를 사용하며, 측정항목, 측정기준 또는 모든 유형의 표현식에 해당하는 이름이 매개변수로 사용될 수 있습니다. APPROX_COUNT_DISTINCT
함수는 이러한 필드 또는 표현식에 있는 고유 항목의 대략적인 개수를 반환합니다.
APPROX_COUNT_DISTINCT
는 COUNT_DISTINCT
보다 쿼리 처리 측면에서 더 효율적이지만 결과의 정확성이 떨어집니다. 데이터 세트가 너무 크거나 보고서의 실적이 정확한 수치보다 중요한 경우에는 APPROX_COUNT_DISTINCT
함수를 사용해 보세요. COUNT_DISTINCT
대신 APPROX_COUNT_DISTINCT
를 사용하면 BigQuery 데이터 소스를 사용할 때 쿼리 비용을 줄일 수 있습니다.
근사치 집계가 작동하는 방식에 대한 자세한 설명은 BigQuery 문서를 참고하세요.
예
APPROX_COUNT_DISTINCT(Page)
- 페이지 측정기준에 해당하는 고유한 값의 대략적인 개수를 집계합니다.
APPROX_COUNT_DISTINCT
의 제한사항
APPROX_COUNT_DISTINCT
함수는 BigQuery 데이터 소스와 함께 사용할 때만 사용할 수 있습니다.APPROX_COUNT_DISTINCT
를 지원하지 않는 데이터 소스의 경우APPROX_COUNT_DISTINCT
는COUNT_DISTINCT
처럼 작동합니다.사전 집계된 측정항목 ( 집계 유형은 자동)이나 다른 집계 함수의 결과인 표현식에는 이 함수를 적용할 수 없습니다. 예를 들어 Google 애널리틱스 데이터 소스에서
APPROX_COUNT_DISTINCT(Sessions)
와 같은 수식을 사용하면 오류가 발생합니다.