기여 분석 개요
주요 요인 분석이라고도 하는 기여 분석을 사용하여 다차원 데이터의 주요 측정항목 변경사항에 관한 통계를 생성할 수 있습니다. 예를 들어 기여 분석을 사용하여 두 분기 간의 수익 수치 변화를 확인하거나 두 세트의 학습 데이터를 비교하여 ML 모델 성능의 변화를 파악할 수 있습니다. CREATE MODEL
문을 사용하여 BigQuery에서 기여 분석 모델을 만들 수 있습니다.
기여 분석은 인공지능(AI)을 사용하여 데이터의 분석 및 이해를 개선하고 자동화하는 증강 분석의 한 형태입니다. 기여 분석은 사용자가 데이터에서 패턴을 찾는 데 도움이 되는 증강 분석의 주요 목표 중 하나를 달성합니다.
기여 분석 모델은 테스트 데이터 세트를 대조 데이터 세트와 비교하여 시간 경과에 따른 측정항목의 통계적으로 유의미한 변화를 보여주는 데이터 세그먼트를 감지합니다. 이를 통해 시간, 위치, 고객 세그먼트 또는 기타 관심 있는 다른 측정항목에서 데이터가 어떻게 달라지는지 확인할 수 있습니다. 예를 들어 2023년 말에 만든 테이블 스냅샷을 2022년 말에 만든 테이블 스냅샷과 비교하여 2년 동안 데이터가 어떻게 달라졌는지 확인할 수 있습니다.
이 측정항목은 기여 분석 모델에서 테스트 데이터와 대조 데이터 간의 변화를 측정하고 비교하는 데 사용하는 숫자 값입니다. 기여 분석 모델을 사용하여 합산 가능한 측정항목 또는 합산 가능한 비율 측정항목을 지정할 수 있습니다.
세그먼트는 지정된 측정기준 값 조합으로 식별되는 데이터의 슬라이스입니다. 예를 들어 store_number
, customer_id
, day
측정기준을 기반으로 하는 기여 분석 모델의 경우 이러한 측정기준 값의 고유한 조합마다 세그먼트를 나타냅니다. 다음 표에서 각 행은 다른 세그먼트를 나타냅니다.
store_number |
customer_id |
day |
매장 1 | ||
매장 1 | 고객 1 | |
매장 1 | 고객 1 | 월요일 |
매장 1 | 고객 1 | 화요일 |
매장 1 | 고객 2 | |
매장 2 |
가장 크고 따라서 가장 관련성이 높은 세그먼트만 모델링하려면 모델에서 작은 세그먼트가 사용되지 않도록 제거하는 사전 지원 기준점을 지정합니다. 이렇게 하면 모델 생성 시간도 줄어듭니다.
기여 분석 모델을 만든 후에는 ML.GET_INSIGHTS
함수를 사용하여 모델에서 계산된 측정항목 정보를 가져올 수 있습니다.