측정항목 참조

이 페이지에서는 데이터 프로필에서 수집되는 모든 측정항목을 나열하고 설명합니다.

데이터 프로필에는 프로젝트 데이터 프로필, 테이블 데이터 프로필, 열 데이터 프로필의 세 가지 유형이 있습니다.

프로젝트 데이터 프로필

각 프로젝트 데이터 프로필에는 다음 필드가 있습니다. 이러한 필드의 값은 프로젝트 내에서 프로파일링되는 리소스를 기반으로 집계됩니다.

Insights

프로젝트 데이터 프로필은 다음 통계를 제공합니다.

데이터 위험
현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
민감도
이 프로젝트의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.

메타데이터

프로젝트 데이터 프로필은 다음 메타데이터를 제공합니다.

최종 프로필 생성 시간
프로필이 마지막으로 생성된 날짜 및 시간입니다.
프로젝트 ID
프로파일링된 프로젝트의 ID입니다.
리소스 이름
데이터 프로필의 정규화된 이름입니다.
상태
프로파일링 작업의 상태를 나타내는 아이콘입니다.

테이블 데이터 프로필

각 테이블 데이터 프로필에는 다음과 같은 필드가 있습니다.

Insights

테이블 데이터 프로필은 다음 통계를 제공합니다.

데이터 위험
현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
민감도
이 테이블의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.

메타데이터

테이블 데이터 프로필은 다음 메타데이터를 제공합니다.

데이터베이스
프로파일링된 테이블이 포함된 데이터베이스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
데이터 세트 ID
이 테이블이 포함된 데이터 세트의 ID입니다.
암호화
이 테이블의 암호화가 Google에서 관리되는지 아니면 조직에서 관리되는지 여부입니다.
만료 시간
선택사항. 이 테이블이 만료되는 시간입니다.
실패한 열 수
오류로 인해 이 테이블에서 건너뛴 열 수입니다.
검사 구성 스냅샷
프로필이 생성될 때 사용된 검사 템플릿의 스냅샷입니다. 자세한 내용은 데이터 프로필 스냅샷을 참조하세요.
인스턴스
프로파일링된 테이블이 포함된 인스턴스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
최종 프로필 생성 시간
프로필이 마지막으로 생성된 날짜 및 시간입니다.
BigQuery의 최종 업데이트
이 테이블이 마지막으로 수정된 날짜 및 시간입니다.
프로젝트 ID
이 테이블이 포함된 프로젝트의 ID입니다.
공개

이 테이블을 모든 사용자에게 공개할지 또는 특정 사용자로 제한할지 여부입니다.

리소스 라벨

프로필이 생성된 시점에 테이블에 있던 라벨입니다.

리소스 태그

프로필이 생성된 시점에 테이블에 있던 태그입니다.

리소스 이름

데이터 프로필의 정규화된 이름입니다.

행 수

프로필이 생성되었을 때 이 테이블의 행 수입니다.

스캔한 열 수

이 테이블에 프로파일링된 열 수입니다.

서비스 계정

이 테이블에 액세스할 수 있는 IAM 권한이 있는 서비스 계정 수입니다.

상태

프로필이 생성되었는지 여부를 나타내는 표시입니다.

테이블 ID

이 테이블의 ID입니다.

테이블 생성 시간

테이블이 생성된 날짜 및 시간입니다.

테이블 크기

프로필이 생성되었을 때 이 테이블의 크기입니다.

유형

실행된 탐색 유형입니다.

열 데이터 프로필

각 열 데이터 프로필에는 다음과 같은 필드가 있습니다.

Insights

열 데이터 프로필은 다음 통계를 제공합니다.

데이터 위험
현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
민감도
이 열의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
예측된 infoType

단일 기본 제공 또는 커스텀 infoType이 열의 다른 유형보다 명확하게 지배적이면 민감한 데이터 보호는 이 필드를 해당 infoType으로 설정합니다. 그렇지 않으면 이 필드에는 값이 없습니다.

열에서 감지된 모든 infoType의 목록을 보려면 기타 infoType 필드를 참조하세요.

Sensitive Data Protection은 검사 템플릿에 지정한 infoType만 스캔합니다. 따라서 이러한 infoType만 예측된 infoType 필드에 표시될 수 있습니다. 예를 들어 열에 이메일 주소가 있지만 검사 템플릿에 EMAIL_ADDRESS infoType 감지기가 포함되어 있지 않으면 이 필드에 EMAIL_ADDRESS가 포함되지 않습니다.

열 데이터가 동일한 일반 카테고리에 속하는 밀접하게 관련된 여러 infoType과 주로 일치하는 경우 민감한 정보 보호는 이 필드를 더 일반적인 infoType으로 설정합니다. 예를 들어 열에 주로 PASSPORT, AUSTRALIA_PASSPORT, CANADA_PASSPORT infoType이 혼합되어 있는 경우 예측된 infoType 필드는 PASSPORT로 설정됩니다. 기타 infoTypes 필드에는 더 구체적인 infoType과 예상 발생률이 표시됩니다.

기타 infoType

해당 열의 예측된 infoType으로 간주될 만큼 강력한 신호가 없는 열에서 InfoType이 감지되었습니다. 이 문서에서 예측된 infoType을 참조하세요.

2022년 10월 13일 이후에 생성된 데이터 프로필의 경우 이 필드에 나열된 각 infoType에는 예상 발생률이 있습니다. 예상 발생률은 infoType이 감지된 null이 아닌 행의 대략적인 비율입니다.

예를 들어 다음과 같은 측정항목이 있는 열이 있다고 가정해 보겠습니다.

  • 예측된 infoType: FDA_CODE
  • 기타 infoType: PERSON_NAME (2%), STREET_ADDRESS (1%)

이 예에서는 열에 FDA 코드가 포함되어 있음을 강력하게 나타냅니다. 또한 민감한 정보 보호에서는 열에서 null이 아닌 행의 약 2%에 사람 이름이 포함되고 1%에 상세 주소가 포함될 수 있다고 확인했습니다.

Sensitive Data Protection은 검사 템플릿에 지정한 infoType만 스캔합니다. 따라서 이러한 infoType만 기타 infoType 필드에 표시될 수 있습니다. 예를 들어 열에 이메일 주소가 있지만 검사 템플릿에 EMAIL_ADDRESS infoType 감지기가 포함되어 있지 않으면 이 필드에 EMAIL_ADDRESS가 포함되지 않습니다.

예상 null 비율

이 열에 있는 null 값의 대략적인 비율로, 높음, 보통, 낮음 또는 매우 낮음으로 분류됩니다. 이 열에 있는 항목 중 null의 비율이 높으면 이 값이 높습니다.

예상 고유성

이 열에 있는 데이터 중 고유한 데이터 양의 추정치로, 높음, 중간, 낮음으로 분류됩니다. 고유성 수준이 높다는 것은 열에 고유한 값이 포함되어 있음을 나타냅니다. 고유한 값이 많으면 열에 식별자가 포함되어 있음을 나타낼 수 있습니다.

고유성 수준이 낮다는 것은 열에 enum 또는 불리언 값과 같이 많은 일반적인 값이 포함되어 있음을 나타냅니다.

이 측정항목을 계산하기에 테이블 행이 충분하지 않다고 민감한 정보 보호에서 판단하면 이 값이 비어 있습니다.

자유 텍스트 점수

이 열에 자유형 텍스트가 포함될 확률입니다. 값이 1에 가까우면 열에 자유형 또는 자연어 텍스트가 포함될 가능성이 높습니다. 가능한 값의 범위는 0부터 1까지입니다.

자유 텍스트 점수가 높으면 열의 데이터 위험과 민감도 수준이 증가할 수 있습니다.

메타데이터

열 데이터 프로필은 다음 메타데이터를 제공합니다.

데이터베이스
프로파일링된 테이블 열이 포함된 데이터베이스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
데이터 유형
이 열 콘텐츠의 데이터 유형입니다.
데이터 세트 ID
이 테이블 열이 포함된 데이터 세트의 ID입니다.
필드 ID
열 이름입니다.
인스턴스
프로파일링된 테이블 열이 포함된 인스턴스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
인스턴스 위치
프로파일링된 테이블 열이 포함된 인스턴스의 위치입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
최종 프로필 생성 시간
프로필이 마지막으로 생성된 날짜 및 시간입니다.
정책 태그
정책 태그가 열에 적용되었는지 여부를 나타냅니다. 정책 태그 사용을 위한 권장사항에 대한 자세한 내용은 BigQuery에서 정책 태그 사용을 참조하세요.
프로젝트 ID
이 테이블 열이 포함된 프로젝트의 ID입니다.
리소스 이름
데이터 프로필의 정규화된 이름입니다.
상태
프로파일링 작업의 상태를 나타내는 아이콘입니다.
테이블 ID
이 열이 포함된 테이블의 ID입니다.

파일 스토어 데이터 프로필

민감한 정보 보호에서는 파일 저장소라는 용어를 사용하여 파일 저장소 버킷을 나타냅니다.

각 파일 저장소 데이터 프로필에는 다음 필드가 있습니다.

통계

파일 스토어 데이터 프로필은 다음 통계를 제공합니다.

데이터 위험
현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
파일 클러스터
이 파일 저장소가 프로파일링될 때 감지된 각 파일 클러스터의 요약을 제공합니다. 각 요약에 관한 자세한 내용은 이 페이지의 파일 클러스터 요약을 참고하세요.
민감도
이 파일 저장소의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.

메타데이터

파일 스토어 데이터 프로필은 다음 메타데이터를 제공합니다.

데이터 스토리지 위치

이중 리전 Cloud Storage 버킷을 프로파일링한 경우 이 필드에 두 리전이 표시됩니다.

Amazon S3 버킷의 프로필을 생성한 경우 이 값은 버킷이 저장된 AWS 리전입니다.

암호화

이 파일 저장소의 암호화가 Google에서 관리되는지 아니면 조직에서 관리되는지 여부입니다.

파일 스토어 유형

프로파일링된 데이터 유형(Cloud Storage 데이터 또는 Amazon S3 데이터)

파일 스토어 경로

파일 저장소의 이름입니다.

검사 구성 스냅샷

프로필이 생성될 때 사용된 검사 템플릿의 스냅샷입니다. 자세한 내용은 데이터 프로필 스냅샷을 참고하세요.

위치 유형

파일 저장소가 저장되는 위치 유형입니다(region, dual-region 또는 multi-region).

프로필 첫 생성 시간

프로필이 처음 생성된 날짜 및 시간입니다.

프로필 최종 생성 시간

프로필이 마지막으로 생성된 날짜 및 시간입니다.

상위 ID

프로파일링된 데이터를 소유한 리소스입니다.

  • 데이터 프로필이 Google Cloud 리소스에 관한 경우 데이터가 포함된 프로젝트의 ID입니다.
  • 데이터 프로필이 Amazon S3 버킷용인 경우 버킷이 포함된 AWS 계정의 ID입니다.
공개

이 파일 스토어를 모든 사용자에게 공개할지 또는 특정 사용자로 제한할지 여부입니다.

리소스 라벨

프로필이 생성된 시점에 파일 스토어에 있던 라벨입니다.

리소스 태그

프로필이 생성된 시점에 파일 스토어에 있던 태그입니다.

리소스 위치

파일 저장소가 포함된 리전 또는 멀티 리전입니다.

이중 리전 Cloud Storage 버킷을 프로파일링한 경우 이 값은 버킷이 사전 정의된 이중 리전에 저장되어 있는지에 따라 다릅니다.

  • 사전 정의된 이중 리전의 경우 민감한 정보 보호는 이 값을 사전 정의된 이중 리전 이름으로 설정합니다.
  • 표준 이중 리전의 경우 민감한 정보 보호는 이 값을 이중 리전이 포함된 멀티 리전으로 설정합니다. 리전이 멀티 리전에 매핑되는 방식에 관한 자세한 내용은 이중 리전을 참고하세요.
리소스 이름

데이터 프로필의 정규화된 이름입니다.

상태

프로필이 생성되었는지 여부를 나타내는 표시입니다.

파일 클러스터 요약

파일 스토어 데이터 프로필이 생성되면 파일이 파일 클러스터로 그룹화됩니다. 민감한 정보 보호는 각 파일 클러스터의 요약을 제공합니다.

각 파일 클러스터 요약에는 다음과 같은 필드가 있습니다.

데이터 위험
이 파일 클러스터의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
오류
파일 저장소 데이터 프로필이 생성될 때 감지된 오류입니다.
스캔된 파일 확장자
파일 스토어 데이터 프로필을 생성하기 위해 감지되고 스캔된 파일 유형 목록입니다.
확인된 파일 확장자
감지되었지만 반드시 스캔되지 않은 파일 형식 목록입니다.
InfoType
이 파일 클러스터에서 감지된 기본 제공커스텀 infoType 목록입니다.
민감도
이 파일 클러스터의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
유형
이 클러스터의 파일 카테고리를 나타냅니다. 지원되는 모든 파일 클러스터에 관한 자세한 내용은 파일 클러스터를 참고하세요.