이 페이지에서는 데이터 프로필에서 수집되는 모든 측정항목을 나열하고 설명합니다.
데이터 프로필에는 프로젝트 데이터 프로필, 테이블 데이터 프로필, 열 데이터 프로필의 세 가지 유형이 있습니다.
프로젝트 데이터 프로필
각 프로젝트 데이터 프로필에는 다음 필드가 있습니다. 이러한 필드의 값은 프로젝트 내에서 프로파일링되는 리소스를 기반으로 집계됩니다.
Insights
프로젝트 데이터 프로필은 다음 통계를 제공합니다.
- 데이터 위험
- 현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
- 민감도
- 이 프로젝트의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
메타데이터
프로젝트 데이터 프로필은 다음 메타데이터를 제공합니다.
- 최종 프로필 생성 시간
- 프로필이 마지막으로 생성된 날짜 및 시간입니다.
- 프로젝트 ID
- 프로파일링된 프로젝트의 ID입니다.
- 리소스 이름
- 데이터 프로필의 정규화된 이름입니다.
- 상태
- 프로파일링 작업의 상태를 나타내는 아이콘입니다.
테이블 데이터 프로필
각 테이블 데이터 프로필에는 다음과 같은 필드가 있습니다.
Insights
테이블 데이터 프로필은 다음 통계를 제공합니다.
- 데이터 위험
- 현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
- 민감도
- 이 테이블의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
메타데이터
테이블 데이터 프로필은 다음 메타데이터를 제공합니다.
- 데이터베이스
- 프로파일링된 테이블이 포함된 데이터베이스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
- 데이터 세트 ID
- 이 테이블이 포함된 데이터 세트의 ID입니다.
- 암호화
- 이 테이블의 암호화가 Google에서 관리되는지 아니면 조직에서 관리되는지 여부입니다.
- 만료 시간
- 선택사항. 이 테이블이 만료되는 시간입니다.
- 실패한 열 수
- 오류로 인해 이 테이블에서 건너뛴 열 수입니다.
- 검사 구성 스냅샷
- 프로필이 생성될 때 사용된 검사 템플릿의 스냅샷입니다. 자세한 내용은 데이터 프로필 스냅샷을 참조하세요.
- 인스턴스
- 프로파일링된 테이블이 포함된 인스턴스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
- 최종 프로필 생성 시간
- 프로필이 마지막으로 생성된 날짜 및 시간입니다.
- BigQuery의 최종 업데이트
- 이 테이블이 마지막으로 수정된 날짜 및 시간입니다.
- 프로젝트 ID
- 이 테이블이 포함된 프로젝트의 ID입니다.
- 공개
이 테이블을 모든 사용자에게 공개할지 또는 특정 사용자로 제한할지 여부입니다.
- 리소스 라벨
프로필이 생성된 시점에 테이블에 있던 라벨입니다.
- 리소스 태그
프로필이 생성된 시점에 테이블에 있던 태그입니다.
- 리소스 이름
데이터 프로필의 정규화된 이름입니다.
- 행 수
프로필이 생성되었을 때 이 테이블의 행 수입니다.
- 스캔한 열 수
이 테이블에 프로파일링된 열 수입니다.
- 서비스 계정
이 테이블에 액세스할 수 있는 IAM 권한이 있는 서비스 계정 수입니다.
- 상태
프로필이 생성되었는지 여부를 나타내는 표시입니다.
- 테이블 ID
이 테이블의 ID입니다.
- 테이블 생성 시간
테이블이 생성된 날짜 및 시간입니다.
- 테이블 크기
프로필이 생성되었을 때 이 테이블의 크기입니다.
- 유형
실행된 탐색 유형입니다.
열 데이터 프로필
각 열 데이터 프로필에는 다음과 같은 필드가 있습니다.
Insights
열 데이터 프로필은 다음 통계를 제공합니다.
- 데이터 위험
- 현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
- 민감도
- 이 열의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
- 예측된 infoType
단일 기본 제공 또는 커스텀 infoType이 열의 다른 유형보다 명확하게 지배적이면 민감한 데이터 보호는 이 필드를 해당 infoType으로 설정합니다. 그렇지 않으면 이 필드에는 값이 없습니다.
열에서 감지된 모든 infoType의 목록을 보려면 기타 infoType 필드를 참조하세요.
Sensitive Data Protection은 검사 템플릿에 지정한 infoType만 스캔합니다. 따라서 이러한 infoType만 예측된 infoType 필드에 표시될 수 있습니다. 예를 들어 열에 이메일 주소가 있지만 검사 템플릿에
EMAIL_ADDRESS
infoType 감지기가 포함되어 있지 않으면 이 필드에EMAIL_ADDRESS
가 포함되지 않습니다.열 데이터가 동일한 일반 카테고리에 속하는 밀접하게 관련된 여러 infoType과 주로 일치하는 경우 민감한 정보 보호는 이 필드를 더 일반적인 infoType으로 설정합니다. 예를 들어 열에 주로
PASSPORT
,AUSTRALIA_PASSPORT
,CANADA_PASSPORT
infoType이 혼합되어 있는 경우 예측된 infoType 필드는PASSPORT
로 설정됩니다. 기타 infoTypes 필드에는 더 구체적인 infoType과 예상 발생률이 표시됩니다.- 기타 infoType
해당 열의 예측된 infoType으로 간주될 만큼 강력한 신호가 없는 열에서 InfoType이 감지되었습니다. 이 문서에서 예측된 infoType을 참조하세요.
2022년 10월 13일 이후에 생성된 데이터 프로필의 경우 이 필드에 나열된 각 infoType에는 예상 발생률이 있습니다. 예상 발생률은 infoType이 감지된 null이 아닌 행의 대략적인 비율입니다.
예를 들어 다음과 같은 측정항목이 있는 열이 있다고 가정해 보겠습니다.
- 예측된 infoType:
FDA_CODE
- 기타 infoType:
PERSON_NAME (2%)
,STREET_ADDRESS (1%)
이 예에서는 열에 FDA 코드가 포함되어 있음을 강력하게 나타냅니다. 또한 민감한 정보 보호에서는 열에서 null이 아닌 행의 약 2%에 사람 이름이 포함되고 1%에 상세 주소가 포함될 수 있다고 확인했습니다.
Sensitive Data Protection은 검사 템플릿에 지정한 infoType만 스캔합니다. 따라서 이러한 infoType만 기타 infoType 필드에 표시될 수 있습니다. 예를 들어 열에 이메일 주소가 있지만 검사 템플릿에
EMAIL_ADDRESS
infoType 감지기가 포함되어 있지 않으면 이 필드에EMAIL_ADDRESS
가 포함되지 않습니다.- 예측된 infoType:
- 예상 null 비율
이 열에 있는 null 값의 대략적인 비율로, 높음, 보통, 낮음 또는 매우 낮음으로 분류됩니다. 이 열에 있는 항목 중 null의 비율이 높으면 이 값이 높습니다.
- 예상 고유성
이 열에 있는 데이터 중 고유한 데이터 양의 추정치로, 높음, 중간, 낮음으로 분류됩니다. 고유성 수준이 높다는 것은 열에 고유한 값이 포함되어 있음을 나타냅니다. 고유한 값이 많으면 열에 식별자가 포함되어 있음을 나타낼 수 있습니다.
고유성 수준이 낮다는 것은 열에 enum 또는 불리언 값과 같이 많은 일반적인 값이 포함되어 있음을 나타냅니다.
이 측정항목을 계산하기에 테이블 행이 충분하지 않다고 민감한 정보 보호에서 판단하면 이 값이 비어 있습니다.
- 자유 텍스트 점수
이 열에 자유형 텍스트가 포함될 확률입니다. 값이 1에 가까우면 열에 자유형 또는 자연어 텍스트가 포함될 가능성이 높습니다. 가능한 값의 범위는 0부터 1까지입니다.
자유 텍스트 점수가 높으면 열의 데이터 위험과 민감도 수준이 증가할 수 있습니다.
메타데이터
열 데이터 프로필은 다음 메타데이터를 제공합니다.
- 데이터베이스
- 프로파일링된 테이블 열이 포함된 데이터베이스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
- 데이터 유형
- 이 열 콘텐츠의 데이터 유형입니다.
- 데이터 세트 ID
- 이 테이블 열이 포함된 데이터 세트의 ID입니다.
- 필드 ID
- 열 이름입니다.
- 인스턴스
- 프로파일링된 테이블 열이 포함된 인스턴스입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
- 인스턴스 위치
- 프로파일링된 테이블 열이 포함된 인스턴스의 위치입니다. 이 필드는 Cloud SQL 검색에만 적용됩니다.
- 최종 프로필 생성 시간
- 프로필이 마지막으로 생성된 날짜 및 시간입니다.
- 정책 태그
- 정책 태그가 열에 적용되었는지 여부를 나타냅니다. 정책 태그 사용을 위한 권장사항에 대한 자세한 내용은 BigQuery에서 정책 태그 사용을 참조하세요.
- 프로젝트 ID
- 이 테이블 열이 포함된 프로젝트의 ID입니다.
- 리소스 이름
- 데이터 프로필의 정규화된 이름입니다.
- 상태
- 프로파일링 작업의 상태를 나타내는 아이콘입니다.
- 테이블 ID
- 이 열이 포함된 테이블의 ID입니다.
파일 스토어 데이터 프로필
민감한 정보 보호에서는 파일 저장소라는 용어를 사용하여 파일 저장소 버킷을 나타냅니다.
각 파일 저장소 데이터 프로필에는 다음 필드가 있습니다.
통계
파일 스토어 데이터 프로필은 다음 통계를 제공합니다.
- 데이터 위험
- 현재 상태의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
- 파일 클러스터
- 이 파일 저장소가 프로파일링될 때 감지된 각 파일 클러스터의 요약을 제공합니다. 각 요약에 관한 자세한 내용은 이 페이지의 파일 클러스터 요약을 참고하세요.
- 민감도
- 이 파일 저장소의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
메타데이터
파일 스토어 데이터 프로필은 다음 메타데이터를 제공합니다.
- 데이터 스토리지 위치
이중 리전 Cloud Storage 버킷을 프로파일링한 경우 이 필드에 두 리전이 표시됩니다.
Amazon S3 버킷의 프로필을 생성한 경우 이 값은 버킷이 저장된 AWS 리전입니다.
- 암호화
이 파일 저장소의 암호화가 Google에서 관리되는지 아니면 조직에서 관리되는지 여부입니다.
- 파일 스토어 유형
프로파일링된 데이터 유형(Cloud Storage 데이터 또는 Amazon S3 데이터)
- 파일 스토어 경로
파일 저장소의 이름입니다.
- 검사 구성 스냅샷
프로필이 생성될 때 사용된 검사 템플릿의 스냅샷입니다. 자세한 내용은 데이터 프로필 스냅샷을 참고하세요.
- 위치 유형
파일 저장소가 저장되는 위치 유형입니다(
region
,dual-region
또는multi-region
).- 프로필 첫 생성 시간
프로필이 처음 생성된 날짜 및 시간입니다.
- 프로필 최종 생성 시간
프로필이 마지막으로 생성된 날짜 및 시간입니다.
- 상위 ID
프로파일링된 데이터를 소유한 리소스입니다.
- 데이터 프로필이 Google Cloud 리소스에 관한 경우 데이터가 포함된 프로젝트의 ID입니다.
- 데이터 프로필이 Amazon S3 버킷용인 경우 버킷이 포함된 AWS 계정의 ID입니다.
- 공개
이 파일 스토어를 모든 사용자에게 공개할지 또는 특정 사용자로 제한할지 여부입니다.
- 리소스 라벨
프로필이 생성된 시점에 파일 스토어에 있던 라벨입니다.
- 리소스 태그
프로필이 생성된 시점에 파일 스토어에 있던 태그입니다.
- 리소스 위치
파일 저장소가 포함된 리전 또는 멀티 리전입니다.
이중 리전 Cloud Storage 버킷을 프로파일링한 경우 이 값은 버킷이 사전 정의된 이중 리전에 저장되어 있는지에 따라 다릅니다.
- 사전 정의된 이중 리전의 경우 민감한 정보 보호는 이 값을 사전 정의된 이중 리전 이름으로 설정합니다.
- 표준 이중 리전의 경우 민감한 정보 보호는 이 값을 이중 리전이 포함된 멀티 리전으로 설정합니다. 리전이 멀티 리전에 매핑되는 방식에 관한 자세한 내용은 이중 리전을 참고하세요.
- 리소스 이름
데이터 프로필의 정규화된 이름입니다.
- 상태
프로필이 생성되었는지 여부를 나타내는 표시입니다.
파일 클러스터 요약
파일 스토어 데이터 프로필이 생성되면 파일이 파일 클러스터로 그룹화됩니다. 민감한 정보 보호는 각 파일 클러스터의 요약을 제공합니다.
각 파일 클러스터 요약에는 다음과 같은 필드가 있습니다.
- 데이터 위험
- 이 파일 클러스터의 데이터와 관련된 위험 수준입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
- 오류
- 파일 저장소 데이터 프로필이 생성될 때 감지된 오류입니다.
- 스캔된 파일 확장자
- 파일 스토어 데이터 프로필을 생성하기 위해 감지되고 스캔된 파일 유형 목록입니다.
- 확인된 파일 확장자
- 감지되었지만 반드시 스캔되지 않은 파일 형식 목록입니다.
- InfoType
- 이 파일 클러스터에서 감지된 기본 제공 및 커스텀 infoType 목록입니다.
- 민감도
- 이 파일 클러스터의 민감도 수준을 나타내는 점수입니다. 자세한 내용은 민감도 및 데이터 위험 수준을 참조하세요.
- 유형
- 이 클러스터의 파일 카테고리를 나타냅니다. 지원되는 모든 파일 클러스터에 관한 자세한 내용은 파일 클러스터를 참고하세요.