Amazon S3의 민감한 데이터 검색

이 페이지에서는 Amazon S3에서 사용할 수 있는 민감한 정보 보호 검색을 설명합니다. 이 기능은 Enterprise 등급에서 Security Command Center를 활성화한 고객만 사용할 수 있습니다.

민감한 정보 보호 검색을 사용하면 S3에 저장 중인 데이터 유형과 데이터의 민감도 수준을 파악할 수 있습니다. S3 데이터를 프로파일링하면 S3 버킷에 관한 통계와 메타데이터를 제공하는 파일 스토어 데이터 프로필이 생성됩니다. 각 S3 버킷의 경우 파일 저장소 데이터 프로필에는 다음 정보가 포함됩니다.

  • 버킷에 저장하는 파일의 유형으로 파일 클러스터로 분류됩니다.
  • 버킷의 데이터 민감도 수준
  • 감지된 각 파일 클러스터에 관한 요약으로, 발견된 민감한 정보의 유형이 포함됩니다.

각 파일 스토어 데이터 프로필의 통계 및 메타데이터의 전체 목록은 파일 스토어 데이터 프로필을 참고하세요.

디스커버리 서비스에 대한 자세한 내용은 데이터 프로필을 참조하세요.

워크플로

Amazon S3 데이터를 프로파일링하기 위한 대략적인 워크플로는 다음과 같습니다.

  1. Security Command Center에서 Amazon Web Services(AWS)용 커넥터를 만듭니다. Sensitive Data Protection 검색을 위한 권한 부여 체크박스를 선택하고 안내에 따라 민감한 정보 검색 권한으로 커넥터를 구성합니다.

    Sensitive Data Protection 검색을 위한 권한 부여가 선택되지 않은 커넥터가 이미 있는 경우 기존 AWS 커넥터에 민감한 데이터 검색 권한 부여를 참고하세요.

  2. global 리전 또는 검색 스캔 구성 및 생성된 모든 데이터 프로필을 저장하려는 리전에서 검사 템플릿을 만듭니다.

  3. Amazon S3의 탐색 검사 구성 만들기

    민감한 정보 보호는 지정된 일정에 따라 데이터를 프로파일링합니다.

가격 책정

Amazon S3 데이터를 프로파일링하면 탐색 가격 책정에 나와 있는 민감한 정보 보호 요금이 청구됩니다. 또한 AWS에서는 Sensitive Data Protection에서 실행하는 요청S3에서 인터넷으로의 데이터 전송에 대한 요금을 청구합니다.

검색 서비스에서 데이터를 프로파일링하면 S3 버킷의 데이터 샘플이 스캔됩니다. 디스커버리는 휴리스틱 방법을 사용하여 각 버킷과 특정 파일 내에서 샘플링할 데이터의 양을 결정합니다. 이 과정에서 일부 데이터가 Google Cloud로 전송되고 민감한 정보 보호의 콘텐츠 검사 서비스를 사용하여 검사됩니다. 대부분의 경우 간헐적인 오류가 없으면 각 버킷에 대해 전송되고 스캔된 데이터가 30GB를 초과하지 않습니다. 각 버킷에 대해 샘플링된 데이터는 30GB 미만일 수 있습니다.

민감한 정보 보호의 요청

민감한 정보 보호는 S3 버킷을 프로파일링하는 과정에서 다음 작업을 실행합니다.

  • 프로파일링된 S3 버킷당 하루에 약 50회의 LIST 요청
  • 프로파일링된 버킷의 파일당 GET 요청 10개 정도 민감한 정보 보호는 일반적으로 100,000회 미만의 GET 호출을 실행합니다. 비용 최적화 시 이 값에 의존하지 마세요. 이 값은 향후 변경될 수 있습니다.

AWS에서 요청 1,000개당 청구하는 가격은 S3 버킷의 지역에 따라 다릅니다. 자세한 내용은 Amazon S3 가격 책정 문서요청 및 데이터 검색을 참고하세요.

S3에서 인터넷으로의 데이터 전송

민감한 정보 보호에서 S3 데이터를 프로파일링하면 데이터가 S3에서 인터넷으로 전송되는 것으로 간주됩니다. AWS 요금이 부과될 수 있습니다. 자세한 내용은 Amazon S3 가격 책정 문서Amazon S3에서 인터넷으로의 데이터 전송을 참고하세요.

계산 예시

미국 동부 (버지니아 북부)에서 S3 표준 버킷 10개를 프로파일링하려고 한다고 가정해 보겠습니다. 버지니아) 리전에서 다음과 같이 검색 작업과 직접 관련된 Amazon 비용을 추정할 수 있습니다.

예: 요청 및 데이터 검색

버킷당 예상 요청 수 버킷 10개에 대한 예상 요청 수 Amazon 요금 소계
LIST 50 500 호출 1,000회당 $0.005 0.005
GET 28,000 280,000 호출 1,000회당 $0.0004 0.112
합계 0.117

예: Amazon S3에서 인터넷으로의 데이터 전송

버킷당
샘플링된 데이터
Amazon 요금 버킷당 가격
최대 30GB 1GB당 $0.09 최대 $2.70

데이터 보존 고려사항

Amazon S3 데이터를 프로파일링할 계획이라면 다음을 고려하세요.

  • 데이터 프로필은 검색 스캔 구성과 함께 저장됩니다. 반면 Google Cloud 데이터를 프로파일링하면 프로필이 프로파일링할 데이터와 동일한 리전에 저장됩니다.

  • 검사 템플릿을 global 리전에 저장하면 검색 스캔 구성을 저장한 리전에서 해당 템플릿의 메모리 내 사본이 읽힙니다.

  • S3 데이터는 수정되지 않습니다. 데이터의 메모리 내 사본은 검색 스캔 구성을 저장하는 리전에서 읽습니다. 그러나 민감한 정보 보호는 데이터가 공개 인터넷에 도달한 후 데이터가 통과하는 위치를 보장하지 않습니다. 데이터는 SSL로 암호화됩니다.

다음 단계