작업 및 작업 트리거

작업은 민감한 정보 보호가 민감한 정보 내용을 스캔하거나 재식별화에 따른 위험을 계산하기 위해 실행하는 작업을 의미합니다. Sensitive Data Protection은 개발자가 데이터 검사를 명령할 때마다 작업 리소스를 만들고 실행합니다.

민감한 정보 보호 작업에는 현재 두 가지 유형이 있습니다.

  • 검사 작업은 조건에 따라 콘텐츠에서 민감한 정보를 검사하고 민감한 정보의 유형과 위치가 포함된 요약 보고서를 생성합니다.
  • 위험 분석 작업은 익명화된 데이터를 분석하고 데이터가 재식별화될 수 있는 가능성에 대한 측정항목을 반환합니다.

작업 트리거를 만들어 민감한 정보 보호가 작업을 실행할 시간을 예약할 수 있습니다. 작업 트리거는 Cloud Storage 버킷, BigQuery 테이블, Datastore 종류를 비롯한 Google Cloud 스토리지 저장소를 스캔하기 위한 민감한 정보 보호 작업 생성을 자동화하는 이벤트입니다.

작업 트리거를 사용하면 각 트리거가 사용 중지되는 간격을 설정하여 스캔 작업을 예약할 수 있습니다. 마지막 스캔 실행 이후 달라진 부분을 찾아서 변경되거나 추가된 콘텐츠를 모니터링하거나 최신 검사 결과 보고서를 생성하도록 구성할 수 있습니다. 예약된 트리거는 설정된 간격(1~60일)에 따라 실행됩니다.

다음 단계

다음 주제에서 작업 및 작업 트리거를 생성, 편집, 실행하는 방법에 대한 자세한 내용을 확인하세요.

또한 다음 빠른 시작을 참조하세요.

JobTrigger 객체

작업 트리거는 DLP API에서 JobTrigger 객체로 표현됩니다.

작업 트리거 구성 필드

JobTrigger에는 다음을 포함한 여러 구성 필드가 있습니다.

  • 트리거의 이름, 표시 이름, 설명
  • Trigger 객체 모음. 각 모음에는 초 단위로 스캔 반복을 정의하는 Schedule 객체가 포함됩니다.
  • InspectJobConfig 객체. 트리거되는 작업에 적용되는 구성 정보가 포함됩니다.
  • Status 열거형. 트리거가 현재 활성 상태인지 여부를 나타냅니다.
  • 생성, 업데이트, 마지막 실행 시간을 나타내는 타임스탬프 필드
  • Error 객체 모음(트리거가 활성화되었을 때 발생한 경우)

작업 트리거 메서드

JobTrigger 객체에는 여러 가지 기본 제공 메서드도 포함됩니다. 이러한 메서드를 사용하여 다음을 할 수 있습니다.

작업 지연 시간

작업 및 작업 트리거에 대한 서비스 수준 목표(SLO)가 보장되지 않습니다. 지연 시간은 스캔할 데이터 양, 스캔하는 스토리지 저장소, 스캔하는 infoType 유형 및 개수, 작업이 처리되는 리전, 사용 가능한 컴퓨팅 리소스를 포함한 여러 요인의 영향을 받습니다. 따라서 검사 작업의 지연 시간을 미리 확인할 수 없습니다.

작업 지연 시간을 줄이는 데 도움이 되는 방법은 다음과 같습니다.

  • 작업 또는 작업 트리거에 샘플링을 사용할 수 있으면 사용 설정하세요.
  • 필요하지 않은 infoType은 사용 설정하지 않습니다. 특정 시나리오에서는 infoType이 유용할 수 있지만 이러한 infoType이 포함되지 않은 요청보다 훨씬 느리게 실행될 수 있습니다.

    • PERSON_NAME
    • FEMALE_NAME
    • MALE_NAME
    • FIRST_NAME
    • LAST_NAME
    • DATE_OF_BIRTH
    • LOCATION
    • STREET_ADDRESS
    • ORGANIZATION_NAME
  • 항상 infoType을 명시적으로 지정하세요. 비어 있는 infoType 목록을 사용하지 마세요.

  • 가능하면 다른 처리 리전을 사용합니다.

이러한 방법을 시도한 후에도 작업에 지연 시간이 발생하는 경우 작업 대신 content.inspect 또는 content.deidentify 요청을 사용하는 것이 좋습니다. 이러한 방법에는 서비스수준계약이 적용됩니다. 자세한 내용은 민감한 정보 보호 서비스수준계약을 참조하세요.

새 콘텐츠만 스캔

Cloud Storage 또는 BigQuery에 저장된 파일의 기간 날짜를 자동으로 설정하도록 작업 트리거를 구성할 수 있습니다. TimespanConfig 객체를 자동으로 채우도록 설정하면 민감한 정보 보호는 트리거가 마지막으로 실행된 이후 추가되었거나 수정된 데이터만 스캔합니다.

...
  timespan_config {
        enable_auto_population_of_timespan_config: true
      }
...

BigQuery 검사의 경우 3시간 이상 된 행만 스캔에 포함됩니다. 이 작업과 관련된 알려진 문제를 참고하세요.

파일 업로드 시 작업 트리거

Google Cloud는 민감한 정보 보호에 기본 제공되는 작업 트리거 지원 외에도 민감한 정보 보호 작업을 통합하거나 트리거하는 데 사용할 수 있는 다양한 구성요소를 제공합니다. 예를 들어 Cloud Run 함수를 사용하여 Cloud Storage에 파일이 업로드될 때마다 민감한 정보 보호 스캔을 트리거할 수 있습니다.

이 작업을 설정하는 방법에 대한 자세한 내용은 Cloud Storage에 업로드되는 데이터 분류 자동화를 참조하세요.