관리형 재해 복구

이 문서에서는 BigQuery 관리형 재해 복구의 개요와 데이터 및 워크로드에 이를 구현하는 방법을 설명합니다.

개요

BigQuery는 전체 리전 중단 시 재해 복구 시나리오를 지원합니다. BigQuery 재해 복구는 리전 간 데이터 세트 복제를 사용하여 스토리지 장애 조치를 관리합니다. 보조 리전에 데이터 세트 복제본을 만든 후에 서비스 중단 시 비즈니스 연속성을 유지하도록 컴퓨팅 및 스토리지의 장애 조치 동작을 제어할 수 있습니다. 장애 조치 후에는 승격된 리전의 컴퓨팅 용량(슬롯) 및 복제된 데이터 세트에 액세스할 수 있습니다. 재해 복구는 Enterprise Plus 버전에서만 지원됩니다.

관리형 재해 복구는 장애 조치 시작 시 하드 장애 조치를 수행합니다. 하드 장애 조치에서는 이전 기본 리전에 장애가 발생하더라도 복제되지 않은 데이터의 복제를 기다리지 않고 보조 리전의 예약 및 데이터 세트 복제본이 즉시 기본 리전으로 승격됩니다. 이로 인해 하드 장애 조치 중에 데이터 손실이 발생할 수 있습니다. 복제본의 replication_time 값 전에 소스 리전에서 데이터를 커밋한 모든 작업은 장애 조치 후 대상 리전에서 다시 실행해야 할 수 있습니다.

재해 복구를 사용 설정하려면 장애 조치 전 데이터 세트가 있는 리전인 기본 리전에 Enterprise Plus 버전 예약을 만들어야 합니다. 페어링된 리전의 대기 컴퓨팅 용량은 Enterprise Plus 예약에 포함됩니다. 그런 다음 이 예약에 데이터 세트를 연결하여 해당 데이터 세트에 장애 조치를 사용 설정합니다. 데이터 세트가 백필되고 예약과 동일한 페어링된 기본 및 보조 위치가 있는 경우에만 데이터 세트를 예약에 연결할 수 있습니다. 데이터 세트가 장애 조치 예약에 연결된 후에 Enterprise Plus 예약만 해당 데이터 세트를 쓸 수 있으며 데이터 세트에서 리전 간 복제 승격을 수행할 수 없습니다. 모든 용량 모델을 사용하여 장애 조치 예약에 연결된 데이터 세트에서 읽을 수 있습니다. 예약에 대한 자세한 내용은 워크로드 관리 소개를 참조하세요.

기본 리전의 컴퓨팅 용량은 장애 조치 직후 보조 리전에서 사용할 수 있습니다. 이 가용성은 사용 여부와 관계없이 예약 기준에 적용됩니다.

테스트의 일환으로 또는 실제 재해에 대응하기 위해 장애 조치를 적극적으로 선택해야 합니다. 장애 조치를 10분 안에 두 번 이상 수행하지 않아야 합니다. 데이터 복제 시나리오에서 백필은 복제본이 생성되거나 활성화되기 전에 존재했던 이전 데이터로 데이터 세트의 복제본을 채우는 프로세스를 의미합니다. 데이터 세트로 장애 조치하려면 먼저 데이터 세트에서 백필을 완료해야 합니다.

다음 다이어그램은 관리형 재해 복구의 아키텍처를 보여줍니다.

관리형 재해 복구 아키텍처

제한사항

BigQuery 재해 복구에는 다음 제한사항이 적용됩니다.

  • BigQuery 재해 복구에는 리전 간 데이터 세트 복제와 동일한 제한사항이 적용됩니다.

  • 리전 지원은 이중 리전 버킷을 기반으로 합니다.

  • BigQuery 데이터 세트가 멀티 리전에 있으면 다음 리전 쌍을 구성할 수 없습니다. 이 제한사항을 적용하면 복제 후 데이터가 지리적으로 분리됩니다. 멀티 리전에 포함된 리전에 관한 자세한 내용은 멀티 리전을 참조하세요.

    • us-central1 - us 멀티 리전
    • us-west1 - us 멀티 리전
    • eu-west1 - eu 멀티 리전
    • eu-west4 - eu 멀티 리전
  • 장애 조치 후 자동 확장은 보조 리전의 컴퓨팅 용량 가용성에 따라 달라집니다. 보조 리전에서는 예약 기준만 사용할 수 있습니다.

  • INFORMATION_SCHEMA.RESERVATIONS에는 장애 조치 세부정보가 없습니다.

  • 동일한 관리 프로젝트의 장애 조치 예약이 여러 개 있지만 연결된 데이터 세트에 다른 보조 위치가 사용되는 경우 다른 장애 조치 예약에 연결된 데이터 세트에 하나의 장애 조치 예약을 사용하지 마세요.

  • 기존 예약을 장애 조치 예약으로 변환하려는 경우 기존 예약의 할당은 1,000개를 초과할 수 없습니다.

시작하기 전에

  1. 예약을 업데이트할 수 있는 bigquery.reservations.update Identity and Access Management(IAM) 권한이 있는지 확인합니다.
  2. 복제용으로 구성된 기존 데이터 세트가 있는지 확인합니다. 자세한 내용은 데이터 세트 복제를 참조하세요.

터보 복제

재해 복구 복제는 리전 간 데이터 복제를 더 빠르게 처리하기 위해 터보 모드를 사용하므로 데이터 손실 노출 위험을 줄이고 리전 서비스 중단 후 중단 없는 서비스 지원을 돕습니다.

터보 복제는 초기 백필 작업에 적용되지 않습니다. 초기 백필 작업이 완료된 후 터보 복제는 대역폭 할당량이 초과되지 않고 사용자 오류가 없는 한 60분 이내에 보조 복제본이 있는 단일 장애 조치 리전 쌍에 데이터 세트를 복제하도록 설계되었습니다.

할당량

장애 조치 예약을 구성하기 전에 선택한 컴퓨팅 용량이 보조 리전에 있어야 합니다. 보조 리전에 사용 가능한 할당량이 없으면 예약을 구성할 수 없습니다. 자세한 내용은 할당량 및 한도를 참조하세요.

터보 복제 대역폭에는 할당량이 있습니다. 자세한 내용은 할당량 및 한도를 참조하세요.

가격 책정

관리형 재해 복구를 구성하려면 다음 요금제가 필요합니다.

  • 컴퓨팅 용량: Enterprise Plus 버전을 구매해야 합니다.

  • 터보 복제: 재해 복구는 복제 중에 터보 복제를 사용합니다. 물리적 바이트 및 복제된 실제 GB당 요금이 청구됩니다. 자세한 내용은 Cloud Storage 가격 책정을 참조하세요.

  • 스토리지: 보조 리전의 스토리지 바이트는 기본 리전의 스토리지 바이트와 동일한 가격으로 청구됩니다. 자세한 내용은 스토리지 가격 책정을 참조하세요.

고객은 기본 리전의 컴퓨팅 용량에 대해서만 비용을 지불하면 됩니다. (예약 기준에 따른) 보조 컴퓨팅 용량은 추가 비용 없이 보조 리전에서 사용할 수 있습니다. 유휴 슬롯은 예약이 장애 조치되지 않는 한 보조 컴퓨팅 용량을 사용할 수 없습니다.

보조 리전에서 비활성 읽기를 수행해야 하는 경우 보조 리전에서 추가 Enterprise Plus 또는 Enterprise 컴퓨팅 용량을 구매할 수 있습니다.

Enterprise Plus 예약 만들기 또는 변경하기

데이터 세트를 예약에 연결하기 전에 Enterprise Plus 예약을 만들거나 기존 예약을 변경하고 재해 복구를 위해 구성해야 합니다.

예약 만들기

다음 중 하나를 선택합니다.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색 메뉴에서 용량 관리를 클릭한 후 예약 만들기를 클릭합니다.

  3. 예약 이름 필드에 예약 이름을 입력합니다.

  4. 위치 목록에서 위치를 선택합니다.

  5. 버전 목록에서 Enterprise Plus 버전을 선택합니다.

  6. 최대 예약 크기 선택기 목록에서 최대 예약 크기를 선택합니다.

  7. 선택사항: 기준 슬롯 필드에 예약의 기준 슬롯 수를 입력합니다.

    사용 가능한 자동 확장 슬롯 수는 최대 예약 크기 값에서 기준 슬롯 값을 빼서 구합니다. 예를 들어 기준 슬롯이 100개이고 최대 예약 크기가 400개인 예약을 만들면 예약의 자동 확장 슬롯은 300개입니다. 기준 슬롯에 대한 자세한 내용은 기준 및 자동 확장 슬롯이 있는 예약 사용을 참조하세요.

  8. 보조 위치 목록에서 보조 위치를 선택합니다.

  9. 유휴 슬롯 공유를 사용 중지하고 지정된 슬롯 용량만 사용하려면 유휴 슬롯 무시 전환 버튼을 클릭합니다.

  10. 고급 설정 섹션을 펼치려면 펼치기 화살표를 클릭합니다.

  11. (선택사항): 대상 작업 동시 실행을 설정하려면 자동 대상 작업 동시 실행 재정의 전환 버튼을 클릭하여 사용 설정한 후 대상 작업 동시 실행 값을 입력합니다. 슬롯 분석은 예상 비용 테이블에 표시됩니다. 예약 요약은 용량 요약 테이블에 표시됩니다.

  12. 저장을 클릭합니다.

새 예약이 슬롯 예약 탭에 표시됩니다.

SQL

예약을 만들려면 CREATE RESERVATION 데이터 정의 언어(DDL) 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    CREATE RESERVATION
      `ADMIN_PROJECT_ID.region-LOCATION.RESERVATION_NAME`
    OPTIONS (
      slot_capacity = NUMBER_OF_BASELINE_SLOTS,
      edition = ENTERPRISE_PLUS,
      secondary_location = SECONDARY_LOCATION);

    다음을 바꿉니다.

    • ADMIN_PROJECT_ID: 예약 리소스를 소유하는 관리 프로젝트의 프로젝트 ID입니다.
    • LOCATION: 예약 위치입니다. BigQuery Omni 위치를 선택하면 버전 옵션이 Enterprise 버전으로 제한됩니다.
    • RESERVATION_NAME: 예약 이름입니다.

      이름은 소문자 또는 숫자로 시작하고 끝나야 하며 소문자, 숫자, 대시만 포함할 수 있습니다.

    • NUMBER_OF_BASELINE_SLOTS: 예약에 할당할 기준 슬롯 수. 동일한 예약에 slot_capacity 옵션 및 edition 옵션을 설정할 수 없습니다.
    • SECONDARY_LOCATION: 예약의 보조 위치입니다. 서비스 중단이 발생하면 이 예약에 연결된 모든 데이터 세트가 이 위치로 장애 조치됩니다.

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

기존 예약 변경

다음 중 하나를 선택합니다.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색 패널에서 용량 관리 섹션으로 이동합니다.

  3. 슬롯 예약 탭을 클릭합니다.

  4. 업데이트할 예약을 찾습니다.

  5. 작업 옵션을 확장합니다.

  6. 수정을 클릭합니다.

  7. 보조 위치 필드에 보조 위치를 입력합니다.

  8. 저장을 클릭합니다.

SQL

보조 위치를 예약에 추가하거나 변경하려면 ALTER RESERVATION SET OPTIONS DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    ALTER RESERVATION
      `ADMIN_PROJECT_ID.region-LOCATION.RESERVATION_NAME`
    SET OPTIONS (
      secondary_location = SECONDARY_LOCATION);

    다음을 바꿉니다.

    • ADMIN_PROJECT_ID: 예약 리소스를 소유하는 관리 프로젝트의 프로젝트 ID입니다.
    • LOCATION: 예약 위치입니다(예: europe-west9).
    • RESERVATION_NAME: 예약 이름입니다. 이름은 소문자 또는 숫자로 시작하고 끝나야 하며 소문자, 숫자, 대시만 포함할 수 있습니다.

    • SECONDARY_LOCATION: 예약의 보조 위치입니다. 서비스 중단이 발생하면 이 예약에 연결된 모든 데이터 세트가 이 위치로 장애 조치됩니다.

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

예약에 데이터 세트 연결

이전에 만든 예약에 재해 복구를 사용 설정하려면 다음 단계를 완료합니다. 데이터 세트가 이미 예약과 동일한 기본 및 보조 리전에 복제되도록 구성되어 있어야 합니다. 자세한 내용은 리전 간 데이터 세트 복제를 참조하세요.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색 메뉴에서 용량 관리를 클릭한 다음 슬롯 예약 탭을 클릭합니다.

  3. 데이터 세트를 연결할 예약을 클릭합니다.

  4. 재해 복구 탭을 클릭합니다.

  5. 장애 조치 데이터 세트 추가를 클릭합니다.

  6. 예약과 연결할 데이터 세트의 이름을 입력합니다.

  7. 추가를 클릭합니다.

SQL

데이터 세트를 예약에 연결하려면 ALTER SCHEMA SET OPTIONS DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    ALTER SCHEMA
      `DATASET_NAME`
    SET OPTIONS (
      failover_reservation = ADMIN_PROJECT_ID.RESERVATION_NAME);

    다음을 바꿉니다.

    • DATASET_NAME: 데이터 세트의 이름

    • ADMIN_PROJECT_ID.RESERVATION_NAME: 데이터 세트를 연결할 예약의 이름

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

예약에서 데이터 세트 분리

예약을 통해 데이터 세트의 장애 조치 동작을 관리하지 않으려면 데이터 세트를 예약에서 분리합니다. 이렇게 해도 데이터 세트의 현재 기본 복제본은 변경되지 않으며 기존 데이터 세트 복제본은 삭제되지 않습니다. 데이터 세트를 분리한 후 데이터 세트 복제본을 삭제하는 방법에 관한 자세한 내용은 데이터 세트 복제본 삭제를 참조하세요.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색 메뉴에서 용량 관리를 클릭한 다음 슬롯 예약 탭을 클릭합니다.

  3. 데이터 세트를 분리하려는 예약을 클릭합니다.

  4. 재해 복구 탭을 클릭합니다.

  5. 데이터 세트의 기본 복제본에 대해 작업 옵션을 펼칩니다.

  6. 삭제를 클릭합니다.

SQL

예약에서 데이터 세트를 분리하려면 ALTER SCHEMA SET OPTIONS DDL 문을 사용합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    ALTER SCHEMA
      `DATASET_NAME`
    SET OPTIONS (
      failover_reservation = NULL);

    다음을 바꿉니다.

    • DATASET_NAME: 데이터 세트의 이름

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

장애 조치 시작

리전 서비스 중단이 발생하면 예약을 복제본에서 사용하는 위치로 수동으로 장애 조치해야 합니다. 예약 장애 조치에는 연결된 데이터 세트도 포함됩니다. 예약을 수동으로 장애 조치하려면 다음을 수행합니다.

콘솔

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 탐색 메뉴에서 재해 복구를 클릭합니다.

  3. 장애 조치할 예약의 이름을 클릭합니다.

  4. 장애 조치를 클릭합니다.

SQL

보조 위치를 예약에 추가하거나 변경하려면 ALTER RESERVATION SET OPTIONS DDL 문을 사용하고 is_primaryTRUE로 설정합니다.

  1. Google Cloud 콘솔에서 BigQuery 페이지로 이동합니다.

    BigQuery로 이동

  2. 쿼리 편집기에서 다음 문을 입력합니다.

    ALTER RESERVATION
      `ADMIN_PROJECT_ID.region-LOCATION.RESERVATION_NAME`
    SET OPTIONS (
      is_primary = TRUE);

    다음을 바꿉니다.

    • ADMIN_PROJECT_ID: 예약 리소스를 소유하는 관리 프로젝트의 프로젝트 ID입니다.
    • LOCATION: 예약 위치입니다(예: europe-west9).
    • RESERVATION_NAME: 예약 이름입니다. 이름은 소문자 또는 숫자로 시작하고 끝나야 하며 소문자, 숫자, 대시만 포함할 수 있습니다.

    • PRIMARY_STATUS: 예약이 기본 복제본인지 여부를 선언하는 불리언 상태입니다.

  3. 실행을 클릭합니다.

쿼리를 실행하는 방법에 대한 자세한 내용은 대화형 쿼리 실행을 참조하세요.

모니터링

복제본 상태를 확인하려면 INFORMATION_SCHEMA.SCHEMATA_REPLICAS를 쿼리합니다. 예를 들면 다음과 같습니다.

SELECT
  schema_name,
  replica_name,
  creation_complete,
  replica_primary_assigned,
  replica_primary_assignment_complete
FROM
  `region-LOCATION`.INFORMATION_SCHEMA.SCHEMATA_REPLICAS
WHERE
  schema_name="my_dataset"

다음 쿼리는 데이터 세트가 장애 조치 데이터 세트인 경우 실패할 수 있는 지난 7일간의 작업을 반환합니다.

WITH
  non_epe_reservations AS (
    SELECT project_id, reservation_name
    FROM `PROJECT_ID.region-LOCATION`.INFORMATION_SCHEMA.RESERVATIONS
    WHERE edition != 'ENTERPRISE_PLUS'
  )
SELECT *
FROM
  (
    SELECT job_id
    FROM
      (
        SELECT
          job_id,
          reservation_id,
          ARRAY_CONCAT(referenced_tables, [destination_table]) AS all_referenced_tables,
          query
        FROM
          `PROJECT_ID.region-LOCATION`.INFORMATION_SCHEMA.JOBS
        WHERE
          creation_time
          BETWEEN TIMESTAMP_SUB(CURRENT_TIMESTAMP(), INTERVAL 7 DAY)
          AND CURRENT_TIMESTAMP()
      ) A,
      UNNEST(all_referenced_tables) AS referenced_table
  ) jobs
LEFT OUTER JOIN non_epe_reservations
  ON (
    jobs.reservation_id = CONCAT(
      non_epe_reservations.project_id, ':', 'LOCATION', '.', non_epe_reservations.reservation_name))
WHERE
  CONCAT(jobs.project_id, ':', jobs.dataset_id)
  IN UNNEST(
    [
      'PROJECT_ID:DATASET_ID',
      'PROJECT_ID:DATASET_ID']);

다음을 바꿉니다.

  • PROJECT_ID: 프로젝트 ID
  • DATASET_ID: 데이터 세트 ID
  • LOCATION: 위치

다음 단계