Programar copias de seguridad en Cloud Storage

En esta página se describe cómo programar copias de seguridad de Cassandra en Cloud Storage. En este método, las copias de seguridad se almacenan en el segmento de Cloud Storage especificado.

Para programar copias de seguridad de Cassandra, sigue estos pasos:

  1. Ejecuta el siguiente comando create-service-account para crear una cuenta de servicio (SA) de Google Cloud con el rol estándar roles/storage.objectAdmin. Este rol de SA te permite escribir datos de copias de seguridad en Cloud Storage. Ejecuta el siguiente comando en el directorio hybrid-base-directory/hybrid-files:
    ./tools/create-service-account --env non-prod --dir ./service-accounts
    Este comando crea una cuenta de servicio llamada apigee-non-prod para usarla en entornos que no son de producción y coloca el archivo de claves descargado en el directorio ./service-accounts. Para obtener más información sobre las cuentas de servicio de Google Cloud, consulta el artículo sobre cómo crear y gestionar cuentas de servicio.
  2. El comando create-service-account guarda un archivo JSON que contiene la clave privada de la cuenta de servicio. El archivo se guarda en el mismo directorio en el que se ejecuta el comando. Necesitarás la ruta a este archivo en los siguientes pasos.
  3. Crea un segmento de Cloud Storage. Especifica una política de conservación de datos razonable para el segmento. Apigee recomienda una política de conservación de datos de 15 días.
  4. Abre el archivo overrides.yaml.
  5. Añade las siguientes propiedades de cassandra.backup para habilitar la copia de seguridad. No elimine ninguna de las propiedades que ya estén configuradas.

    Parámetros

    cassandra:
      ...
    
      backup:
        enabled: true
        serviceAccountPath: SA_JSON_FILE_PATH
        dbStorageBucket: CLOUD_STORAGE_BUCKET_PATH
        schedule: BACKUP_SCHEDULE_CODE
        cloudProvider: "GCP"  # For remote server backup set this to HYBRID (all caps)
    
      ...
      

    Ejemplo

    ...
    
    cassandra:
      storage:
        type: gcepd
        capacity: 50Gi
        gcepd:
          replicationType: regional-pd
      auth:
        default:
          password: "abc123"
        admin:
          password: "abc234"
        ddl:
          password: "abc345"
        dml:
          password: "abc456"
      nodeSelector:
        key: cloud.google.com/gke-nodepool
        value: apigee-data
      backup:
        enabled: true
        serviceAccountPath: "/Users/myhome/.ssh/my-cassandra-backup-sa.json"
        dbStorageBucket: "gs://myname-cassandra-backup"
        schedule: "45 23 * * 6"
        cloudProvider: "GCP"
        
    
    
      ... 
  6. Donde:
    Propiedad Descripción
    backup:enabled La copia de seguridad está inhabilitada de forma predeterminada. Debe asignar el valor true a esta propiedad.
    backup:serviceAccountPath

    SA_JSON_FILE_PATH

    La ruta del archivo JSON de la cuenta de servicio en tu sistema de archivos. Este archivo se descargó cuando ejecutaste el comando ./tools/create-service-account.

    También puedes proporcionar una ruta de archivo relativa. La ruta será relativa al directorio hybrid-base-directory/hybrid-files.

    backup:dbStorageBucket

    CLOUD_STORAGE_BUCKET_PATH

    La ruta del segmento de Cloud Storage con este formato: gs://BUCKET_NAME. El campo gs:// es obligatorio.

    backup:cloudProvider

    GCP/HYBRID

    Para una copia de seguridad de Cloud Storage, asigna el valor GCP a la propiedad. Por ejemplo, cloudProvider: "GCP".

    Para crear una copia de seguridad de un servidor remoto, asigna el valor HYBRID a la propiedad. Por ejemplo, cloudProvider: "HYBRID".

    backup:schedule

    BACKUP_SCHEDULE_CODE

    Hora en la que se inicia la copia de seguridad, especificada en la sintaxis estándar de crontab. Predeterminado: 0 2 * * *

  7. Aplica los cambios de configuración al nuevo clúster. Por ejemplo:
    $APIGEECTL_HOME/apigeectl apply --datastore -f YOUR_OVERRIDES_FILE

    Donde YOUR_OVERRIDES_FILE es la ruta del archivo de anulaciones que acabas de editar.

  8. Verifica el trabajo de copia de seguridad. Por ejemplo:
    kubectl get cronjob -n apigee
    NAME                      SCHEDULE     SUSPEND   ACTIVE   LAST SCHEDULE   AGE
    apigee-cassandra-backup   33 * * * *   False     0        <none>          94s