Despliegue multirregional en GKE y GKE On-Prem

En este tema se describe un despliegue multirregional de Apigee hybrid en GKE y Anthos GKE desplegado on-prem.

Las topologías de implementación multirregional incluyen las siguientes:

  • Activo-activo: cuando tienes aplicaciones implementadas en varias ubicaciones geográficas y necesitas una respuesta de API de baja latencia para tus implementaciones. Tiene la opción de implementar una solución híbrida en varias ubicaciones geográficas cercanas a sus clientes. Por ejemplo: costa oeste de EE. UU., costa este de EE. UU., Europa o Asia-Pacífico.
  • Activo-Pasivo: cuando tienes una región principal y una región de conmutación por error o de recuperación tras desastres.

Las regiones de una implementación híbrida multirregional se comunican a través de Cassandra, como se muestra en la siguiente imagen:

Balancear la carga de la conexión MART

Cada clúster regional debe tener su propia dirección IP y nombre de host de MART. Sin embargo, solo tienes que conectar el plano de gestión a uno de ellos. Cassandra propaga la información a todos los clústeres. La mejor opción para conseguir una alta disponibilidad de MART es balancear la carga de las direcciones IP de MART individuales y configurar tu organización para que se comunique con la URL de MART con balanceo de carga.

Requisitos previos

Antes de configurar la opción híbrida para varias regiones, debes cumplir los siguientes requisitos:

  • Configurar clústeres de Kubernetes en varias regiones con diferentes bloques CIDR
  • Configurar la comunicación entre regiones
  • Requisitos de Cassandra multirregión:
    • Asegúrate de que el espacio de nombres de la red de pods tenga conectividad en todas las regiones, incluidos los cortafuegos, la VPN, el emparejamiento de VPCs y el emparejamiento de VNet. Este es el caso de la mayoría de las instalaciones de GKE.
    • Si el espacio de nombres de la red de pods no tiene conectividad entre pods de diferentes clústeres (por ejemplo, si los clústeres se ejecutan en el modo de red aislada en las instalaciones locales de GKE), habilita la función hostNetwork de Kubernetes definiendo cassandra.hostNetwork: true en el archivo de anulaciones de todas las regiones de tu instalación multirregión híbrida de Apigee.

      Para obtener información sobre la función hostNetwork de Kubernetes, consulta la sección Espacios de nombres de host de la documentación de Kubernetes.

    • Habilita hostNetwork en los clústeres que ya tengas antes de ampliar tu configuración multirregional a otras regiones.
    • Cuando hostNetwork esté habilitado, asegúrate de que los nodos de trabajo puedan realizar peticiones de DNS invertidas. Apigee Cassandra usa tanto la petición de DNS directa como la inversa para obtener la IP del host al iniciarse.
    • Abre los puertos 7000 y 7001 de Cassandra entre los clústeres de Kubernetes de todas las regiones para que los nodos de trabajador de las regiones y los centros de datos puedan comunicarse. Consulta Configurar puertos.

Para obtener información detallada, consulta la documentación de Kubernetes.

Configurar el host de seed multirregional

En esta sección se describe cómo ampliar el clúster de Cassandra a una nueva región. Esta configuración permite que la nueva región arranque el clúster y se una al centro de datos. Sin esta configuración, los clústeres de Kubernetes multirregionales no se reconocerían entre sí.

  1. Ejecuta el siguiente comando kubectl para identificar una dirección de host de inicialización de Cassandra en la región actual.

    Una dirección de host de inicialización permite que una nueva instancia regional encuentre el clúster original en el primer inicio para conocer la topología del clúster. La dirección del host de inicio se designa como punto de contacto del clúster.

    kubectl get pods -o wide -n apigee
    
    NAME                      READY   STATUS      RESTARTS   AGE   IP          NODE                                          NOMINATED NODE
    apigee-cassandra-default-0        1/1     Running     0          5d    10.0.0.11   gke-k8s-dc-2-default-pool-a2206492-p55d
    apigee-cassandra-default-1        1/1     Running     0          5d    10.0.2.4    gke-k8s-dc-2-default-pool-e9daaab3-tjmz
    apigee-cassandra-default-2        1/1     Running     0          5d    10.0.3.5    gke-k8s-dc-2-default-pool-e589awq3-kjch
  2. Decide cuál de las IPs devueltas por el comando anterior será el host de seed multirregión.
  3. La configuración de este paso depende de si usas GKE o GKE On-Prem:

    Solo en GKE: En el centro de datos 2, configure cassandra.multiRegionSeedHost y cassandra.datacenter en Gestionar componentes del plano de tiempo de ejecución, donde multiRegionSeedHost es una de las IPs devueltas por el comando anterior:

    cassandra:
      multiRegionSeedHost: seed_host_IP
      datacenter: data_center_name
      rack: rack_name
      hostNetwork: false # Set this to true for Non GKE platforms.

    Por ejemplo:

    cassandra:
      multiRegionSeedHost: 10.0.0.11
      datacenter: "dc-2"
      rack: "ra-1"
      hostNetwork: false

    Solo GKE On-Prem: En el centro de datos 2, configura cassandra.multiRegionSeedHost en el archivo de anulaciones, donde multiRegionSeedHost es una de las IPs devueltas por el comando anterior:

    cassandra:
      hostNetwork: true
      multiRegionSeedHost: seed_host_IP
      datacenter: data_center_name
    

    Por ejemplo:

    cassandra:
      hostNetwork: true
      multiRegionSeedHost: 10.0.0.11
      datacenter: "dc-2"
    
  4. En el nuevo centro de datos o región, antes de instalar la opción híbrida, define los mismos certificados TLS y las mismas credenciales en overrides.yaml que en la primera región.

Configurar la nueva región

Una vez que hayas configurado el host de origen, podrás configurar la nueva región.

Para configurar la nueva región, sigue estos pasos:

  1. Copia el certificado del clúster actual al nuevo. La nueva raíz de CA la usan Cassandra y otros componentes híbridos para mTLS. Por lo tanto, es fundamental que los certificados del clúster sean coherentes.
    1. Define el contexto en el espacio de nombres original:
      kubectl config use-context original-cluster-name
    2. Exporta la configuración del espacio de nombres actual a un archivo:
      kubectl get namespace namespace -o yaml > apigee-namespace.yaml
    3. Exporta el secreto de apigee-ca a un archivo:
      kubectl -n cert-manager get secret apigee-ca -o yaml > apigee-ca.yaml
    4. Define el contexto con el nombre del clúster de la nueva región:
      kubectl config use-context new-cluster-name
    5. Importa la configuración del espacio de nombres al nuevo clúster. Asegúrate de actualizar el "namespace" del archivo si usas otro en la nueva región:
      kubectl apply -f apigee-namespace.yaml
    6. Importa el secreto al nuevo clúster:

      kubectl -n cert-manager apply -f apigee-ca.yaml
  2. Instala la versión híbrida en la nueva región. Asegúrate de que el archivo overrides-DC_name.yaml incluya los mismos certificados TLS que se hayan configurado en la primera región, tal como se explica en la sección anterior.

    Ejecuta los dos comandos siguientes para instalar Hybrid en la nueva región:

    apigeectl init -f overrides/overrides-DC_name.yaml
    apigeectl apply -f overrides/overrides-DC_name.yaml
  3. Para comprobar que la instalación híbrida se ha realizado correctamente, ejecuta el siguiente comando:
    apigeectl check-ready -f overrides_your_cluster_name.yaml
  4. Verifica la configuración del clúster de Cassandra ejecutando el siguiente comando. La salida debería mostrar tanto los centros de datos actuales como los nuevos.
    kubectl exec apigee-cassandra-default-0 -n apigee  \
      -- nodetool -u JMX_user -pw JMX_password status

    Ejemplo de configuración correcta:

    Datacenter: dc-1
    ====================
    Status=Up/Down
    |/ State=Normal/Leaving/Joining/Moving
    --  Address        Load       Tokens  Owns  Host ID                               Rack
    UN  10.132.87.93   68.07 GiB  256     ?     fb51465c-167a-42f7-98c9-b6eba1de34de  c
    UN  10.132.84.94   69.9 GiB   256     ?     f621a5ac-e7ee-48a9-9a14-73d69477c642  b
    UN  10.132.84.105  76.95 GiB  256     ?     0561086f-e95b-4232-ba6c-ad519ff30336  d
    
    Datacenter: dc-2
    ====================
    Status=Up/Down
    |/ State=Normal/Leaving/Joining/Moving
    --  Address        Load       Tokens  Owns  Host ID                               Rack
    UN  10.132.0.8     71.61 GiB  256     ?     8894a98b-8406-45de-99e2-f404ab10b5d6  c
    UN  10.132.9.204   75.1 GiB   256     ?     afa0ffa3-630b-4f1e-b46f-fc3df988092e  a
    UN  10.132.3.133   68.08 GiB  256     ?     25ae39ab-b39e-4d4f-9cb7-de095ab873db  b
  5. Configura Cassandra en todos los pods de los nuevos centros de datos.
    1. Obtén apigeeorg del clúster con el siguiente comando:
      kubectl get apigeeorg -n apigee -o json | jq .items[].metadata.name
      

      Por ejemplo:

      Ex: kubectl get apigeeorg -n apigee -o json | jq .items[].metadata.name
      "rg-hybrid-b7d3b9c"
      
    2. Crea un archivo de recurso personalizado de replicación de datos de Cassandra (YAML). El archivo puede tener cualquier nombre. En los siguientes ejemplos, el archivo se llamará datareplication.yaml.

      El archivo debe contener lo siguiente:

      apiVersion: apigee.cloud.google.com/v1alpha1
      kind: CassandraDataReplication
      metadata:
        name: REGION_EXPANSION
        namespace: NAMESPACE
      spec:
        organizationRef: APIGEEORG_VALUE
        force: false
        source:
          region: SOURCE_REGION

      Donde:

      • REGION_EXPANSION es el nombre que le asignas a estos metadatos. Puedes usar el nombre que quieras.
      • NAMESPACE es el mismo espacio de nombres que se proporciona en overrides.yaml. Normalmente es "apigee".
      • APIGEEORG_VALUE es el valor que se obtiene del comando kubectl get apigeeorg -n apigee -o json | jq .items[].metadata.name del paso anterior. Por ejemplo, rg-hybrid-b7d3b9c
      • SOURCE_REGION es el nombre del centro de datos de la región de origen. Es el valor definido para cassandra:datacenter: en su overrides.yaml.

      Por ejemplo:

      apiVersion: apigee.cloud.google.com/v1alpha1
      kind: CassandraDataReplication
      metadata:
        name: region-expansion
        namespace: apigee
      spec:
        organizationRef: rg-hybrid-b7d3b9c
        force: false
        source:
          region: "dc-1"
    3. Aplica el comando CassandraDataReplication con el siguiente comando:
      kubectl apply -f datareplication.yaml
    4. Verifica el estado de la recompilación con el siguiente comando.
      kubectl -n apigee get apigeeds -o json | jq .items[].status.cassandraDataReplication

      Los resultados deberían ser similares a los siguientes:

      {
        "rebuildDetails": {
          "apigee-cassandra-default-0": {
            "state": "complete",
            "updated": 1623105760
          },
          "apigee-cassandra-default-1": {
            "state": "complete",
            "updated": 1623105765
          },
          "apigee-cassandra-default-2": {
            "state": "complete",
            "updated": 1623105770
          }
        },
        "state": "complete",
        "updated": 1623105770
      }
  6. Verifica los procesos de recompilación en los registros. Además, compruebe el tamaño de los datos con el comando nodetool status:
    kubectl logs apigee-cassandra-default-0 -f -n apigee
    kubectl exec apigee-cassandra-default-0 -n apigee  -- nodetool -u JMX_user -pw JMX_password status

    En el siguiente ejemplo se muestran entradas de registro de ejemplo:

    INFO  01:42:24 rebuild from dc: dc-1, (All keyspaces), (All tokens)
    INFO  01:42:24 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Executing streaming plan for Rebuild
    INFO  01:42:24 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Starting streaming to /10.12.1.45
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889, ID#0] Beginning stream session with /10.12.1.45
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Starting streaming to /10.12.4.36
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889 ID#0] Prepare completed. Receiving 1 files(0.432KiB), sending 0 files(0.000KiB)
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Session with /10.12.1.45 is complete
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889, ID#0] Beginning stream session with /10.12.4.36
    INFO  01:42:25 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Starting streaming to /10.12.5.22
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889 ID#0] Prepare completed. Receiving 1 files(0.693KiB), sending 0 files(0.000KiB)
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Session with /10.12.4.36 is complete
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889, ID#0] Beginning stream session with /10.12.5.22
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889 ID#0] Prepare completed. Receiving 3 files(0.720KiB), sending 0 files(0.000KiB)
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] Session with /10.12.5.22 is complete
    INFO  01:42:26 [Stream #3a04e810-580d-11e9-a5aa-67071bf82889] All sessions completed
  7. Actualiza los hosts de inicialización. Quita multiRegionSeedHost: 10.0.0.11 de overrides-DC_name.yaml y vuelve a aplicarlo.
    apigeectl apply -f overrides/overrides-DC_name.yaml

Comprobar el estado del clúster de Cassandra

El siguiente comando es útil para comprobar si la configuración del clúster se ha realizado correctamente en dos centros de datos. El comando comprueba el estado de nodetool de las dos regiones.

kubectl exec apigee-cassandra-default-0 -n apigee  -- nodetool -u JMX_user -pw JMX_password status


Datacenter: dc-1
================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address     Load       Tokens       Owns (effective)  Host ID                               Rack
UN  10.12.1.45  112.09 KiB  256          100.0%            3c98c816-3f4d-48f0-9717-03d0c998637f  ra-1
UN  10.12.4.36  95.27 KiB  256          100.0%            0a36383d-1d9e-41e2-924c-7b62be12d6cc  ra-1
UN  10.12.5.22  88.7 KiB   256          100.0%            3561f4fa-af3d-4ea4-93b2-79ac7e938201  ra-1
Datacenter: dc-2
================
Status=Up/Down
|/ State=Normal/Leaving/Joining/Moving
--  Address     Load       Tokens       Owns (effective)  Host ID                               Rack
UN  10.0.4.33   78.69 KiB  256          0.0%              a200217d-260b-45cd-b83c-182b27ff4c99  ra-1
UN  10.0.0.21   78.68 KiB  256          0.0%              9f3364b9-a7a1-409c-9356-b7d1d312e52b  ra-1
UN  10.0.1.26   15.46 KiB  256          0.0%              1666df0f-702e-4c5b-8b6e-086d0f2e47fa  ra-1

Solución de problemas

Consulta Error de replicación de datos de Cassandra.