针对高度弹性环境执行故障切换测试

Cloud Composer 3 | Cloud Composer 2 | Cloud Composer 1

本页介绍了如何针对高度弹性(高可用性)环境执行数据库故障切换测试。

环境的故障切换测试会模拟数据中心内某个可用区的完全中断。在这种情况下,数据库可能会发生可用区服务中断。通过执行故障切换测试,您可以监控高弹性环境如何执行故障切换,并检查这会如何影响您的 DAG 和任务。

准备工作

  • 如需执行故障切换测试,您的 Google 账号必须拥有以下角色和权限:

  • 在 Cloud Composer 3 中,环境的集群位于环境的租户项目中,无法模拟可用区级服务中断。

检查环境是否正常运行

请务必仅在健康的环境中执行故障切换测试。如需检查环境是否运行正常,请执行以下操作:

  1. 在 Google Cloud 控制台中,前往环境页面。

    转到“环境”

  2. 在环境列表中,点击您的环境名称。环境详情页面会打开。

  3. 转到监控标签页。

  4. 确保所有健康指标均为绿色。

执行数据库故障切换测试

您可以通过使用 Google Cloud CLI 命令触发数据库故障切换测试来模拟地区级中断。例如,您可能希望通过此操作来衡量环境的数据库切换到另一可用区所需的时间。

如需为您的环境执行数据库故障切换测试,请执行以下操作:

  1. 确保环境运行状况良好

  2. 获取环境数据库的主可用区:

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    替换以下内容:

    • ENVIRONMENT_NAME:Cloud Composer 环境的名称。
    • LOCATION:环境所在的区域。

    示例:

    gcloud composer environments fetch-database-properties \
        example-environment \
        --location us-central1
    
  3. 启动数据库故障切换测试:

    gcloud composer environments database-failover \
        ENVIRONMENT_NAME \
        --location LOCATION
    

    替换以下内容:

    • ENVIRONMENT_NAME:Cloud Composer 环境的名称。
    • LOCATION:环境所在的区域。

    示例:

    gcloud composer environments database-failover \
        example-environment \
        --location us-central1
    
  4. 等待数据库故障切换测试完成。此过程最多可能需要 3 分钟。

  5. 检查环境数据库的主区域是否已更改:

    gcloud composer environments fetch-database-properties \
        ENVIRONMENT_NAME \
        --location LOCATION
    
  6. 检查环境的健康指标,确保环境运行状况良好

  7. 可用于故障切换的数据库 (composer.googleapis.com/environment/database/available_for_failover) 环境指标变为 True 时,您环境的数据库即可用于另一次故障切换。如需详细了解如何在 Cloud Monitoring 中查看环境的指标,请参阅监控环境

后续步骤