维护概览

AlloyDB 集群和实例依赖于许多内部低级Google Cloud 资源。这些资源包括充当 AlloyDB 节点和负载平衡器的虚拟机 (VM) 实例,以及用于存储数据的存储卷。由于 AlloyDB 是一项托管式服务,因此 Google 会负责让这些内部资源保持最新状态。这有助于确保您的 AlloyDB 集群和实例保持可靠、高性能和安全。

这些更新大多不需要停机,但某些系统更新需要短暂中断服务。我们将这些更新称为维护。 由于这些更新需要重启受影响的节点,因此可能会导致停机。

AlloyDB 的非中断性维护操作可将主实例和辅助实例的停机时间限制在不到 1 秒,并将读取池的停机时间限制为零秒。通过准备包含更新的替换服务器,然后在之后切换数据库服务器,即可实现近乎零停机时间和零停机时间。如日志所示,操作时间长于停机时间。

维护原因

维护更新可能出于以下原因:

  • 新的 AlloyDB 功能。为了推出新功能,Google 需要更新集群中节点上运行的 AlloyDB 软件。这可能还涉及更新 AlloyDB 随附的 PostgreSQL 扩展程序,或安装新的扩展程序。

  • 数据库兼容性升级。PostgreSQL 社区会定期发布受支持的 PostgreSQL 主要版本的次要版本更新。Google 会将这些更新纳入 AlloyDB,并将其应用于配置为与受影响的主要版本兼容的集群。如需了解详情,请参阅数据库版本政策

  • 操作系统补丁。Google 会持续监控构成 AlloyDB 集群的内部资源上运行的操作系统中的安全漏洞。发现漏洞后,我们会修补资源的操作系统,以防范新风险。

维护时间和维护偏好设置

您可以为主 AlloyDB 集群和次 AlloyDB 集群设置维护期。默认情况下,AlloyDB 集群未设置维护窗口。对于未配置维护窗口的 AlloyDB 集群,非紧急维护可以在任何时间进行,但工作日当地时间上午 6 点到晚上 10 点之间除外。

您还可以指定维护窗口。 维护窗口用于定义集群开始执行维护事件的首选维护时间(以一天中的小时和一周中的天数表示)。例如,您可以将集群设置为在周日 11:00(世界协调时间)开始维护窗口。

如果您设置了维护窗口,AlloyDB 会安排未来的非紧急维护事件在指定时间后不超过一小时的时间开始。此外,如果您选择接收有关即将进行的 AlloyDB 维护事件的电子邮件通知,那么系统会在维护事件安排好后立即自动向您发送通知。维护事件至少会提前一周安排。

您无法设置维护窗口的结束时间,因为单个维护事件所需的总时间可能会因集群的复杂性(即需要更新的读取池实例的数量)和更新的性质而异。虽然任何单个实例所需的停机时间可能非常短暂,但整个维护过程可能需要数小时。因此,您可以使用维护窗口来控制集群实例发生维护停机的大致时间,但无法为任何实例指定精确到分钟的停机窗口。

紧急维护事件(例如应用紧急安全补丁)可能会在默认维护时间或配置的维护窗口之外发生,包括在拒绝维护期内。

维护窗口最佳实践

我们建议您在生产集群上设置维护窗口,但不要在非生产集群上设置维护窗口。这是因为维护更新前后会发生以下大致顺序的事件:

  1. 首先,Google 会更新所有未设置维护窗口的集群。
  2. 接下来,Google 会为所有设置了维护时段的集群安排更新。这些更新至少提前一周发布。
  3. 如果您已选择接收有关即将进行的 AlloyDB 维护活动的通知,则 Google 会通过电子邮件向您发送有关已安排的维护的通知。
  4. Google 会在预定时间执行维护更新。

因此,收到即将进行维护的通知也意味着,所有未设置维护窗口的集群都已应用相同的更新。如果您为非生产集群设置了维护窗口,则可以确保这些集群率先接收系统更新,并且您可以将即将进行的维护通知用作提示,以便在非生产环境中测试或预览更新。

后续步骤