本页介绍了 Memorystore for Redis 的集群架构如何支持和提供高可用性 (HA)。本页面还介绍了有助于提升实例性能和稳定性的推荐配置。
高可用性
Memorystore for Valkey 基于高可用性架构构建,客户端可直接访问托管的 Memorystore for Valkey 虚拟机。客户端通过连接到各个分片网络地址来实现此目的,如连接到 Memorystore for Valkey 实例中所述。
直接连接到分片具有以下优势:
由于每个分片都设计为独立故障,因此直接连接可避免任何单点故障。例如,如果来自多个客户端的流量使某个槽(键空间分块)过载,则分片故障会限制对负责处理该槽的分片的影响。
直接连接可避免中间跃点,从而最大限度地缩短客户端与 Valkey 虚拟机之间的往返时间(客户端延迟时间)。
建议的配置
我们建议您创建高可用性多可用区实例,而不是单可用区实例,因为它们的可靠性更高。不过,如果您选择预配不含副本的实例,我们建议您选择单可用区实例。如需了解详情,请参阅如果您的实例不使用副本,请选择单可用区实例。
如需为实例启用高可用性,您必须为每个分片预配至少 1 个副本节点。您可以在创建实例时执行此操作,也可以扩缩副本数量,使每个分片至少有 1 个副本。副本会在计划内维护和意外分片故障期间提供自动故障切换。
您应根据客户端最佳实践中的指南配置客户端。通过采用建议的最佳实践,您的客户端可以自动且妥善地处理实例的角色(自动故障切换)和槽分配更改(节点替换、使用方扩容/缩容),而不会出现任何停机时间。
副本
高可用 Memorystore for Valkey 实例是一种区域级资源。这意味着,分片的主虚拟机和副本虚拟机会分布在多个可用区,以防范可用区服务中断。Memorystore for Valkey 支持每个节点有 0、1 或 2 个副本的实例。
您可以使用副本通过伸缩读取来提高读取吞吐量。为此,您必须使用 READONLY
命令建立连接,以允许客户端从副本读取数据。
每个节点有 0 个副本的实例形状
每个节点 1 个副本的实例规格
每个节点有 2 个副本的实例形状
自动故障切换
分片中的自动故障转移可能会因维护或主节点意外故障而发生。在故障切换期间,副本会被提升为主副本。您可以明确配置副本。该服务还可以在内部维护期间暂时预配额外的副本,以避免任何停机时间。
自动故障切换可防止在维护更新期间丢失数据。如需详细了解维护期间的自动故障切换行为,请参阅维护期间的自动故障切换行为。
故障切换和节点修复时长
对于非预期事件(例如主节点进程崩溃或硬件故障),自动故障切换可能需要几十秒的时间。在此期间,系统会检测故障,并选择一个副本作为新的主副本。
服务替换失败的节点可能需要几分钟的时间,因此节点修复可能需要一些时间。所有主节点和副本节点都是如此。对于非高可用性实例(未预配副本),修复故障的主节点也需要几分钟的时间。
非计划性故障切换期间的客户端行为
客户端连接可能会重置,具体取决于失败的性质。自动恢复后,应使用指数退避算法重试连接,以避免主节点和副本节点过载。
使用副本来提高读取吞吐量的客户端应做好准备,以应对容量暂时下降的情况,直到系统自动替换失败的节点。
丢失的写入
在因意外故障而发生的故障切换期间,由于 Valkey 复制协议的异步特性,已确认的写入可能会丢失。
客户端应用可以利用 Valkey WAIT 命令来提高实际数据安全性。