關於同步磁碟複製


區域永久磁碟和 Hyperdisk 平衡高可用性是儲存空間選項,可讓您在 Compute Engine 中實作高可用性 (HA) 服務。地區永久磁碟和 Hyperdisk 平衡高可用性可在同一地區的兩個區域之間同步複製資料,並確保磁碟資料的 HA 可達到一個區域故障。

地區永久磁碟和 Hyperdisk 平衡高可用性磁碟區,適用於需要較低復原點目標 (RPO) 和復原時間目標 (RTO) 的工作負載。如要進一步瞭解 RPO 和 RTO,請參閱「災難復原規劃的基礎知識」。

地區性永久磁碟和 Hyperdisk 平衡高可用性磁碟區在設計上可搭配地區性代管執行個體群組使用。

本文將概略說明如何使用地區永久磁碟和 Hyperdisk 已平衡的高可用性磁碟區建構高可用性服務。

決定使用 區域性永久磁碟或 Hyperdisk Balanced High Availability 時,請務必比較各種提高服務可用性的選項,以及不同服務架構的費用、效能和彈性

關於同步磁碟複製

區域性永久磁碟或 Hyperdisk 平衡高可用性磁碟區,也稱為區域磁碟或同步複製磁碟,在其所在區域中設有主要和次要可用區,用於儲存磁碟資料:

  • 主要區域是指您要將磁碟連結到的運算執行個體所在的區域。
  • 「次要可用區」是指您在同一個區域內選擇的替代可用區。

Compute Engine 會在這兩個可用區中維護磁碟的副本。當您將資料寫入磁碟時,Compute Engine 會同步將該資料複製到兩個區域的磁碟備援機制,確保高可用性。各區域備援資源的資料分佈於區域中的多台實體機器,以確保耐用性。區域備份可確保磁碟的資料可供使用,並提供保護措施,避免某個磁碟區域發生暫時性中斷。

區域備用資源的備用資源狀態

區域性永久磁碟或 Hyperdisk 平衡高可用性磁碟的磁碟複本狀態,會顯示可用區複本的狀態,並與磁碟內容進行比較。磁碟的可用區備用資源一律處於下列磁碟備用資源狀態之一:

  • 已同步:備用資源可供使用,同步接收對磁碟執行的所有寫入作業,且處於最新狀態,磁碟已收到的所有資料。
  • 同步中:副本可供使用,但仍在與其他副本同步處理磁碟上的資料。
  • 不同步:備份檔案暫時無法使用,且與磁碟上的資料不同步。

如要瞭解如何檢查及追蹤區域備份資源的備份狀態,請參閱「監控磁碟備份資源狀態」。

區域磁碟的複製狀態

視個別區域備用資源的狀態而定,區域性永久磁碟或 Hyperdisk 平衡高可用性磁碟分割區可能處於下列其中一種複製狀態:

  • 已完全複製:兩個可用區的備援資源皆可使用,且已與最新的磁碟資料同步。
  • 同步中:可用區副本可供使用,但其中一個可用區副本正在同步最新的磁碟資料。
  • 降級:由於故障或中斷,其中一個區域副本的狀態為 out of sync

如果磁碟複製狀態為 catching updegraded,則其中一個可用區備用資源未更新所有資料。在此期間,如果健康副本區域發生任何中斷,磁碟就會無法使用,直到健康副本區域恢復為止。

當 地區性永久磁碟或 Hyperdisk 平衡高可用性磁碟區正在進行追趕時,Google Cloud 就會開始修復正在追趕的區域副本。Google 建議您等待受影響的區域副本追上磁碟上的資料,屆時副本狀態會變更為 Synced。區域副本移至已同步狀態後,區域磁碟狀態會變更回 Fully replicated 狀態。

如果區域磁碟的狀態長時間為 catching updegraded,且不符合貴機構的 RPO 需求,建議您透過下列任一方式為主要複本建立快照:

  • 啟用排定的快照。
  • 為區域性永久磁碟或 Hyperdisk 平衡高可用性磁碟建立手動快照。

建立快照後,您可以使用該快照做為來源,建立新的地區永久磁碟或 Hyperdisk 平衡高可用性磁碟。這樣就能將快照還原至新磁碟。新的磁碟也會在已完整複製的狀態下啟動,並且資料複製正常。

如要瞭解如何檢查地區永久磁碟或 Hyperdisk 平衡高可用性磁碟的複寫狀態,請參閱「判斷磁碟的複寫狀態」。

複本復原查核點

備份復原查核點是磁碟屬性,代表完整複製磁碟的最近異常狀況一致時間點。Compute Engine 會為每個地區磁碟自動建立及維護單一備份復原檢查點。磁碟完全複製後,Compute Engine 會大約每 10 分鐘重新整理一次檢查點,確保檢查點保持更新狀態。當磁碟複製狀態為 degraded 時,Compute Engine 會允許您從該磁碟的複本復原檢查點建立標準快照。產生的標準快照會擷取完整複寫磁碟的最新且與當機相容的版本資料。

在極少數情況下,當磁碟降級時,與最新磁碟資料同步的區域備用資源也可能在非同步備用資源趕上之前失敗。您無法將磁碟強制連結至任一區域中的運算執行個體。複本磁碟將無法使用,您必須將資料遷移至新的磁碟。在這種情況下,如果您沒有任何可用於磁碟的現有標準快照,您還是可以使用從複本復原檢查點建立的標準快照,從不完整的複本復原磁碟資料。

Compute Engine 會為每個已掛載的 地區永久磁碟或 Hyperdisk 平衡高可用性磁碟,自動建立複本復原檢查點。您不會因建立這些檢查點而產生額外費用。不過,如果您使用這些檢查點將地區磁碟遷移至運作中的區域,則會產生建立快照和運算執行個體的適用儲存空間費用。

進一步瞭解如何使用備援復原檢查點復原區域性磁碟資料

區域性磁碟容錯移轉

如果某個區域發生中斷,該區域將無法存取,且該區域中的運算執行個體無法在磁碟上執行讀取或寫入作業。為了讓執行個體繼續執行區域磁碟的讀取和寫入作業,Compute Engine 允許將磁碟資料遷移至磁碟有副本的其他區域。這項程序稱為容錯移轉

容錯移轉程序包括將區域備用資源從受影響區域的執行個體中分離,然後將區域備用資源連結至次要區域中的新執行個體。Compute Engine 會同步複製磁碟上的資料至次要區域,以便在單一備援機制發生故障時,快速進行容錯移轉。

依應用程式專用區域控制層容錯移轉

應用程式專用的區域控制層並非 Google Cloud 服務。設計 HA 服務架構時,您必須自行建構應用程式專屬的區域控制層。這個應用程式控制平面會決定哪些執行個體必須附加區域磁碟,以及哪些執行個體是目前的主要執行個體。

當地區磁碟的主要執行個體或資料庫中偵測到故障時,HA 服務架構的應用程式專屬地區控制層即可自動啟動容錯移轉至次要區域的待命執行個體。在容錯移轉期間,應用程式專屬的地區控制層會將地區磁碟重新附加至次要區域中的待命執行個體。接著,Compute Engine 會根據健康狀態檢查訊號,將所有流量導向該執行個體。

整體容錯移轉延遲 (排除故障偵測時間) 是下列延遲的總和:

  • 將地區磁碟連接至待命執行個體的時間不到 1 分鐘
  • 應用程式初始化和當機救援所需的時間

詳情請參閱「瞭解應用程式專屬區域控制層」。

災難復原的構成要素」頁面說明 Compute Engine 提供的構成要素。

強制連接的容錯移轉

地區永久磁碟和 Hyperdisk 平衡高可用性功能的其中一個優點是,在區域服務中斷的情況下,您可以手動將工作負載容錯移轉至其他區域。當原始區域發生停機時,您必須等到該區域備援機制恢復,才能完成磁碟卸載作業。在這種情況下,您可能需要將次要區域備用資源連結至新的運算執行個體,但不從主要執行個體中卸除主要區域備用資源。這項程序稱為「強制附加」

當主要區域中的運算執行個體無法使用時,您可以將磁碟強制連接至次要區域中的執行個體。如要執行這項工作,您必須採取下列任一做法:

  • 在與強制附加的地區磁碟副本相同的區域中啟動其他運算執行個體。
  • 在該區域中維護熱待命運算執行個體。熱待命是指與主要區域相同的執行中執行個體。這兩個執行個體具有相同的資料。

Compute Engine 會在一分鐘內執行強制連接作業。總復原時間目標 (RTO) 不僅取決於儲存空間容錯 (強制連結區域磁碟),還取決於其他因素,包括:

  • 是否必須先建立次要執行個體
  • 基礎檔案系統偵測熱連結磁碟所需的時間長度
  • 對應應用程式的復原時間

如要進一步瞭解如何使用強制連接功能將運算執行個體切換至備援機制,請參閱「使用 force-attach 將區域性磁碟切換至備援機制」。

區域性永久磁碟和 Hyperdisk 平衡高可用性功能會優先考量工作負載的可用性,也就是說,在兩個磁碟備援磁碟同時無法使用時,資料保護功能會受到影響。詳情請參閱「管理區域磁碟的失敗情形」。

限制

以下各節列出適用於區域性永久磁碟和 Hyperdisk 平衡高可用性的限制。

區域性磁碟的一般限制

  • 區域性永久磁碟只能連接至採用 E2N1N2N2D 機器類型的 VM。
  • 您只能將 Hyperdisk 平衡高可用性磁碟附加至支援的機器類型
  • 您無法從OS 映像檔或從使用 OS 映像檔建立的磁碟建立地區性永久磁碟。
  • 使用唯讀模式時,您最多可以將地區平衡永久磁碟附加至 10 個 VM 執行個體。
  • 地區標準永久磁碟的大小下限為 200 GiB。
  • 您只能將 regional Persistent Disk 或Hyperdisk Balanced High Availability 磁碟區的大小調大,無法縮減。
  • Regional Persistent Disk 和 Hyperdisk 平衡高可用性磁碟區的效能特性與對應的區域磁碟不同。詳情請參閱「區塊儲存空間效能」。
  • 您無法將處於多寫入端模式的 Hyperdisk Balanced High Availability 磁碟區做為開機磁碟。
  • 如果您透過複製可用區磁碟來建立複製磁碟,則兩個可用區備用資源在建立時並未完全同步。建立完成後,您可以在平均 3 分鐘內使用地區磁碟克隆。不過,您可能需要等待數十分鐘,磁碟才會達到完全複製的狀態,且 復原點目標 (RPO) 接近零。瞭解如何 檢查複製磁碟是否已完全複製

複本復原檢查點的限制

  • 複本復原檢查點是裝置中繼資料的一部分,不會單獨顯示任何磁碟資料。您只能使用檢查點做為機制,為降級磁碟建立快照。使用檢查點建立快照後,您可以使用快照還原資料。
  • 只有在磁碟降級時,您才能從複本復原檢查點建立快照。
  • 只有在磁碟已完全複製時,Compute Engine 才會重新整理磁碟的備援復原檢查點。
  • Compute Engine 只會為磁碟維護一個複本復原檢查點,且只維護該檢查點的最新版本。
  • 您無法查看備份復原檢查點的確切建立和重新整理時間戳記。
  • 您只能使用 Compute Engine API,從複本復原檢查點建立快照。

後續步驟