本頁面詳細說明 Google Cloud NetApp Volumes 應用程式的復原能力。
應用程式復原能力注意事項
雖然 NetApp Volumes 具有高可用性,但平台更新、服務升級、軟體升級等預定維護事件,或服務中非預期的元件故障,都可能導致輸入和輸出 (I/O) 作業短暫暫停。
I/O 暫停
作業系統內的網路檔案系統 (NFS) 或伺服器訊息區塊 (SMB) 用戶端軟體會處理短暫的 I/O 暫停。用戶端會等待並重試 I/O 作業,不會向應用程式回報問題。這類短暫暫停不會造成干擾,因為雖然應用程式使用者可能會發現回應時間變長,但應用程式不會回報 I/O 錯誤。
如果 I/O 暫停時間較長,行為會取決於作業系統的 NFS 或 SMB 用戶端,以及應用程式中設定的可能逾時。以下各節將討論 I/O 暫停的通訊協定專屬詳細資料。
NFS I/O 暫停
NFS 用戶端會封鎖對無法使用的硬式裝載 NFS 共用區的所有呼叫,並無限期等待,直到 NFS 伺服器再次回應為止。NFS 用戶端等待期間,用戶端記錄中會顯示訊息,指出 NFS 伺服器未回應。
從應用程式的角度來看,讀取或寫入等 I/O 作業會遭到封鎖,且會持續處於待處理狀態,直到 NFS 共用成功傳回為止。在 I/O 暫停期間,不會遺失任何 I/O 作業,且 NetApp Volumes 會確保資料一致性,除非您在用戶端強制停止未完成的 I/O 作業。
使用叢集軟體應用程式自動執行容錯移轉
如果您在用戶端 VM 上使用 Pacemaker 等叢集軟體應用程式,自動執行應用程式的容錯移轉,請設定 NFS 共用的逾時,以因應 NetApp Volumes 維護事件。這類容錯移轉會中止用戶端上未完成的 I/O 作業,並可能導致交易遺失。建議使用下列逾時時間:
通訊協定類型 | 建議的逾時時間 | 附註 |
---|---|---|
NFSv3 共用區 | 60 秒 (適用於 Standard、Premium 和 Extreme 服務等級)
120 秒 (適用於 Flex 服務等級) |
建議您使用防護方法,也就是使用 nolock 掛接選項,而非依賴 NFS 鎖定。 |
NFSv4.1 | 105 秒 (適用於 Standard、Premium 和 Extreme 服務等級)
165 秒 (適用於 Flex 服務等級) |
NFSv4.1 通訊協定會自動在 NFSv3 上新增可靠的鎖定機制 (NFSv4.x RFC,第 9.6.2 節),可用做防護機制。鎖定狀態復原作業會額外增加 45 秒。 |
SMB 共用 I/O 暫停
與 NFS 不同,SMB 工作階段使用的連線可能會逾時。在大多數情況下,NetApp Volumes 不會發生逾時問題。
工作階段逾時
工作階段逾時是在用戶端定義。Windows 用戶端的預設逾時時間為 60 秒。您可以使用 SessionTimeout
參數執行 Get-SmbClientConfiguration/Set-SmbClientConfiguration
指令,讀取或變更工作階段逾時。
如果發生工作階段逾時,SMB 工作階段就會中斷,並向執行 I/O 的應用程式回報 I/O 錯誤。使用者再次存取 SMB 共用資料夾時,檔案總管或 Microsoft 365 應用程式通常會立即重新連線。發生 I/O 錯誤時,部分應用程式會嘗試重新連線並重試失敗的 I/O 作業,但其他應用程式不會。請參閱應用程式廠商的說明文件,瞭解應用程式如何處理 SMB 超時,以及如何在 SMB 共用資料夾上穩定運作。
持續可用 (CA) 共用區是 SMB3.x 功能,可提升資料庫類應用程式的容錯移轉復原能力。NetApp Volumes 支援 Microsoft SQL Server 和 FSLogix 的持續可用共用區。
每個新版 SMB 都會提升失敗復原能力。 NetApp Volumes 支援 SMB 2.1、3.0 和 3.1.1。請盡可能使用最新支援的 SMB 版本。Windows 10/Server 2016 以上版本支援最新版 SMB 3.1.1。
SMB 應用程式注意事項
部分 SMB 型應用程式需要 SMB 透明容錯移轉。 透過 SMB 透明容錯移轉,您可以在 NetApp Volumes 內對 SMB 磁碟區執行維護作業,而不會中斷伺服器應用程式的連線,這些應用程式會儲存及存取資料。NetApp Volumes 支援 SMB 持續可用的共用選項,確保特定應用程式支援 SMB 透明容錯移轉。使用 SMB 持續可用共用資料夾時,僅支援下列工作負載:
FSLogix 使用者設定檔容器
Microsoft SQL Server (非 Linux SQL Server)
SMB 持續可用共用區不支援自訂應用程式。
維護事件導致應用程式中斷
我們偶爾會進行平台升級和服務軟體升級等定期維護作業。只要應用程式可以處理這些事件期間可能發生的 I/O 暫停,從檔案通訊協定 (NFS 或 SMB) 的角度來看,維護事件就不會造成中斷。
如果是 Standard、Premium 和 Extreme 服務等級,I/O 暫停時間通常很短,從幾秒到 30 秒不等。
如果是 Flex 服務層級,I/O 暫停時間最多可達 70 秒。
後續步驟
請參閱 Google Cloud NetApp Volumes 的安全性考量。