이 페이지에서는 Google Cloud NetApp Volumes 애플리케이션 복원력에 대해 자세히 설명합니다.
애플리케이션 복원력 고려사항
NetApp 볼륨은 가용성이 높지만 플랫폼 업데이트, 서비스 업그레이드, 소프트웨어 업그레이드 또는 서비스의 계획되지 않은 구성요소 오류와 같은 계획된 유지보수 이벤트로 인해 입력 및 출력 (I/O) 작업이 잠시 중단될 수 있습니다.
I/O 일시중지
운영체제 내의 네트워크 파일 시스템 (NFS) 또는 서버 메시지 블록 (SMB) 클라이언트 소프트웨어가 짧은 I/O 일시중지를 처리합니다. 클라이언트는 문제를 애플리케이션에 전달하지 않고 I/O 작업을 기다렸다가 다시 시도합니다. 이러한 짧은 일시중지는 애플리케이션의 사용자가 더 긴 응답 시간을 보일 수 있지만 애플리케이션이 I/O 오류를 보고하지 않으므로 중단되지 않는 것으로 간주됩니다.
I/O 일시중지가 길어질 경우 동작은 운영체제의 NFS 또는 SMB 클라이언트와 애플리케이션에 구성된 잠재적 시간 제한에 따라 달라집니다. 다음 섹션에서는 I/O 일시중지에 관한 프로토콜별 세부정보를 설명합니다.
NFS I/O 일시중지
사용할 수 없는 하드 마운트된 NFS 공유에 대한 모든 호출은 NFS 클라이언트에서 차단되고 NFS 서버가 다시 응답할 때까지 무한으로 대기합니다. NFS 클라이언트가 대기하는 동안 NFS 서버가 응답하지 않는다는 메시지가 클라이언트 로그에 표시됩니다.
애플리케이션 관점에서 읽기 또는 쓰기와 같은 I/O 작업은 NFS 공유가 성공적으로 반환될 때까지 차단되고 대기 상태로 유지됩니다. I/O 일시중지 중에 I/O 작업이 손실되지 않으며 클라이언트 측에서 대기 중인 I/O 작업을 강제로 중지하지 않는 한 NetApp 볼륨은 데이터 일관성을 보장합니다.
클러스터 소프트웨어 애플리케이션을 사용하여 장애 조치 자동화
클라이언트 VM에서 Pacemaker와 같은 클러스터 소프트웨어 애플리케이션을 사용하여 애플리케이션의 페일오버를 자동화하는 경우 NetApp 볼륨 유지보수 이벤트를 견딜 수 있도록 NFS 공유의 제한 시간을 구성합니다. 이러한 페일오버는 클라이언트에서 대기 중인 I/O 작업을 중단하고 거래가 손실될 수 있습니다. 다음과 같은 제한 시간을 사용하는 것이 좋습니다.
프로토콜 유형 | 권장 시간 제한 | 참고 |
---|---|---|
NFSv3 공유 | 60초 (표준, 프리미엄, 익스트림 서비스 수준의 경우)
120초 (Flex 서비스 수준의 경우) |
NFS 잠금에 의존하는 대신 nolock 마운트 옵션을 사용하는 펜싱 메서드를 사용하는 것이 좋습니다. |
NFSv4.1 | 105초 (Standard, Premium, Extreme 서비스 수준의 경우)
165초 (Flex 서비스 수준의 경우) |
NFSv4.1 프로토콜은 NFSv3(NFSv4.x RFC, 섹션 9.6.2)에 안정적인 잠금을 자동으로 추가하며, 이를 펜싱 메커니즘으로 사용할 수 있습니다. 잠금 상태 복구에는 45초가 추가로 소요됩니다. |
SMB 공유 I/O 일시중지
NFS와 달리 SMB 세션은 시간 초과될 수 있는 연결을 사용합니다. 대부분의 경우 NetApp Volumes는 제한 시간 미만으로 유지됩니다.
세션 제한 시간
세션 시간 제한은 클라이언트에서 정의합니다. Windows 클라이언트의 기본 제한 시간은 60초입니다. SessionTimeout
매개변수를 사용하여 Get-SmbClientConfiguration/Set-SmbClientConfiguration
명령어를 실행하여 세션 시간 제한을 읽거나 변경할 수 있습니다.
세션 시간 초과가 발생하면 SMB 세션이 중단되고 I/O를 실행하는 애플리케이션에 I/O 오류가 보고됩니다. File Explorer 또는 Microsoft 365 애플리케이션은 일반적으로 사용자가 SMB 공유에 다시 액세스하는 즉시 다시 연결됩니다. I/O 오류가 발생하면 일부 애플리케이션은 다시 연결하고 실패한 I/O 작업을 다시 시도하지만, 다른 애플리케이션은 다시 연결하지 않습니다. 애플리케이션 공급업체의 문서를 참고하여 애플리케이션이 SMB 시간 초과를 처리하고 SMB 공유에서 탄력적으로 작동하는 방법을 알아보세요.
지속적인 가용성 (CA) 공유는 데이터베이스와 같은 애플리케이션의 장애 조치 복원력을 개선하는 SMB3.x 기능입니다. NetApp 볼륨은 Microsoft SQL Server 및 FSLogix에 대해 지속적으로 사용 가능한 공유를 지원합니다.
새로운 SMB 버전이 출시될 때마다 오류 복구가 개선됩니다. NetApp 볼륨은 SMB 2.1, 3.0, 3.1.1을 지원합니다. 가능하면 지원되는 최신 SMB 버전을 사용하세요. Windows 10/Server 2016 이상에서는 최신 SMB 버전 3.1.1을 지원합니다.
SMB 애플리케이션 기반 예방 조치
특정 SMB 기반 애플리케이션에는 SMB 투명 장애 조치가 필요합니다. SMB 투명성 장애 조치를 사용하면 데이터를 저장하고 액세스하는 서버 애플리케이션에 대한 연결을 중단하지 않고도 NetApp 볼륨 내 SMB 볼륨에 대한 유지보수 작업을 실행할 수 있습니다. NetApp 볼륨은 SMB 투명성 장애 조치를 지원하는 특정 애플리케이션을 위해 SMB 지속적 가용성 공유 옵션을 지원합니다. SMB 연속 사용 가능 공유를 사용하면 다음 워크로드만 지원됩니다.
FSLogix 사용자 프로필 컨테이너
Microsoft SQL Server (Linux SQL Server 아님)
SMB 연속 사용 가능 공유는 맞춤 애플리케이션을 지원하지 않습니다.
유지보수 이벤트 관련 애플리케이션 중단
플랫폼 업그레이드 및 서비스 소프트웨어 업그레이드와 같은 계획된 유지보수 이벤트가 가끔 발생할 수 있습니다. 유지보수 이벤트는 애플리케이션이 이러한 이벤트 중에 발생할 수 있는 I/O 일시중지를 처리할 수 있는 한 파일 프로토콜 (NFS 또는 SMB) 관점에서 중단되지 않는 것으로 간주됩니다.
표준, 프리미엄, 익스트림 서비스 수준의 경우 I/O 일시중지는 일반적으로 짧으며 몇 초에서 최대 30초까지 걸립니다.
Flex 서비스 수준의 경우 I/O 일시중지는 최대 70초까지 가능합니다.
다음 단계
Google Cloud NetApp Volumes 보안 고려사항을 읽어보세요.