다음을 통해 공유


Azure NetApp Files의 안정성

Azure NetApp Files는 Azure 내에서 원활하게 통합되고 NFS(네트워크 파일 시스템) 및 SMB(서버 메시지 블록) 프로토콜을 통해 클라이언트 간에 파일 공유를 가능하게 하는 네이티브 엔터프라이즈급 파일 스토리지 솔루션입니다. Azure NetApp Files는 고성능을 위해 설계되었으며 서비스로 관리되는 확장 가능하고 보안 파일 스토리지를 제공합니다.

Azure를 사용하는 경우 안정성은 공유 책임입니다. Microsoft는 복원력 및 복구를 지원하는 다양한 기능을 제공합니다. 이러한 기능이 사용하는 모든 서비스 내에서 작동하는 방식을 이해하고 비즈니스 목표 및 가동 시간 목표를 충족하는 데 필요한 기능을 선택할 책임이 있습니다.

이 문서에서는 일시적인 오류, 가용성 영역 중단 및 지역 중단을 포함하여 다양한 잠재적인 중단 및 문제에 대해 NetApp Files를 복원할 수 있도록 하는 방법을 설명합니다. 또한 백업을 사용하여 다른 유형의 문제에서 복구하는 방법을 설명하고 Azure NetApp Files SLA(서비스 수준 계약)에 대한 몇 가지 주요 정보를 강조 표시합니다.

프로덕션 배포 권장 사항

솔루션의 안정성 요구 사항을 지원하기 위해 Azure NetApp Files를 배포하는 방법과 안정성이 아키텍처의 다른 측면에 어떤 영향을 미치는지 알아보려면 Azure Well-Architected Framework의 Azure NetApp Files에 대한 아키텍처 모범 사례를 참조하세요.

안정성 아키텍처 개요

Azure NetApp Files를 사용하려면 볼륨을 호스팅하는 용량 풀이 포함된 NetApp 계정을 구성해야 합니다. 용량과 처리량을 독립적으로 구성하고 다양한 요구 사항에 맞는 데이터 보호 옵션을 관리할 수 있습니다. 볼륨이 서로 다른 위치에 있더라도 볼륨 간 복제를 사용하도록 설정할 수 있습니다.

일시적인 오류에 대한 복원력

일시적인 오류는 구성 요소에서 짧고 간헐적인 오류입니다. 클라우드와 같은 분산 환경에서 자주 발생하며 작업의 일반적인 부분입니다. 일시적인 오류는 짧은 시간 후에 스스로 수정됩니다. 애플리케이션은 일반적으로 영향을 받는 요청을 다시 시도하여 일시적인 오류를 처리할 수 있는 것이 중요합니다.

모든 클라우드 호스팅 애플리케이션은 클라우드 호스팅 API, 데이터베이스 및 기타 구성 요소와 통신할 때 Azure 임시 오류 처리 지침을 따라야 합니다. 자세한 내용은 임시 오류 처리를 위한 권장 사항을 참조하세요.

클라우드 기반 솔루션에 영향을 줄 수 있는 임시 오류 형식 외에도 플랫폼 업데이트, 서비스 업데이트, 소프트웨어 업그레이드와 같은 가끔씩 계획된 유지 관리도 Azure NetApp Files에 영향을 줄 수 있습니다.

NFS 및 SMB와 같은 파일 프로토콜의 관점에서 볼 때, 애플리케이션이 이러한 이벤트 중에 발생할 수 있는 I/O(입출력) 일시 중지를 처리할 수 있다면 임시 오류는 중단을 초래하지 않습니다. I/O 일시 중지는 일반적으로 몇 초에서 최대 30초까지 짧습니다. 일부 애플리케이션은 I/O 일시 중지를 처리하기 위해 튜닝이 필요할 수 있습니다.

NFS 프로토콜은 강력하며, 클라이언트-서버 파일 작업은 일반적으로 정상적으로 진행됩니다. 일부 애플리케이션은 최대 30~45초 동안 I/O 일시 중지를 처리하기 위해 튜닝이 필요할 수 있습니다. 스토리지 서비스 유지 관리 이벤트에 대처하려면 애플리케이션의 복원력 설정을 알고 있어야 합니다.

SMB 프로토콜을 사용하는 사용자 대화형 애플리케이션의 경우 일반적으로 표준 프로토콜 설정으로 충분합니다. Azure NetApp Files는 또한 SMB 투명한 장애 조치(failover)를 가능하게 하는 SMB 지속적인 가용성을 지원합니다. SMB 투명 장애 조치(failover)는 서비스 유지 관리 이벤트로 인해 발생하는 중단을 제거합니다. 또한 안정성과 사용자 환경도 개선됩니다.

SMB 지속적인 가용성은 특정 애플리케이션에만 사용할 수 있습니다.

자세한 권장 사항은 Azure NetApp Files에 대한 애플리케이션 복원력 FAQ를 참조하세요.

가용성 영역 오류에 대한 복원력

가용성 영역은 Azure 지역 내에서 물리적으로 별도의 데이터 센터 그룹입니다. 한 영역이 실패하면 서비스가 나머지 영역 중 하나로 전환될 수 있습니다.

Azure NetApp Files는 볼륨의 영역별 배포를 지원합니다. Azure NetApp Files의 가용성 영역 볼륨 배치 기능을 사용하여 원하는 단일 가용성 영역에 각 볼륨을 배포합니다. Azure NetApp Files가 해당 가용성 영역에 있고 충분한 용량이 있는 경우에만 이 기능을 사용할 수 있습니다. 대기 시간에 중요한 애플리케이션이 있는 경우 Azure 컴퓨팅 리소스 및 기타 서비스와 동일한 가용성 영역에 볼륨을 배포할 수 있습니다.

다음 다이어그램에서 단색 화살표가 있는 주황색 화살표는 피어된 가상 네트워크의 지역 내 모든 VM(가상 머신)이 모든 Azure NetApp Files 리소스에 액세스할 수 있는 방법을 나타냅니다. 녹색 화살표는 동일한 영역의 Azure NetApp Files 볼륨에 액세스하는 VM이 ​​가용성 영역 장애 도메인을 공유하는 방식을 나타냅니다. 플랫폼 수준에서는 서로 다른 볼륨 간에 복제가 없습니다.

Azure NetApp Files 가용성 영역 볼륨 배치를 보여 주는 다이어그램

Azure 지역의 세 가지 가용성 영역을 보여 주는 다이어그램. 단색 화살촉이 있는 주황색 화살표는 가용성 영역에서 VM 및 Azure NetApp Files 리소스를 나타내는 아이콘을 연결합니다. 녹색 화살표는 동일한 가용성 영역에 있는 VM과 Azure NetApp Files 볼륨을 연결합니다.

단일 영역 배포만으로는 높은 안정성 요구 사항을 충족하기에 충분하지 않습니다. 서로 다른 가용성 영역의 볼륨 간에 데이터를 비동기식으로 복제하려면 교차영역 복제를 사용할 수 있습니다. 가용성 영역 볼륨 배치와 별도로 교차영역 복제를 구성해야 합니다.

가용성 영역에 장애가 발생하면 장애를 검색하고 다른 영역에 있는 대체 볼륨으로 전환해야 합니다.

지역 지원

교차영역 복제는 Azure NetApp Files를 지원하는 모든 가용성 영역 지원 지역에서 사용할 수 있습니다.

고려 사항

  • Azure NetApp Files의 가용성 영역 볼륨 배치는 영역별 볼륨 배치를 제공합니다. 동일한 가용성 영역 내의 VM에 연결하면 대기 시간이 짧아집니다. 그러나 가용성 영역 볼륨 배치는 VM이나 다른 리소스와의 근접 배치를 제공하지 않으며 볼륨은 데이터 센터의 다른 실제 부분에 있을 수 있습니다.

  • 동일한 Microsoft Entra 테넌트 내에 있는 경우에만 서로 다른 Azure 구독 간에 복제가 허용됩니다.

  • Azure NetApp Files의 가용성 영역에 대한 자세한 내용은 교차영역 복제를 사용하기 위한 요구 사항 및 고려 사항가용성 영역 볼륨 배치 관리를 참조하세요.

비용

Azure NetApp Files에서 가용성 영역 볼륨 배치를 사용하도록 설정하는 데 추가 요금이 없습니다. 이러한 영역 내에서 배포한 용량 풀과 리소스에 대해서만 비용을 지불합니다.

복제된 볼륨은 용량 풀에서 호스트됩니다. 교차영역 복제 비용은 프로비전된 용량 풀 크기와 계층에 따라 결정됩니다. 데이터 복제에는 추가 비용이 없습니다.

가용성 영역 지원 구성

볼륨 배치와 교차영역 복제를 별도로 구성해야 합니다.

  • 볼륨 배치

    • 가용성 영역 지원을 통해 새 볼륨을 만들거나 기존 볼륨을 구성합니다. Azure NetApp Files에서 볼륨의 가용성 영역을 구성하려면 Azure NetApp Files의 가용성 영역 볼륨 배치 관리를 참조하세요.

      가용성 영역이 있는 Terraform 관리 볼륨을 배포하는 경우 다른 구성이 필요합니다. 자세한 내용은 Terraform 관리 볼륨에 대한 가용성 영역 채우기를 참조하세요.

      역할 기반 액세스 제어를 사용하는 경우 올바른 권한을 구성해야 합니다.

    • 가용성 영역 간에 볼륨을 마이그레이션합니다. 볼륨을 구성하여 가용성 영역에 배치한 후에는 지정된 가용성 영역을 수정할 수 없습니다. 가용성 영역 간에 볼륨을 이동할 수 없습니다.

    • 볼륨에 대한 가용성 영역 지원을 사용하지 않도록 설정합니다. 볼륨을 가용성 영역에 배치하도록 구성한 후에는 가용성 영역 지원을 사용하지 않도록 설정할 수 없습니다.

  • 영역 간 복제

모든 영역이 정상인 경우의 동작

이 섹션에서는 여러 Azure NetApp Files 볼륨이 별도의 가용성 영역에 배포되고, 영역 간 복제가 사용하도록 설정되고, 모든 가용성 영역이 작동하는 경우 예상되는 상황을 설명합니다.

  • 영역 간 트래픽 라우팅: 수신 요청은 선택한 가용성 영역에 위치한 특정 볼륨으로 라우팅됩니다.

  • 영역 간 데이터 복제: Azure NetApp Files 교차영역 복제는 원본 볼륨의 모든 변경 내용이 대상 볼륨에 비동기식으로 복제된다는 것을 의미합니다. 복제가 얼마나 자주 발생하는지 결정할 수 있습니다. 교차영역 복제는 10분마다, 매시간, 매일의 세 가지 복제 일정을 지원합니다.

    중요합니다

    10분 복제 일정은 교차영역 복제를 사용하는 대용량에는 지원되지 않습니다.

영역 오류 중 동작

이 섹션에서는 여러 Azure NetApp Files 볼륨이 별도의 가용성 영역에 배포되고, 영역 간 복제가 사용하도록 설정되었으며, 가용성 영역이 중단되는 경우 예상되는 상황에 대해 설명합니다.

  • 검색 및 응답: 가용성 영역 손실을 검색하고 장애 조치(failover)를 시작하는 것은 사용자의 책임입니다.

    장애 조치는 수동 프로세스입니다. 대상 가용성 영역으로 장애 조치(failover)를 수행하려는 경우와 같이 대상 볼륨을 활성화해야 하는 경우 복제 피어링을 해제한 다음 대상 볼륨을 탑재해야 합니다. 자세한 내용은 대상 볼륨으로 장애 조치(failover)를 참조하세요.

  • 알림: Azure NetApp Files 볼륨의 상태를 모니터링하려면 Azure Monitor 메트릭을 사용할 수 있습니다. Azure Monitor는 IOPS(초당 입출력 작업 수), 대기 시간, 용량 사용량 등의 실시간 메트릭을 통해 영역 다운 시나리오를 나타내는 모든 변칙을 검색합니다. 관리자에게 보낼 경고 및 알림을 구성하여 관리자가 파일 공유를 리밸런싱하거나 장애 조치(failover) 또는 기타 재해 복구 프로토콜을 시작하는 등 즉시 대응할 수 있도록 할 수 있습니다.

  • 활성 요청: 영역 다운 이벤트 동안 활성 요청은 중단되거나 대기 시간이 증가할 수 있습니다.

  • 예상되는 데이터 손실: 영역 장애 조치(failover) 중에 예상할 수 있는 데이터 손실량 또는 RPO(복구 지점 목표)는 구성하는 교차영역 복제 일정에 따라 달라집니다.

    복제 일정 일반적인 RPO
    매 10분 20분
    매시간 두 시간
    매일 48시간보다 작음
  • 예상 가동 중지 시간: 다른 영역으로의 장애 조치(failover)를 위해서는 대상 볼륨을 활성화하고 두 번째 사이트에서 읽기 및 쓰기 데이터 액세스를 제공하기 위해 피어링 관계를 끊어야 합니다. 피어링이 중단되도록 트리거한 후 1분 이내에 장애 조치(failover)가 완료될 것으로 예상할 수 있습니다.

    그러나 영역 장애 조치(failover) 중에 예상할 수 있는 총 가동 중지 시간 또는 RTO(복구 시간 목표)는 시스템이나 프로세스에서 영역 손실을 검색하고 장애 조치(failover) 프로세스를 시작하는 데 걸리는 시간을 비롯한 여러 요인에 따라 달라집니다. 응답을 자동화할 것인지, 아니면 수동 단계가 필요한지 결정하는 것도 중요합니다. 잘 준비된 구성의 경우, 전체 프로세스를 완료하는 데 일반적으로 몇 분에서 1시간이 걸립니다.

  • 트래픽 다시 라우팅: 애플리케이션 트래픽을 새로 활성화된 대상 볼륨에 연결하도록 재지정하는 일은 사용자의 책임입니다. 자세한 내용은 대상 볼륨으로 장애 조치(failover)를 참조하세요.

영역 복구

장애 복구는 재동기화 작업을 수행하고, 복제를 재설정하고, 클라이언트가 액세스할 수 있도록 원본 볼륨을 다시 탑재해야 하는 수동 프로세스입니다. 자세한 내용은 Azure NetApp Files를 사용하여 재해 복구 관리를 참조하세요.

영역 오류 테스트

볼륨의 스냅샷을 사용하여 교차영역 복제 구성을 안전하게 테스트할 수 있습니다. Azure NetApp Files에 대한 재해 복구 테스트를 참조하여 교차영역 복제 구성을 테스트하는 높은 수준 방식에 대해 알아봅니다.

지역 전체 오류에 대한 복원력

기본적으로 Azure NetApp Files는 단일 지역 서비스입니다. 해당 지역을 사용할 수 없게 되면 해당 지역에 저장된 볼륨도 사용할 수 없게 됩니다. 지역적 중단이 발생할 경우 복원력을 높이기 위해 Azure NetApp Files는 지역 간 복제를 지원합니다. 한 지역의 Azure NetApp Files 볼륨(원본)에서 Microsoft가 미리 선택한 다른 지역의 다른 Azure NetApp Files 볼륨(대상)으로 비동기식으로 데이터를 복제할 수 있습니다. 이 기능을 사용하면 지역 전체에 중단이나 재해가 발생하는 경우 중요한 애플리케이션을 장애 조치(failover)할 수 있습니다.

비고

단일 볼륨을 다른 가용성 영역 다른 지역에 복제할 수도 있습니다. 자세한 내용은 Azure NetApp Files 복제 이해를 참조하세요.

지역 지원

볼륨을 복제할 수 있는 보조 지역은 주 지역에 따라 달라집니다. 자세한 내용은 지원되는 지역 쌍을 참조하세요.

고려 사항

동일한 Microsoft Entra 테넌트 내에 있는 경우에만 서로 다른 Azure 구독 간에 복제가 허용됩니다.

Azure NetApp Files에서 지역 간 복제와 관련된 기타 고려 사항은 지역 간 복제 사용을 위한 요구 사항 및 고려 사항을 참조하세요.

비용

지역 간 복제 요금은 복제하는 데이터 양에 따라 결정됩니다. 자세한 내용과 몇 가지 시나리오 예는 지역 간 복제에 대한 비용 모델을 참조하세요.

다중 지역 지원 구성

모든 지역이 정상인 경우의 동작

이 섹션에서는 Azure NetApp Files 볼륨이 지역 간 복제를 사용하도록 구성되고 두 지역 모두 작동하는 경우 예상되는 상황에 대해 설명합니다.

  • 지역 간 트래픽 라우팅: 수신 요청은 주 지역에 있는 특정 볼륨으로 라우팅됩니다.

  • 지역 간 데이터 복제: Azure NetApp Files 지역 간 복제는 원본 볼륨의 모든 변경 내용이 대상 볼륨에 비동기식으로 복제된다는 것을 의미합니다. 복제가 얼마나 자주 발생하는지 결정할 수 있습니다. 지역 간 복제는 10분마다, 매시간, 매일의 세 가지 복제 일정을 지원합니다.

    중요합니다

    10분 복제 일정은 지역 간 복제를 사용하는 대용량 볼륨에 대해 지원되지 않습니다.

  • 복제 상태 모니터링: 피어링 관계의 상태를 모니터링하고 복제 지연이 예상 임계값을 넘어 증가하면 알리도록 경고를 구성할 수 있습니다. 자세한 내용은 복제 관계 상태 표시 및 모니터링을 참조하세요.

지역 오류 중 동작

이 섹션에서는 Azure NetApp Files 볼륨이 지역 간 복제를 사용하도록 구성되고 주 지역이 중단되는 경우 예상되는 상황에 대해 설명합니다.

  • 검색 및 응답: 지역 손실을 검색하고 장애 조치(failover)를 시작하는 것은 사용자의 책임입니다. 장애 조치는 수동 프로세스입니다. 대상 지역으로 장애 조치(failover)를 취하려는 경우 등 대상 볼륨을 활성화해야 하는 경우 복제 피어링을 해제한 다음 대상 볼륨을 탑재해야 합니다. 자세한 내용은 대상 볼륨으로 장애 조치(failover)를 참조하세요.

  • 알림: Azure NetApp Files 볼륨의 상태를 모니터링하려면 Azure Monitor 메트릭을 사용할 수 있습니다. Azure Monitor는 IOPS, 대기 시간, 용량 사용량 등의 실시간 메트릭을 통해 지역 다운 시나리오를 나타내는 모든 변칙을 검색합니다. 관리자에게 보낼 경고 및 알림을 구성하여 관리자가 파일 공유를 리밸런싱하거나 장애 조치(failover) 또는 기타 재해 복구 프로토콜을 시작하는 등 즉시 대응할 수 있도록 할 수 있습니다.

  • 활성 요청: 지역 중단 이벤트 동안 활성 요청은 중단되거나 대기 시간이 증가할 수 있습니다.

  • 예상되는 데이터 손실: 지역 장애 조치(failover) 중에 예상할 수 있는 데이터 손실량 또는 RPO는 구성하는 지역 간 복제 일정에 따라 달라집니다.

    복제 일정 일반적인 RPO
    매 10분 20분 미만
    매시간 2시간 이내
    매일 48시간보다 작음
  • 예상 가동 중지 시간: 다른 지역으로 장애 조치(failover)를 수행하려면 대상 볼륨을 활성화하고 두 번째 사이트에서 읽기 및 쓰기 데이터 액세스를 제공하기 위해 피어링 관계를 끊어야 합니다. 피어링이 중단되도록 트리거한 후 1분 이내에 장애 조치(failover)가 완료될 것으로 예상할 수 있습니다.

    그러나 영역 장애 조치(failover) 중에 예상할 수 있는 총 가동 중지 시간(RTO)은 시스템이나 프로세스에서 영역 손실을 검색하고 장애 조치(failover) 프로세스를 시작하는 데 걸리는 시간을 비롯한 여러 요인에 따라 달라집니다. 응답을 자동화할 것인지, 아니면 수동 단계가 필요한지 결정하는 것도 중요합니다. 잘 준비된 구성의 경우, 전체 프로세스를 완료하는 데 일반적으로 몇 분에서 1시간이 걸립니다.

  • 트래픽 다시 라우팅: 애플리케이션 트래픽을 새로 활성화된 대상 볼륨에 연결하도록 재지정하는 일은 사용자의 책임입니다. 자세한 내용은 대상 볼륨으로 장애 조치(failover)를 참조하세요.

지역 복구

주 지역이 복구된 후 장애 복구는 사용자 책임입니다. 장애 복구는 재동기화 작업을 수행하고, 복제를 재설정하고, 클라이언트가 액세스할 수 있도록 원본 볼륨을 다시 탑재해야 하는 수동 프로세스입니다. 자세한 내용은 Azure NetApp Files를 사용하여 재해 복구 관리를 참조하세요.

지역 오류 테스트

볼륨의 스냅샷을 사용하여 지역 간 복제 구성을 안전하게 테스트할 수 있습니다. 지역 간 복제 구성을 테스트하는 개략적인 방식에 대해 알아보려면 Azure NetApp Files에 대한 재해 복구 테스트를 참조하세요.

백업 및 복원

Azure NetApp Files 백업은 장기 복구, 보관 및 규정 준수를 위한 완전 관리형 백업 솔루션을 제공하여 Azure NetApp Files의 데이터 보호 기능을 확장합니다. 서비스에서 만드는 백업은 단기 복구나 복제에 사용할 수 있는 볼륨 스냅샷과 별도로 Azure Storage에 저장됩니다. 서비스에서 수행한 백업은 해당 지역 내의 새로운 Azure NetApp Files 볼륨으로 복원될 수 있습니다. Azure NetApp Files 백업은 정책 기반(예약된) 백업 및 수동(주문형) 백업을 모두 지원합니다.

보안을 강화하기 위해 Azure NetApp Files 스냅샷은 성능에 영향을 주지 않으면서 안정성, 확장성 및 빠른 복구 기능을 추가합니다. 이는 백업, 지역 간 복제, 영역 간 복제를 포함한 기타 중복도 솔루션의 기반을 제공합니다.

대부분의 솔루션의 경우 백업에만 의존해서는 안 됩니다. 대신 이 가이드에 설명된 다른 기능을 사용하여 복원력 요구 사항을 지원합니다. 그러나 백업은 다른 방법이 사용하지 않는 일부 위험으로부터 보호합니다. 자세한 내용은 중복도, 복제 및 백업이란?을 참조하세요.

서비스 수준 약정

Azure 서비스의 SLA(서비스 수준 계약)는 각 서비스의 예상 가용성과 해당 가용성 예상 결과치를 달성하기 위해 솔루션이 충족해야 하는 조건을 설명합니다. 자세한 내용은 온라인 서비스 SLA를 참조하세요.