Azure Device Registry는 자산 및 디바이스에 대한 정보를 클라우드에 저장합니다. Device Registry는 단일 레지스트리 내에서 클라우드에서 자산을 Azure 리소스로 프로젝션합니다. 단일 레지스트리는 디바이스 및 자산 메타데이터 및 자산 관리 기능의 원본입니다. 디바이스 레지스트리는 Azure IoT Operations와 함께 사용할 수 있습니다.
Azure를 사용하는 경우 안정성은 공유 책임입니다. Microsoft는 복원력 및 복구를 지원하는 다양한 기능을 제공합니다. 이러한 기능이 사용하는 모든 서비스 내에서 작동하는 방식을 이해하고 비즈니스 목표 및 가동 시간 목표를 충족하는 데 필요한 기능을 선택할 책임이 있습니다.
이 문서에서는 일시적인 오류, 가용성 영역 중단 및 지역 중단을 포함하여 다양한 잠재적인 중단 및 문제에 대해 Device Registry를 복원하는 방법을 설명합니다.
Note
Azure IoT Operations에는 Device Registry 이외의 다양한 다른 구성 요소가 포함되어 있습니다. Azure IoT Operations 구성 요소의 고가용성 및 데이터 손실 기능에 대한 자세한 내용은 Azure IoT Operations 질문과 대답을 참조하세요.
일시적인 오류에 대한 복원력
임시 오류는 구성 요소의 짧고 일시적 오류입니다. 이러한 문제는 클라우드와 같은 분산 환경에서 자주 발생하며, 운영의 정상적인 일부입니다. 일시적인 오류는 짧은 시간 후에 스스로 수정됩니다. 애플리케이션은 일반적으로 영향을 받는 요청을 다시 시도하여 일시적인 오류를 처리할 수 있는 것이 중요합니다.
모든 클라우드 호스팅 애플리케이션은 클라우드 호스팅 API, 데이터베이스 및 기타 구성 요소와 통신할 때 Azure 임시 오류 처리 지침을 따라야 합니다. 자세한 내용은 임시 오류 처리를 위한 권장 사항을 참조하세요.
클라이언트는 Azure Resource Manager를 사용하여 Device Registry와 상호 작용합니다. 일반적으로 Azure Portal, Azure CLI 또는 Azure SDK를 사용하여 Device Registry 리소스와 상호 작용하며 이러한 도구는 일시적인 오류를 자동으로 처리합니다. Resource Manager API를 직접 사용하는 경우 일시적인 오류를 처리해야 합니다.
가용성 영역 오류에 대한 복원력
가용성 영역은 Azure 지역 내에서 물리적으로 별도의 데이터 센터 그룹입니다. 한 영역이 실패하면 서비스가 나머지 영역 중 하나로 장애 조치될 수 있습니다.
Azure Device Registry는 기본적으로 영역 중복이므로 여러 가용성 영역에 데이터를 자동으로 복제합니다. 이 설정은 고가용성을 제공하여 서비스의 복원력을 향상시킵니다. 한 영역에 오류가 있는 경우 서비스는 다른 영역에서 원활하게 계속 작동할 수 있습니다.
Microsoft는 Azure 장치 레지스트리에서 영역 중복에 대한 설정 및 구성을 관리합니다. 이 영역 중복을 사용하도록 설정하기 위해 더 이상 구성을 수행할 필요가 없습니다. Microsoft는 서비스가 최고 수준의 가용성 및 안정성을 제공하도록 구성되어 있는지 확인합니다.
지역 지원
다음 지역 목록은 Device Registry에서 가용성 영역을 지원합니다.
| Americas | Europe |
|---|---|
| East US | 독일 중서부 |
| 미국 동부 2 | North Europe |
| West US | West Europe |
| 미국 서부 2 | |
| 미국 서부 3 |
Cost
Device Registry에 영역 중복성을 사용하는 데 추가 비용은 없습니다.
가용성 영역 지원 구성
새 리소스: Azure IoT Operations에서 Device Registry 리소스를 만들 때 기본적으로 영역 중복성이 자동으로 포함됩니다. 더 이상 구성을 수행할 필요가 없습니다.
모든 영역이 정상인 경우의 동작
다음 정보는 영역 중복 디바이스 레지스트리가 있고 모든 가용성 영역이 작동할 때 발생하는 상황에 대해 설명합니다.
영역 간의 트래픽 라우팅: 요청은 각 가용성 영역에 자동으로 분산됩니다. 요청은 가용성 영역의 Device Registry 인스턴스로 이동될 수 있습니다.
영역 간 데이터 복제: 디바이스 데이터는 가용성 영역에서 동기적으로 복제됩니다.
영역 오류 중 동작
다음 정보는 영역 중복 디바이스 레지스트리가 있고 가용성 영역에서 중단이 발생할 때 발생하는 상황에 대해 설명합니다.
- 검색 및 응답: Device Registry는 가용성 영역의 오류를 감지하고 자동으로 응답하므로 가용성 영역 장애 조치(failover)를 시작하기 위해 아무 작업도 수행할 필요가 없습니다.
- 알림: 영역이 다운된 경우 Microsoft는 자동으로 알리지 않습니다. 그러나 Azure Service Health 를 사용하여 영역 오류를 포함하여 서비스의 전반적인 상태를 파악할 수 있으며, 문제를 알리도록 Service Health 경고를 설정할 수 있습니다.
활성 요청: 일부 활성 요청은 삭제될 수 있으므로 다른 일시적인 오류와 동일한 방식으로 다시 시도해야 할 수 있습니다. 애플리케이션이 일시적인 오류에 대해 복원력이 있는지 확인하려면 일시적인 오류에 대한 복원력을 참조하세요.
예상 데이터 손실: 영역 오류로 인해 데이터가 손실될 것으로 예상되지 않습니다.
예상 가동 중지 시간: 영역 장애로 인해 리소스의 가동 중단이 예상되지는 않습니다.
영역 복구
가용성 영역이 복구되면 Device Registry는 가용성 영역에서 작업을 자동으로 복원합니다.
영역 오류 테스트
Device Registry 플랫폼은 가용 영역에서 트래픽 라우팅, 장애 조치 및 장애 복구를 관리합니다. 아무것도 시작할 필요가 없습니다. 이 기능은 완전히 관리되므로 가용성 영역 오류 프로세스의 유효성을 검사할 필요가 없습니다.
지역 전체 오류에 대한 복원력
디바이스 레지스트리는 단일 지역 서비스입니다. 지역을 사용할 수 없게 되면 Device Registry 리소스도 사용할 수 없습니다.
그러나 레지스트리의 데이터는 쌍을 이루는 지역에 복제됩니다. 장기간 지역 가동 중단이 발생할 경우 Microsoft는 쌍을 이루는 지역으로 장애 조치(failover)하도록 선택할 수 있습니다. 이 경우 레지스트리는 쌍을 이루는 지역에서 계속 사용할 수 있습니다.
지역 지원
디바이스 레지스트리를 사용할 수 있는 모든 지역에서는 이러한 지역이 모두 쌍으로 이루어져 있기 때문에 기본 복제 및 장애 조치(failover)가 지원됩니다.
Cost
지역 간 데이터 복제 또는 장애 조치(failover)에 대한 추가 비용은 없습니다.
복제 구성 및 장애 조치 준비
기본적으로 상호 지역 간 데이터 복제는 페어링된 지역에서 Device Registry 리소스를 생성할 때 자동으로 구성됩니다. 이 프로세스는 기본 옵션이며 사용자가 개입할 필요가 없습니다.
모든 지역이 정상인 경우의 동작
이 섹션에서는 지역 간 복제 및 장애 조치(failover)를 위해 디바이스 레지스트리가 구성되고 주 지역이 작동할 때 예상되는 사항에 대해 설명합니다.
지역 간 데이터 복제: 데이터는 쌍을 이루는 지역에 자동으로 복제됩니다. 복제는 비동기적으로 발생합니다. 따라서 장애 조치 전환이 발생할 경우 일부 데이터 손실이 예상됩니다.
지역 간 트래픽 라우팅: 정상적인 작업에서 트래픽은 주 지역으로만 흐릅니다.
지역 오류 중 동작
이 섹션에서는 지역 간 복제 및 장애 조치(failover)를 위해 디바이스 레지스트리를 구성하고 주 지역에 중단이 발생할 때 예상되는 사항에 대해 설명합니다.
검색 및 응답: Microsoft는 주 지역이 손실된 경우 장애 조치(failover)를 수행할 수 있습니다. 이 프로세스는 주 지역이 손실된 후 몇 시간 또는 일부 시나리오에서 더 오래 걸릴 수 있습니다. 디바이스 레지스트리 리소스의 장애 조치는 다른 Azure 서비스와 동시에 이루어지지 않을 수 있습니다.
통지: Azure Service Health를 통해 지역 오류 이벤트를 모니터링할 수 있습니다. 지역 수준 문제에 대한 알림을 받도록 경고를 설정합니다.
활성 요청: 장애 조치(failover) 중에 주 지역이 처리 중인 모든 요청은 손실될 수 있습니다. 클라이언트는 장애 조치(failover)가 완료된 후 요청을 다시 시도해야 합니다.
예상 데이터 손실: 데이터는 쌍을 이루는 지역에 비동기적으로 복제됩니다. 따라서 장애 전환 후 일부 데이터 손실이 예상됩니다. 지역 장애 시 전환 후 15분 미만의 데이터 손실을 예상할 수 있습니다.
예상 가동 중지 시간: 지역이 손실된 시점부터 쌍을 이루는 지역에서 리소스를 사용할 수 있는 시점까지 약 24시간의 가동 중지 시간을 예상합니다.
트래픽 경로 변경: 장애 조치(failover) 프로세스 중에 Device Registry는 DNS 레코드를 업데이트하여 쌍을 이루는 지역을 가리킵니다. 모든 후속 요청은 쌍을 이루는 지역으로 전송됩니다.
레지스트리에 대한 장애 조치(failover) 작업이 완료되면 수동 개입 없이 디바이스 및 백 엔드 애플리케이션의 모든 작업이 계속 작동해야 합니다.
지역 복구
주 지역이 복구되면 Device Registry는 해당 지역의 작업을 자동으로 복원합니다.
지역 오류 테스트
디바이스 레지스트리 플랫폼은 페어링된 지역 간의 트래픽 라우팅, 장애 조치(failover), 및 장애 복구(failback)를 관리합니다. 아무것도 시작할 필요가 없습니다. 이 기능은 완전히 관리되므로 쌍을 이루는 지역 오류 프로세스의 유효성을 검사할 필요가 없습니다.