클라우드 규모 분석은 배포 및 거버넌스를 간소화하기 위해 Azure 랜딩 존을 기반으로 합니다. Azure 랜딩 존의 주요 목적은 Azure에 애플리케이션 또는 워크로드를 배포할 때 필요한 인프라가 이미 있는지 확인하는 것입니다. 클라우드 규모 분석 랜딩 존을 배포하기 전에, 플랫폼 랜딩 존이 포함된 Azure 랜딩 존 아키텍처를 배포할 수 있도록 Azure용 클라우드 채택 프레임워크를 먼저 검토해야 합니다.
소버린 워크로드의 경우 Microsoft는 Azure 랜딩 존의 변형인 SLZ(소버린 랜딩 존)를 제공합니다. SLZ는 고급 소버린 제어가 필요한 조직을 위한 것입니다. 클라우드 규모 분석은 이 Azure 랜딩 존 변형에 대해 배포할 수 있습니다.
클라우드 규모 분석에는 애플리케이션 랜딩 존에 배포하는 작업이 포함됩니다. 이러한 존은 일반적으로 랜딩 존 관리 그룹에 속합니다. 정책은 Microsoft에서 제공하는 샘플 템플릿으로 필터링합니다.
데이터 레이크 하우스 및 데이터 메시 배포에 이러한 샘플 템플릿을 사용할 수 있습니다.
클라우드 규모 분석 평가
비즈니스는 특정 사용 사례 또는 프로젝트 또는 엔드 투 엔드 클라우드 규모 분석에 대한 기술 세부 정보를 정의하기 전에 명확성 또는 규범적 지침을 찾는 경우가 많습니다. 비즈니스는 전체 데이터 전략을 수립하므로 현재 사용 범위의 모든 필수 및 전략적 원칙을 고려하는 것이 어려울 수 있습니다.
이러한 문제를 고려하면서 이 엔드 투 엔드 인사이트 구현의 제공 속도를 높이기 위해 Microsoft는 클라우드 규모 분석을 위한 규범적 시나리오를 개발했습니다. 클라우드 규모 분석을 위한 계획 개발에서 설명하는 주요 테마와 일치합니다.
클라우드 규모 분석은 클라우드 채택 프레임워크를 기반으로 하며 Azure Well-Architected Framework의 원칙을 적용합니다. 클라우드 채택 프레임워크는 클라우드 운영 모델, 참조 아키텍처 및 플랫폼 템플릿에 대한 규범적인 지침 및 모범 사례를 제공합니다. 이 지침은 가장 도전적이고 정교하며 복잡한 환경의 실제 경험을 기반으로 합니다.
클라우드 규모 분석을 사용하면 분석 워크로드를 호스트하고 실행하기 위해 랜딩 존을 빌드하고 운영할 준비를 할 수 있습니다. 향상된 보안, 거버넌스 및 규정 준수를 기반으로 랜딩 존을 구축합니다. 랜딩 존은 확장 가능하고 모듈식이지만 자율성과 혁신을 지원합니다.
데이터 아키텍처의 기록
1980년대 후반, 데이터 웨어하우스 1세대가 도입되었습니다. 이 모델은 기업 전체의 서로 다른 데이터 원본을 결합합니다. 2000년대 후반, Hadoop 및 데이터 레이크와 같은 빅 데이터 에코시스템이 도입되어 2세대가 등장했습니다. 2010년대 중반에 클라우드 데이터 플랫폼을 도입했습니다. Kappa 또는 람다 아키텍처와 같은 스트리밍 데이터 수집이 도입되었습니다. 2020년대 초반에는 데이터 레이크하우스, 데이터 메시, 데이터 패브릭 및 데이터 중심 운영 패턴이 도입되었습니다.
이러한 발전에도 불구하고 많은 조직에서는 여전히 중앙 집중식 모놀리식 플랫폼인 1세대를 사용합니다. 이 시스템은 한 지점까지는 잘 작동합니다. 그러나 상호 종속된 프로세스, 긴밀하게 결합된 구성 요소 및 하이퍼스페이스화된 팀으로 인해 병목 현상이 발생할 수 있습니다. ETL(추출, 변환 및 로드) 작업이 두드러지고 제공 타임라인이 느려질 수 있습니다.
데이터 웨어하우스 및 데이터 레이크는 여전히 중요하며 전체 아키텍처에서 중요한 역할을 합니다. 다음 설명서에서는 이러한 기존 사례를 크기 조정에 사용할 때 발생할 수 있는 몇 가지 문제를 강조 표시합니다. 이러한 과제는 데이터 원본, 요구 사항, 팀 및 출력이 변경되는 복잡한 조직과 특히 관련이 있습니다.
클라우드 규모 분석으로 이동
현재 분석 데이터 아키텍처 및 운영 모델에는 데이터 웨어하우스, 데이터 레이크 및 데이터 레이크하우스 구조, 데이터 패브릭 또는 데이터 메시가 포함될 수 있습니다.
각 데이터 모델에는 고유한 장점과 과제가 있습니다. 클라우드 규모 분석을 사용하면 인프라와 함께 진화할 수 있도록 현재 접근 방식을 데이터 관리로 전환할 수 있습니다.
모든 데이터 플랫폼 및 시나리오를 지원하여 토대 역할을 하고 확장을 가능하게 하는 엔드투엔드 클라우드 규모 분석 프레임워크를 만들 수 있습니다.
최신 데이터 플랫폼 및 원하는 결과
첫 번째 단계 중 하나는 확장 가능하고 민첩한 최신 데이터 플랫폼을 반복적으로 구축하여 문제를 해결하기 위해 데이터 전략을 활성화하는 것입니다.
서비스 티켓에 압도당하고 경쟁 비즈니스 요구 사항을 충족하려고 하는 대신 최신 데이터 플랫폼을 구현할 때 더 가치 있는 작업에 집중할 시간을 확보할 수 있기 때문에 보다 협의적인 역할을 할 수 있습니다. 데이터 및 분석 요구 사항을 셀프 서비스할 수 있는 플랫폼 및 시스템을 통해 비즈니스 라인을 제공하는 것입니다.
다음은 초기 포커스의 권장 영역입니다.
- 데이터 품질을 개선하고, 신뢰를 촉진하고, 인사이트를 확보하여 데이터 기반 비즈니스 의사 결정을 내립니다.
- 조직 전체에서 전체적인 데이터, 관리 및 분석을 대규모로 구현합니다.
- 셀프 서비스 및 비즈니스 라인에 대한 유연성을 실현할 수 있도록 하는 강력한 데이터 거버넌스를 수립합니다.
- 완전히 통합된 환경에서 보안 및 법적 규정 준수를 유지 관리합니다.
- 잘 설계되고 반복 가능한 모듈식 패턴의 기본 솔루션을 사용하여 고급 분석 기능의 기반을 빠르게 만듭니다.
분석 자산 제어
두 번째 고려 사항은 조직에서 데이터 거버넌스를 구현하는 방법을 결정하는 것입니다.
데이터 거버넌스는 비즈니스 운영, 보고서 및 분석에 사용하는 데이터를 검색 가능하고 정확하며 신뢰할 수 있으며 보호할 수 있도록 하는 프로세스입니다.
많은 기업의 경우 데이터와 AI가 경쟁 우위를 주도할 것이라고 기대합니다. 따라서 경영진은 AI 이니셔티브를 후원하여 데이터 중심이 되겠다는 의지를 갖고 있습니다. 그러나 AI가 효과적이려면 신뢰할 수 있는 데이터를 사용해야 합니다. 그렇지 않으면 의사 결정 정확도가 손상되거나, 의사 결정이 지연되거나, 작업이 누락되어 결과에 영향을 줄 수 있습니다. 기업은 데이터 품질이 저하되는 것을 원하지 않습니다. 디지털 변환이 데이터에 미치는 영향을 검토할 때까지는 데이터 품질을 수정하는 것이 간단해 보일 수 있습니다.
하이브리드 다중 클라우드 및 분산 데이터 지형에 걸쳐 데이터가 분산된 조직은 데이터가 어디에 있는지 찾고 제어하는 데 어려움을 겪습니다. 관리되지 않는 데이터는 비즈니스에 상당한 영향을 미칠 수 있습니다. 데이터 오류로 인해 프로세스 오류 및 지연이 발생하므로 데이터 품질이 저하되면 비즈니스 운영에 영향을 줍니다. 데이터 품질 저하는 비즈니스 의사 결정과 규정을 준수하는 기능에도 영향을 줍니다. 분석 시스템의 품질 문제를 해결하는 것이 수집 단계 초기에 데이터 품질 규칙을 적용하는 것보다 더 복잡하고 비용이 많이 들 수 있기 때문에 원본에서 데이터 품질을 보장하는 것이 좋습니다. 데이터 활동을 추적하고 관리하려면 데이터 거버넌스에 다음이 포함되어야 합니다.
- 데이터 검색.
- 데이터 품질.
- 정책 만들기.
- 데이터 공유.
- 메타데이터.
분석 자산 보호
데이터 거버넌스의 또 다른 주요 동인은 데이터 보호입니다. 데이터 보호는 규정 준수를 보장하고 데이터 위반을 방지할 수 있습니다. 데이터 개인 정보 보호와 증가하는 데이터 위반으로 인해 데이터 보호가 최우선 순위가 되었습니다. 데이터 위반은 개인 식별 가능한 고객 데이터와 같은 중요한 데이터에 대한 위험을 강조합니다. 데이터 개인 정보 침해 또는 데이터 보안 위반의 결과에는 다음이 포함될 수 있습니다.
- 브랜드 이미지에 심각한 손상.
- 고객 신뢰도 및 시장 점유율 손실.
- 투자 및 임원 급여에 대한 이해 관계자 수익에 영향을 미치는 주가 하락.
- 감사 또는 규정 준수 오류로 인한 상당한 재정적 처벌.
- 법적 조치.
- 예를 들어 위반의 보조 효과는 고객이 신원 도용의 희생자가 될 수 있습니다.
대부분의 경우 공개적으로 인용된 회사는 위반을 선언해야 합니다. 위반이 발생하면 고객은 해커가 아닌 회사를 비난 할 가능성이 높습니다. 고객은 몇 달 동안 회사를 보이콧하거나 돌아오지 않을 수 있습니다.
데이터 개인 정보 보호에 대한 규제 법률을 준수하지 않으면 상당한 재정적 처벌을 받을 수 있습니다. 데이터를 관리하면 이러한 위험을 방지하는 데 도움이 됩니다.
운영 모델 및 이점
최신 데이터 전략 플랫폼을 채택한다고 해서 조직에서 사용하는 기술이 바뀌는 것은 아닙니다. 또한 조직 운영 방식도 변경됩니다.
클라우드 규모 분석은 다음을 포함하여 직원을 구성하고 교육하는 데 도움이 되는 지침을 제공합니다.
- 페르소나, 역할 및 책임 정의.
- 민첩성, 수직 및 도메인 간 팀을 위한 제안된 구조입니다.
- Microsoft Learn을 통한 Azure 데이터 및 AI 인증을 포함한 교육 리소스.
또한 현대화 프로세스 전반에 걸쳐 최종 사용자를 참여시키고 플랫폼을 계속 발전시키고 새로운 사용 사례를 온보딩하는 것이 중요합니다.
아키텍처
Azure 랜딩 존은 사용자 환경에 대한 전략적 디자인 경로 및 대상 기술 상태를 나타냅니다. 배포 및 거버넌스를 더 쉽게 만들어 민첩성과 규정 준수를 개선할 수 있습니다. 또한 새 애플리케이션 또는 워크로드가 환경에 추가되면 적절한 인프라가 이미 마련되어 있는지 확인합니다. Microsoft SaaS(Software as a Service) 거버넌스 및 분석 솔루션과 통합된 Azure 데이터 관리 및 데이터 랜딩 존은 이러한 기본 원칙을 염두에 두고 설계되었으며 클라우드 규모 분석의 다른 요소와 결합하면 다음을 사용하도록 설정할 수 있습니다.
- 셀프 서비스.
- Scalability.
- 빠른 시작.
- 보안.
- Privacy.
- 최적화된 작업.
데이터 관리 랜딩 존
데이터 관리 랜딩 존은 조직 전체에서 플랫폼의 중앙 집중식 데이터 거버넌스 및 관리를 위한 기반을 제공합니다. 또한 다중 클라우드 및 하이브리드 인프라를 포함하여 전체 디지털 자산에서 데이터를 수집하는 통신을 용이하게 합니다.
데이터 관리 랜딩 존은 다음과 같은 다양한 기타 데이터 관리 및 거버넌스 기능을 지원합니다.
- 데이터 카탈로그.
- 데이터 품질 관리.
- 데이터 분류.
- 데이터 계보.
- 데이터 모델링 리포지토리.
- API 카탈로그.
- 데이터 공유 및 계약.
팁
데이터 카탈로그, 데이터 품질 관리 또는 데이터 계보 기능에 파트너 솔루션을 사용하는 경우 데이터 관리 랜딩 존에 상주해야 합니다. 또는 Microsoft Purview를 SaaS 솔루션으로 배포하여 데이터 관리 랜딩 존과 데이터 랜딩 존 모두에 연결할 수 있습니다.
데이터 랜딩 존
데이터 랜딩 존은 데이터 관리 랜딩 존과의 연결을 통해 공통 관리 및 거버넌스를 유지하면서 데이터를 사용자에게 더 가까이 가져오고 셀프 서비스를 가능하게 합니다.
데이터 제품 및 시각화와 같은 사용자 지정 외에도 네트워킹, 모니터링 및 데이터 수집 및 처리와 같은 표준 서비스를 호스트합니다.
데이터 랜딩 존은 플랫폼의 확장성 지원에 있어 핵심 요소입니다. 조직의 크기와 요구 사항에 따라 하나 또는 여러 개의 랜딩 존으로 시작할 수 있습니다.
단일 및 여러 랜딩 존 중에서 결정할 때 지역 종속성 및 데이터 상주 요구 사항을 고려합니다. 예를 들어 특정 위치에 데이터를 유지하도록 요구하는 현지 법률이나 규정이 있는지 고려해볼 수 있습니다.
초기 결정과 무관하게 필요에 따라 데이터 랜딩 존을 추가 또는 제거할 수 있습니다. 단일 랜딩 존으로 시작하는 경우 마이그레이션에 대한 향후 요구를 방지하기 위해 여러 랜딩 존으로 확장하는 것이 좋습니다.
참고 항목
Microsoft Fabric이 배포되는 경우 데이터 랜딩 존은 데이터 레이크 및 기타 Azure 데이터 서비스와 같은 비 SaaS 솔루션을 호스트합니다.
랜딩 존에 대한 자세한 내용은 클라우드 규모 분석을 위한 Azure 랜딩 존을 참조하세요.
결론
이 설명서 집합, 특히 거버넌스, 보안, 운영 및 모범 사례 섹션을 읽은 후에는 배포 템플릿을 사용하여 개념 증명 환경을 설정하는 것이 좋습니다. 이러한 템플릿은 아키텍처 지침과 함께 일부 Azure 및 Microsoft SaaS 기술에 대한 실습 경험을 제공합니다. 자세한 내용은 시작하기 체크리스트를 참조하세요.