다음을 통해 공유


Microsoft Fabric을 사용하여 엔터프라이즈 BI 솔루션 설계

Microsoft Fabric
Azure Blob Storage
Microsoft Entra ID
Power BI

이 문서에서는 온-프레미스 데이터 웨어하우스에서 클라우드 환경으로 데이터를 전송한 다음 BI(비즈니스 인텔리전스) 모델을 사용하여 데이터를 제공하는 방법을 설명합니다. 이 방법을 최종 목표로 사용하거나 클라우드 기반 구성 요소를 사용하여 전체 현대화를 위한 첫 번째 단계로 사용할 수 있습니다.

이 지침은 Microsoft Fabric 엔드 투 엔드 시나리오를 기반으로 합니다. 온-프레미스 SQL 서버에서 데이터를 추출할 수 있는 여러 옵션이 있습니다. 패브릭 데이터 팩토리 파이프라인, 미러링, 데이터 복사 작업, 그리고 패브릭 실시간 이벤트 스트림을 위한 SQL용 변경 데이터 캡처(CDC) 등이 포함됩니다. 추출 후에는 분석을 위해 데이터가 변환됩니다.

아키텍처

Fabric을 사용하는 엔터프라이즈 BI 아키텍처를 보여 주는 다이어그램

이 아키텍처의 Visio 파일을 다운로드합니다.

워크플로

다음 워크플로는 이전 다이어그램에 해당합니다.

데이터 원본

  • Azure의 SQL Server 데이터베이스에는 원본 데이터가 포함됩니다. 온-프레미스 환경을 시뮬레이션하기 위해 이 시나리오에 대한 배포 스크립트는 Azure SQL 데이터베이스를 구성합니다. AdventureWorks 샘플 데이터베이스는 원본 데이터 스키마 및 샘플 데이터로 사용됩니다. 자세한 내용은 SQL Server 데이터 복사 및 변환참조하세요.

수집 및 데이터 스토리지

  • Fabric OneLake 는 전체 조직을 위한 단일 통합 논리 데이터 레이크입니다. 이 SaaS는 데이터 엔지니어링 레이크하우스 워크로드를 위한 Fabric Lakehouse , 데이터 웨어하우스 워크로드용 패브릭 웨어하우스 , 대용량 시계열 및 로그 데이터 세트를 위한 패브릭 Eventhouse 와 같은 다양한 데이터 스토리지 옵션을 제공합니다.

  • Fabric Data Factory 파이프라인을 사용하면 대규모로 다양한 작업을 수행할 수 있는 복잡한 ETL(추출, 변환, 로드) 및 데이터 팩터리 워크플로를 빌드할 수 있습니다. 제어 흐름 기능은 루프 및 조건부를 제공하는 워크플로 논리를 빌드할 수 있는 데이터 파이프라인에 기본 제공됩니다. 이 아키텍처에서 메타데이터 기반 프레임워크를 사용하면 대규모로 여러 테이블을 증분 수집할 수 있습니다.

  • Fabric Data Factory 미러링을 사용하면 복잡한 ETL 프로세스를 방지하고 기존 SQL Server 자산을 Fabric의 나머지 데이터와 통합할 수 있습니다. 기존 SQL Server 데이터베이스를 Fabric OneLake에 직접 지속적으로 복제할 수 있습니다. Fabric Data Factory 복사 작업을 사용하면 파이프라인 없이 원본에서 대상으로 데이터를 쉽게 이동할 수 있습니다. 데이터 전송은 확장 가능한 성능을 지원하는 일괄 처리 및 증분 복사에 대한 기본 제공 패턴을 통해 구성할 수 있습니다.

  • 패브릭 이벤트 스트림은 CDC 추출을 사용하여 VM(가상 머신)에 호스트된 SQL Server 데이터베이스에서 높은 처리량의 실시간 데이터 수집을 제공합니다. 이 패턴은 실시간 대시보드 및 경고가 필요한 사용 사례에 적합합니다.

분석 및 보고

Components

  • Azure SQL Database Azure에서 호스트되는 PaaS SQL 서버입니다. 이 아키텍처에서 SQL Database는 원본 데이터를 제공하고 마이그레이션 시나리오에 대한 데이터 흐름을 보여 줍니다.

  • OneLake 는 조직 전체에 구조화된 데이터와 구조화되지 않은 데이터를 모두 저장하기 위한 통합된 클라우드 기반 데이터 레이크입니다. 이 아키텍처에서 OneLake는 중앙 스토리지 계층 역할을 합니다. 이 시스템은 분석 및 보고 목적으로 데이터를 지속적으로 관리하고 체계적으로 구성하기 위해 Fabric Lakehouse, Fabric Warehouse, Fabric Eventhouse 및 미러된 데이터베이스와 같은 아티팩트를 사용합니다.

  • Fabric Data Warehouse 는 큰 데이터 세트에 대한 데이터 웨어하우스 워크로드를 호스트하는 SaaS 제품입니다. 이 아키텍처에서 Fabric Data Warehouse는 차원 데이터 세트의 최종 저장소 역할을 하며 분석 및 보고를 지원합니다.

  • Power BI 는 패브릭 컴퓨팅에서 호스트되는 비즈니스 인텔리전스 도구입니다. 비즈니스 사용자가 Fabric Data Warehouse 및 기타 원본의 데이터를 기반으로 대시보드 및 보고서와 상호 작용할 수 있도록 이 시나리오에서 데이터를 표시하고 시각화합니다.

  • Microsoft Entra ID 인증 및 권한 부여 흐름을 지원하는 다중 클라우드 ID 및 네트워크 솔루션 제품군입니다. 이 아키텍처에서 Microsoft Entra ID는 Power BI 및 Fabric 리소스에 연결하는 사용자에게 안전한 액세스를 제공합니다.

시나리오 세부 정보

이 시나리오에서 조직에는 대규모 온-프레미스 데이터 웨어하우스를 포함하는 SQL 데이터베이스가 있습니다. 조직은 Fabric을 사용하여 데이터를 수집 및 분석하고 Power BI를 통해 사용자에게 분석 인사이트를 제공하려고 합니다.

이 아키텍처를 사용하는 경우

엔터프라이즈 비즈니스 인텔리전스에 대한 비즈니스 요구 사항을 충족하기 위해 다양한 방법을 사용할 수 있습니다. 현재 기술 투자, 인적 기술, 현대화 타임라인, 미래 목표, PaaS(Platform as a Service) 또는 SaaS(Software as a Service)를 선호하는지 여부와 같은 다양한 측면이 비즈니스 요구 사항을 정의합니다.

다음 디자인 방법을 고려합니다.

이 문서의 아키텍처에서는 패브릭 레이크하우스 또는 패브릭 웨어하우스를 엔터프라이즈 의미 체계 모델의 영구 계층으로 사용하고 비즈니스 인텔리전스에 Power BI를 사용한다고 가정합니다. 이 SaaS 접근 방식은 다양한 비즈니스 요구 사항 및 기본 설정을 수용할 수 있는 유연성을 제공합니다.

Authentication

Microsoft Entra ID는 Power BI 대시보드 및 앱에 연결하는 사용자를 인증합니다. SSO(Single Sign-On)는 사용자를 Fabric 웨어하우스 및 Power BI 의미 체계 모델의 데이터에 연결합니다. 권한 부여는 원본에서 발생합니다.

증분 로드

자동화된 ETL 또는 ELT 프로세스를 실행하는 경우 이전 실행 이후 변경된 데이터만 로드해야 합니다. 이 프로세스를 증분 로드라고 합니다. 반면 전체 로드는 모든 데이터를 로드합니다. 증분 로드를 수행하려면 변경된 데이터를 식별하는 방법을 결정합니다. 높은 워터 마크 값 접근 방식을 사용하여 원본 테이블에서 날짜-시간 열 또는 고유 정수 열의 최신 값을 추적할 수 있습니다.

SQL Server에서 임시 테이블 사용할 수 있습니다. 임시 테이블은 데이터 변경 기록을 저장하는 시스템 버전 테이블입니다. 데이터베이스 엔진은 별도 기록 테이블의 모든 변경 기록을 자동으로 레코드합니다. 기록 데이터를 쿼리하려면 쿼리에 FOR SYSTEM_TIME 절을 추가할 수 있습니다. 내부적으로 데이터베이스 엔진은 기록 테이블을 쿼리하지만 애플리케이션에 투명합니다.

임시 테이블은 차원 데이터를 지원하며 시간이 지남에 따라 변경 될 수 있습니다. 팩트 테이블은 일반적으로 시스템 버전 기록을 유지하는 것이 의미가 없는 판매와 같은 변경할 수 없는 트랜잭션을 나타냅니다. 대신 트랜잭션에는 일반적으로 트랜잭션 날짜를 나타내는 열이 있습니다. 열은 워터마크 값으로 사용할 수 있습니다. 예를 들어 AdventureWorks 데이터 웨어하우스에서 SalesLT.* 테이블에는 LastModified 필드가 있습니다.

다음 단계에서는 ELT 파이프라인의 일반적인 흐름을 설명합니다.

  1. 원본 데이터베이스의 각 테이블의 경우 마지막 ELT 작업이 실행될 때 마감 시간을 추적하여, 데이터 웨어하우스에 이 정보를 저장합니다. (초기 설치 시 항상 시간은 1-1-1900로 설정돼 있습니다.)

  2. 데이터 내보내기 단계 중 마감 시간은 원본 데이터베이스의 저장 프로시저 집합에 매개 변수로 전달됩니다. 이러한 저장 프로시저는 중단 시간 후에 변경되거나 생성된 모든 레코드를 쿼리합니다. 예의 모든 테이블에 대해 ModifiedDate 열을 사용할 수 있습니다.

  3. 데이터 마이그레이션이 완료되면 마감 시간을 저장하는 테이블을 업데이트합니다.

데이터 파이프라인

이 시나리오에서는 AdventureWorks 샘플 데이터베이스를 데이터 원본으로 사용합니다. 증분 데이터 로드 패턴은 가장 최근 파이프라인 실행 후에 수정되거나 추가된 데이터만 로드되도록 합니다.

메타데이터 기반 수집 프레임워크

Fabric Data Factory 파이프라인 내 의 메타데이터 기반 수집 프레임워크 는 관계형 데이터베이스에 포함된 모든 테이블을 증분 방식으로 로드합니다. 이 문서에서는 데이터 웨어하우스를 원본으로 참조하지만 Azure SQL 데이터베이스를 원본으로 바꿀 수 있습니다.

  1. 워터마크 열을 선택합니다. 원본 테이블에서 새 레코드 또는 변경된 레코드를 추적하는 데 도움이 되는 열을 하나 선택합니다. 이 열에는 일반적으로 행을 추가하거나 업데이트할 때 증가하는 값(예: 타임스탬프 또는 ID)이 포함됩니다. 이 열에서 가장 높은 값을 워터마크 로 사용하여 중단된 위치를 알 수 있습니다.

  2. 마지막 워터마크 값을 저장하도록 테이블을 설정합니다.

  3. 다음 작업을 포함하는 파이프라인을 빌드합니다.

    • 두 가지 조회 작업입니다. 첫 번째 작업은 마지막 워터마크 값(마지막으로 중지한 위치)을 가져옵니다. 두 번째 작업은 새로운 워터마크 값(이번에 중지하는 지점의 값)을 가져옵니다. 두 값 모두 복사 작업으로 전달됩니다.

    • 워터마크 열 값이 이전 워터마크와 새 워터마크 사이에 있는 행을 찾는 복사 작업입니다. 그런 다음 데이터 웨어하우스에서 레이크하우스로 이 데이터를 새 파일로 복사합니다.

    • 새 워터마크 값을 저장하여 다음 파이프라인 실행의 시작점을 결정하는 저장 프로시저 작업입니다.

    다이어그램은 워터마크 값을 검색, 사용 및 업데이트하기 위한 활동의 순서도를 보여 줍니다.

다음 이미지는 완료된 파이프라인을 보여줍니다. 자세한 내용은 증분 수집을 참고하십시오.

스크린샷은 워터마크 값을 가져오기 위한 조회 활동이 있는 미디어 수집 파이프라인, 새 데이터에 대한 복사 작업 및 워터마크를 업데이트하는 저장 프로시저를 보여줍니다.

패브릭 데이터 웨어하우스에 데이터 로드

복사 작업은 SQL 데이터베이스에서 패브릭 데이터 웨어하우스로 데이터를 복사합니다. 이 예제의 SQL 데이터베이스는 Azure에 있으므로 연결 및 게이트웨이 관리 아래의 패브릭 포털 내에서 설정된 연결을 사용합니다.

Fabric Data Factory 파이프라인 사용

Fabric Data Factory의 파이프라인은 증분 부하 패턴을 완료하기 위해 정렬된 작업 집합을 정의합니다. 수동 또는 자동 트리거는 파이프라인을 시작합니다.

데이터 변환

변환이 필요한 경우 패브릭 데이터 흐름을 사용하여 데이터를 재구성하는 낮은 코드의 AI 지원 ETL 변환을 디자인합니다. 패브릭 데이터 흐름은 파워 쿼리 엔진을 사용하여 이러한 변환을 적용하고 결과를 Fabric Data Warehouse에 씁니다.

프로덕션 환경에서 는 Fabric Notebook을 사용하여 Apache Spark에서 구동하는 분산 컴퓨팅 프레임워크를 통해 큰 데이터 세트에 적합한 ETL 변환을 구현합니다.

비고

네이 티브 실행 엔진 을 사용하여 데이터 엔지니어링 또는 ETL 워크로드를 실행합니다.

Power BI를 패브릭 용량과 함께 사용하여 데이터를 액세스, 모델링 및 시각화하세요.

Power BI의 패브릭 용량은 Azure 데이터 원본에 연결하기 위한 여러 스토리지 모드를 지원합니다.

  • 수입: 메모리 내 쿼리를 위해 Power BI 의미 체계 모델에 데이터를 로드합니다.

  • DirectQuery: 메모리에 데이터를 로드하지 않고 관계형 스토리지에 대해 직접 쿼리를 실행합니다.

  • 복합 모델: 일부 테이블의 가져오기 모드를 동일한 데이터 세트의 다른 테이블에 대한 DirectQuery와 결합합니다.

  • Direct Lake: 패브릭 작업 영역 의미 체계 모델에서 OneLake에 저장된 델타 테이블을 쿼리합니다. 요청 시 메모리에 데이터를 로드하여 대형 테이블의 대화형 분석에 최적화되어 있습니다.

이 시나리오에서는 적은 양의 데이터와 모델 복잡성이 낮기 때문에 DirectQuery 대시보드를 사용합니다. DirectQuery는 쿼리를 기본 컴퓨팅 엔진에 위임하고 원본에서 보안 기능을 사용합니다. DirectQuery는 결과가 항상 최신 원본 데이터와 일치하도록 합니다.

가져오기 모드는 가장 낮은 쿼리 대기 시간을 제공할 수 있습니다. 다음 요소가 참인 경우 가져오기 모드를 고려합니다.

  • 모델은 Power BI의 메모리 내에 완전히 맞습니다.
  • 새로 고침 간의 데이터 대기 시간은 허용됩니다.
  • 원본 시스템과 최종 모델 간에 복잡한 변환이 필요합니다.

이 경우 사용자는 Power BI 새로 고침에 지연 없이 최신 데이터에 대한 모든 액세스 권한을 원하며 Power BI 데이터 세트 용량을 초과하는 모든 기록 데이터를 원합니다. Power BI 데이터 세트는 용량 크기에 따라 25GB에서 400GB까지 처리할 수 있습니다. 전용 SQL 풀의 데이터 모델은 이미 별모양 스키마에 있으며 변환이 필요하지 않으므로 DirectQuery가 적절한 선택입니다.

스크린샷은 판매 메트릭, 추세 차트, 필터 및 자세한 데이터 테이블이 있는 Power BI 대시보드를 보여줍니다.

Power BI를 사용하여 큰 모델, 페이지를 매긴 보고서 및 배포 파이프라인을 관리합니다. 기본 제공 Azure Analysis Services 엔드포인트를 활용합니다. 고유한 가치 제안을 통해 전용 용량을 가질 수도 있습니다.

BI 모델이 증가하거나 대시보드 복잡성이 증가하면 복합 모델로 전환하고 하이브리드 테이블을 통해 조회 테이블의 일부를 가져오고 사전 집계된 데이터를 가져올 수 있습니다. 가져온 데이터 세트에 대해 Power BI 내에서 쿼리 캐싱 사용하도록 설정하고 스토리지 모드 속성에 이중 테이블을 사용할 수 있습니다.

복합 모델 내에서 데이터 세트는 가상 통과 계층 역할을 합니다. 사용자가 시각화와 상호 작용할 때 Power BI는 Fabric Data Warehouse에 대한 SQL 쿼리를 생성합니다. Power BI는 효율성에 따라 메모리 내 또는 DirectQuery 스토리지를 사용할지 여부를 결정합니다. 엔진은 메모리 내에서 DirectQuery로 전환할 시기를 결정하고 논리를 패브릭 데이터 웨어하우스로 푸시합니다. 쿼리 테이블의 컨텍스트에 따라 캐시(가져온) 또는 캐시되지 않은 복합 모델로 사용할 수 있습니다. 메모리에 캐시할 테이블을 선택하거나, 하나 이상의 DirectQuery 원본에서 데이터를 결합하거나, DirectQuery 원본 데이터와 가져온 데이터를 결합할 수 있습니다.

Fabric 데이터 웨어하우스 또는 레이크하우스에서 DirectQuery를 사용하는 경우 다음 작업을 수행합니다.

  • 패브릭 Z-Order 및 V-Order 를 사용하여 델타 형식 파일에서 기본 테이블 데이터의 스토리지를 최적화하여 쿼리 성능을 향상시킵니다.

  • Fabric Lakehouse 구체화된 뷰 를 사용하여 테이블과 같은 데이터를 사전 계산, 저장 및 유지 관리합니다. 구체화된 뷰에서 모든 데이터 또는 데이터의 하위 집합을 사용하는 쿼리는 정의된 구체화된 뷰를 직접 참조하지 않고도 더 빠른 성능을 얻을 수 있습니다.

고려 사항

이러한 고려 사항은 워크로드의 품질을 향상시키는 데 사용할 수 있는 일련의 기본 원칙인 Azure Well-Architected Framework의 핵심 요소를 구현합니다. 자세한 내용은 Well-Architected Framework를 참조하세요.

Reliability

안정성은 애플리케이션이 고객에 대한 약정을 충족할 수 있도록 하는 데 도움이 됩니다. 자세한 내용은 안정성에 대한 디자인 검토 검사 목록을 참조하세요.

안정성 문서에서는 패브릭이 지역 간 복구 및 비즈니스 연속성과 함께 가용성 영역을 통한 지역 복원력을 포함하여 안정성을 지원하는 방법을 설명합니다. Fabric의 용량 설정 페이지에는 재해 복구 스위치가 있습니다. Azure 지역 쌍이 Fabric 서비스가 운영되는 지역과 일치하는 곳에서 사용할 수 있습니다. 재해 복구 용량 설정을 켜면 지역 간 복제가 OneLake 데이터에 대한 재해 복구 기능 으로 사용하도록 설정됩니다.

Security

보안은 의도적인 공격 및 중요한 데이터 및 시스템의 오용에 대한 보증을 제공합니다. 자세한 내용은 보안성에 대한 디자인 검토 검사 목록을 참조하세요.

클라우드 현대화는 데이터 위반, 맬웨어 감염 및 악성 코드 주입과 같은 보안 문제를 소개합니다. 부적절한 보안 조치가 주요 문제를 일으킬 수 있으므로 문제를 해결할 수 있는 클라우드 공급자 또는 서비스 솔루션이 필요합니다.

이 시나리오에서는 네트워크, ID, 개인 정보 보호 및 권한 부여 컨트롤을 비롯한 계층화된 보안 컨트롤의 조합을 사용하여 가장 까다로운 보안 문제를 해결합니다. 패브릭 데이터 웨어하우스는 대부분의 데이터를 저장합니다. Power BI는 SSO를 통해 DirectQuery를 통해 데이터에 액세스합니다. 인증에 Microsoft Entra ID를 사용합니다. 프로비전된 풀 내에서 데이터 권한 부여에 대한 광범위한 보안 제어도 있습니다.

다음과 같은 일반적인 보안 문제를 고려합니다.

  • 데이터를 볼 수 있는 사용자를 정의합니다.

    • 데이터가 데이터 위반 위험을 완화하기 위해 연방, 지역 및 회사 지침을 준수하는지 확인합니다. 패브릭은 보안을 지원하고 규정 준수를 촉진하는 포괄적인 데이터 보호 기능을 제공합니다.

    • OneLake 보안 은 부모 항목 또는 작업 영역 사용 권한에서 상속된 다른 권한으로 OneLake 데이터에 대한 모든 액세스를 제어합니다.

      • 작업 영역 은 항목을 만들고 관리하기 위한 공동 작업 환경입니다. 작업 영역 역할은 이 수준에서 관리할 수 있습니다.

      • 항목 은 단일 구성 요소에 함께 번들로 제공되는 기능 집합입니다. 데이터 항목은 OneLake를 사용하여 데이터를 해당 항목 내에 저장할 수 있는 항목의 하위 유형입니다. 항목은 작업 영역 역할에서 사용 권한을 상속하지만 추가 권한도 가질 수 있습니다. 항목 내의 폴더는 데이터(예: Tables/ 또는 Files/.)를 저장하고 관리하는 데 사용됩니다.

  • 사용자의 ID를 확인하는 방법을 결정합니다.

    • 패브릭을 사용하여 액세스 제어인증을 통해 데이터에 액세스할 수 있는 사용자를 제어합니다.
  • 네트워크 및 데이터의 무결성, 기밀성 및 액세스를 보호하려면 네트워크 보안 기술을 선택합니다.

    • 네트워크 보안 옵션을 사용하여 패브릭 을 보호할 수 있습니다.
  • 위협을 감지하고 알리는 도구를 선택합니다.

  • Fabric OneLake에서 데이터를 보호하는 방법을 결정합니다.

    • Microsoft Purview Information Protection의 민감도 레이블을 사용하여 Fabric의 데이터를 보호 합니다. 일반, 기밀 및 기밀과 같은 레이블은 중요한 정보를 보호하기 위해 Word, PowerPoint 및 Excel과 같은 Microsoft Office 앱에서 널리 사용됩니다. 데이터 원본에서 비즈니스 사용자까지 패브릭을 통해 흐르는 동안 각 단계마다 데이터를 자동으로 추적합니다.

비용 최적화

비용 최적화는 불필요한 비용을 줄이고 운영 효율성을 개선하는 방법에 중점을 둡니다. 자세한 내용은 비용 최적화를 위한 디자인 검토 검사 목록을 참조하세요.

이 섹션에서는 솔루션에 사용되는 다양한 서비스에 대한 가격 책정 세부 정보를 간략하게 설명하고 샘플 데이터 세트를 사용하여 이 시나리오에 대한 결정을 설명합니다. Azure 가격 계산기에서 시작 구성을 사용하고 시나리오에 맞게 조정합니다. 패브릭 SKU에 대한 자세한 내용은 패브릭 가격 책정 개요를 참조하세요. 전체 패브릭 사용량의 예상을 생성하는 방법에 대한 자세한 내용은 패브릭 용량 추정기를 참조하세요.

패브릭 확장 가능한 아키텍처

패브릭은 컴퓨팅 및 스토리지 수준을 독립적으로 확장하는 데 사용할 수 있는 대부분의 워크로드에 대한 서버리스 아키텍처입니다. 컴퓨팅 리소스는 사용량에 따라 비용이 발생합니다. 요청 시 이러한 리소스의 크기를 조정하거나 일시 중지할 수 있습니다. 스토리지 리소스는 GB당 비용이 발생하므로 데이터를 수집할 때 비용이 증가합니다.

패브릭 팩터리 파이프라인

세 가지 주요 구성 요소는 파이프라인의 가격에 영향을 줍니다.

  • 오케스트레이션을 위한 데이터 파이프라인 작업: 비용을 최적화하려면 병렬 흐름을 구현하여 총 오케스트레이션 시간을 줄입니다.

  • 컴퓨팅용 데이터 흐름 Gen2: 비용을 최적화하려면 불필요한 데이터를 필터링하고 증분 추출을 처리하여 ETL 파이프라인을 간소화합니다.

  • 복사 작업 또는 복사 작업에 대한 데이터 이동: 비용을 최적화하려면 증분 추출을 사용하여 복사 작업을 구성하고 복사 작업의 처리량을 조정합니다.

자세한 내용은 Data Factory 가격 미터 탭을 Data Factory 가격 책정에서 참조하세요.

가격은 구성 요소 또는 활동, 빈도 및 오케스트레이션과 관련된 전체 컴퓨팅에 따라 달라집니다. 파이프라인 활동 또는 복사 작업으로 인해 발생하는 모든 데이터 이동에는 비용이 발생합니다. 그러나 패브릭 미러링을 통한 데이터 이동과 관련된 컴퓨팅은 무료이며 미러된 데이터의 스토리지 비용은 용량 크기까지 무료입니다. 예를 들어 F64 용량을 구매하는 경우 미러링에만 사용되는 64TB(무료 테라바이트) 스토리지를 받게 됩니다. 무료 미러링 스토리지 한도를 초과하거나 용량이 일시 중지된 경우 OneLake 스토리지 요금이 청구됩니다.

패브릭 워크로드 의사 결정 가이드

의사 결정 가이드 를 사용하여 패브릭 워크로드에 대한 데이터 저장소를 선택합니다. 모든 옵션은 OneLake 내의 통합 스토리지에서 사용할 수 있습니다.

Fabric Lakehouse 또는 Fabric Warehouse용 SQL 엔드포인트는 분석을 위해 임시 쿼리를 실행하는 기능을 제공합니다. 또한 Power BI 의미 체계 모델이 데이터를 가져오거나 직접 쿼리할 수 있습니다. 레이크하우스 또는 웨어하우스와 관련된 비용은 SQL 엔드포인트에 대한 SQL 쿼리에 대한 CPU 사용 량과 동일합니다. 비용을 최적화하려면 Fabric Lakehouse에서 Z-Ordering 및 V-Ordering을 구현하여 쿼리 성능을 향상시킵니다. 데이터 웨어하우스의 경우 쿼리를 최적화하여 더 작은 양의 데이터를 읽습니다.

OneLake 스토리지

OneLake 스토리지는 사용된 데이터 GB당 종량제 요금으로 청구되며 CPU(패브릭 용량 단위)를 사용하지 않습니다. 레이크하우스 및 웨어하우스와 같은 Fabric 항목은 OneLake 스토리지를 사용합니다. 자세한 내용은 패브릭 가격 책정을 참조하세요.

OneLake 비용을 최적화하려면 일시 삭제 스토리지의 데이터를 포함하여 사용되지 않는 데이터를 정기적으로 삭제하고 읽기/쓰기 작업을 최적화하여 스토리지 볼륨을 관리하는 데 집중합니다. OneLake 스토리지는 컴퓨팅과 별도로 요금이 청구되므로 패브릭 용량 메트릭 앱을 사용하여 사용량을 모니터링하는 것이 중요합니다. 한 달 동안의 평균 일일 사용량을 기준으로 계산되는 스토리지 비용을 줄이려면 저장된 데이터의 양을 최소화하는 것이 좋습니다.

Power BI

이 시나리오에서는 Power BI 작업 영역을 내장된 성능 향상 기능과 함께 사용하여 까다로운 분석 요구를 효과적으로 수용합니다. 비용을 최적화하려면 가져오기 모드 추출을 위한 증분 새로 고침을 구현합니다. 패브릭 용량의 전체 부하를 줄이기 위해 가능하면 더 큰 데이터 세트에 대한 보고를 위한 Direct Lake 모드를 구현합니다.

자세한 내용은 Power BI 가격 책정을 참조하세요.

운영 효율성

운영 우수성은 애플리케이션을 배포하고 프로덕션에서 계속 실행하는 운영 프로세스를 다룹니다. 자세한 내용은 Operational Excellence에 대한 디자인 검토 검사 목록을 참조하세요.

  • Azure DevOps 릴리스 파이프라인 및 GitHub Actions를 사용하여 여러 환경에서 패브릭 작업 영역 아티팩트의 배포를 자동화합니다. 자세한 내용은 패브릭 작업 영역에 대한 지속적인 통합 및 지속적인 업데이트를 참조하세요.

  • 각 워크로드를 별도의 배포 템플릿에 배치하고 리소스를 소스 제어 시스템에 저장합니다. CI/CD(지속적인 통합 및 지속적인 업데이트) 프로세스의 일부로 템플릿을 함께 또는 개별적으로 배포할 수 있습니다. 이 방법은 자동화 프로세스를 간소화합니다. 이 아키텍처에는 다음과 같은 네 가지 주요 워크로드가 있습니다.

    • 데이터 웨어하우스 및 관련 리소스
    • Data Factory 파이프라인
    • 대시보드, 앱 및 데이터 세트를 포함한 Power BI 자산
    • 온-프레미스에서 클라우드로 시뮬레이션된 시나리오
  • 가능한 경우 워크로드를 준비하는 것이 좋습니다. 다양한 단계에 워크로드를 배포합니다. 다음 단계로 이동하기 전에 각 단계에서 유효성 검사를 실행합니다. 이 방법은 제어된 방식으로 프로덕션 환경에 업데이트를 푸시하고 예기치 않은 배포 문제를 최소화합니다. 청록색 배포카나리아 릴리스 전략을 사용하여 라이브 프로덕션 환경을 업데이트합니다.

  • 롤백 전략을 사용하여 실패한 배포를 처리합니다. 예를 들어 배포 기록에서 이전에 성공한 배포를 자동으로 다시 배포할 수 있습니다. Azure CLI에서 --rollback-on-error 플래그를 사용합니다.

  • 패브릭 용량 메트릭 앱을 사용하여 패브릭 용량 소비를 포괄적으로 모니터링합니다. 패브릭 작업 영역의 원격 분석 로그를 자세히 모니터링하려면 작업 영역 모니터링을 사용하십시오.

  • 패브릭 용량 추정기를 사용하여 패브릭 용량 요구 사항을 예측합니다.

성능 효율성

성능 효율성은 사용자 요구를 효율적으로 충족하기 위해 워크로드의 크기를 조정하는 기능을 의미합니다. 자세한 내용은 성능 효율성에 대한 디자인 검토 검사 목록을 참조하세요.

이 문서에서는 패브릭 F64 용량 을 사용하여 BI 기능을 보여 줍니다. 패브릭의 전용 Power BI 용량은 F64부터 최대 SKU 크기까지 다양합니다. 자세한 내용은 패브릭 가격 책정을 참조하세요.

필요한 용량을 확인하려면 다음 작업을 수행합니다.

기여자

Microsoft는 이 문서를 유지 관리합니다. 다음 기여자는 이 문서를 작성했습니다.

대표 저자:

기타 기여자:

LinkedIn 비공개 프로필을 보려면, LinkedIn에 로그인하세요.

다음 단계