적용 대상: SQL Server 2022 (16.x)
Azure SQL Database
Azure Synapse Analytics
이 문서에는 SQL용 Azure Synapse Link 변경 피드의 작동 방식에 대한 세부 정보가 포함되어 있습니다.
중요합니다
이제 Microsoft Fabric에 대한 미러링을 사용할 수 있습니다. Fabric으로 미러링하면 Azure Synapse Link의 모든 기능과 더 나은 분석 성능을 제공하고, Fabric의 OneLake와 데이터 자산을 통합할 수 있는 기능을 제공하며, Delta Parquet 형식으로 데이터에 대한 개방형 액세스 권한을 제공합니다. Azure Synapse Link 대신 패브릭 미러링을 사용합니다.
Microsoft Fabric에 미러링을 사용하면 SQL Server 2016 이상, Azure SQL Database, Azure SQL Managed Instance, Oracle, Snowflake, Cosmos DB 등의 데이터를 포함하여 기존 데이터 자산을 패브릭의 OneLake에 직접 지속적으로 복제할 수 있습니다.
자세한 내용은 Microsoft Fabric 미러된 데이터베이스를 참조하세요.
SQL Server 2022(16.x)에는 SQL Server 테이블과 Microsoft Azure Synapse 플랫폼 간의 연결을 허용하는 새로운 기능인 SQL용 Azure Synapse Link가 도입되었습니다. SQL용 Azure Synapse Link는 SQL Server 내에서 변경 내용을 캡처하고 Azure Synapse Analytics에 로드하는 자동 변경 피드를 제공합니다.
이 기능은 Azure SQL Managed Instance에 사용할 수 없습니다.
참고 항목
Azure Synapse Link for SQL을 사용하도록 설정하면 원본 데이터베이스의 changefeed 스키마 내에 changefeed 데이터베이스 사용자, changefeed 스키마 및 여러 테이블이 만들어집니다. 이러한 개체는 시스템에서 관리되는 개체이므로 변경하지 마세요.
랜딩 존
SQL Server용 Azure Synapse Link의 랜딩 존에 대한 자세한 내용은 SQL Server 랜딩 존에 대한 Azure Synapse Link를 참조하세요.
SQL Server용 Azure Synapse Link에는 Azure Data Lake Storage (ADLS) Gen2 스토리지 계정을 포함하여 사용자가 프로비저닝한 Azure 리소스가 포함되지만 Azure SQL Database용 Azure Synapse Link는 랜딩 존 프로비저닝을 포함하여 완전히 관리되며 이 문서에 설명된 대로 유사한 변경 검색 프로세스를 사용합니다. 자세한 내용은 Azure SQL Database용 Azure Synapse Link를 참조하세요.
SQL Server의 경우 랜딩 존 Azure Storage 위치는 고객이 관리하고 볼 수 있지만 랜딩 존의 파일을 사용하거나 수정하는 것은 권장되지 않거나 지원되지 않습니다.
변경 피드 기능
SQL Server 관리자는 비어 있는 테이블이나 이미 데이터가 포함된 테이블에서 Azure Synapse Link를 사용하도록 설정할 수 있습니다. 원본 테이블에는 기본 키가 있어야 합니다.
이미 데이터가 포함된 테이블에서 Azure Synapse Link는 원본 테이블의 초기 전체 스냅샷으로 랜딩 존을 시드합니다. 데이터가 포함된 기존 SQL Server 테이블이 Azure Synapse Link에 추가되면 초기 데이터 집합의 전체 스냅샷이 생성됩니다. 초기 스냅샷 파일은 ADLS Gen2의 랜딩 존으로 전송되는 .parquet 형식 파일입니다.
Azure Synapse Link는 Azure Storage 랜딩 존에 대한 원본 테이블 변경 내용의 짧은 대기 시간 푸시를 지원합니다. 변경 피드는 CSV 파일을 사용하여 이러한 변경 내용을 Azure Synapse에 게시합니다. 이 테이블 형식은 자연스럽게 행 세분화된 데이터 변경 내용을 빠른 주기(초 단위)로 작성하는 데 맞춰집니다. 대부분의 CSV 파일은 비교적 작아야 합니다.
변경 캡처
Azure Synapse Link에 대한 변경 내용을 캡처하는 것은 기존 CDC(변경 데이터 캡처) 기술과 유사합니다. 변경 데이터 원본은 SQL Server 트랜잭션 로그입니다. 변경 피드는 로그를 읽고 랜딩 존에 변경 내용에 대한 정보를 추가합니다.
CDC는 트랜잭션 로그를 수집하여 하나 또는 한 개 이상의 원본 테이블에서 수행된 모든 수정 사항을 캡처하여 작동합니다.
- CDC에서 변경 데이터는 데이터베이스의 형제 테이블에 내부적으로 채워집니다.
- Azure Synapse Link에서 데이터는 데이터베이스 트랜잭션 로그에서 직접 읽고, 메모리에 캐시되고, 결국 Azure Storage 랜딩 존에 기록됩니다.
스토리지 중단이 발생하면 랜딩 존을 사용할 수 없게 되어 해당 랜딩 존에 대한 게시를 차단할 수 있습니다. SQL Server CDC 로그 판독기 에이전트가 실패하거나 실행되고 있지 않은 경우의 동작과 유사하게 원본 데이터베이스 트랜잭션 로그를 잘라낼 수 없습니다. 스토리지 중단 또는 스토리지 구성 변경으로 인해 액세스할 수 없게 되는 경우 Synapse Studio를 통해 Azure Synapse Link를 중지합니다.
고가용성 지원
SQL Server용 Azure Synapse Link는 Always On 가용성 그룹 및 FCI(장애 조치(failover) 클러스터 인스턴스)와 호환됩니다.
초기 스냅샷이 진행 중이고 어떤 이유로든 중단된 경우 초기 스냅샷 내보내기 프로세스가 다시 시작됩니다. FCI 또는 동기 가용성 그룹에서 SQL Server를 장애 조치(fail over)하는 경우입니다.
Microsoft Fabric에서의 미러링
Fabric으로 미러링하면 Azure Synapse Link의 모든 기능과 더 나은 분석 성능을 제공하고, Fabric의 OneLake와 데이터 자산을 통합할 수 있는 기능을 제공하며, Delta Parquet 형식으로 데이터에 대한 개방형 액세스 권한을 제공합니다. Azure Synapse Link 대신 패브릭 미러링을 사용합니다.
자세한 내용은 다음을 참조하세요.
- Microsoft Fabric 미러된 데이터베이스
- Microsoft Fabric 미러된 데이터베이스 모니터링
- Microsoft Fabric을 사용하여 미러된 데이터베이스에서 데이터 탐색