이 문서에서는 Azure Data Lake Gen 2 스토리지 계정의 데이터를 Azure Synapse Analytics의 전용 SQL 풀로 수집하는 방법을 알아봅니다.
필수 조건
- Azure 구독: Azure 구독이 아직 없는 경우 시작하기 전에 Azure 체험 계정을 만듭니다.
- Azure Storage 계정: Azure Data Lake Storage Gen 2를 원본 데이터 저장소로 사용합니다. 스토리지 계정이 없는 경우 Azure Storage 계정 만들기 단계를 참조하세요.
-
Azure Synapse Analytics: 전용 SQL 풀을 싱크 데이터 저장소로 사용합니다.
- 기존 Synapse 작업 영역이 없는 경우 Synapse 작업 영역 만들기를 참조하세요.
- 기존 전용 SQL 풀이 없는 경우 전용 SQL 풀 만들기를 참조하세요.
연결된 서비스 생성
Azure Synapse Analytics에서 연결된 서비스는 다른 서비스에 대한 연결 정보를 정의합니다. 이 섹션에서는 Azure Synapse Analytics 및 Azure Data Lake Storage Gen2 연결된 서비스를 추가합니다.
- Azure Synapse Analytics UX를 열고 관리 탭으로 이동합니다.
- 외부 연결에서 연결된 서비스를 선택합니다.
- 연결된 서비스를 추가하려면 새로 만들기를 선택합니다.
- 목록에서 Azure Data Lake Storage Gen2 타일을 선택하고 계속을 선택합니다.
- 인증 자격 증명을 입력합니다. 계정 키, 서비스 주체 및 관리 ID는 현재 지원되는 인증 유형입니다. 테스트 연결을 선택하여 자격 증명이 올바른지 확인합니다. 작업을 완료하면 만들기를 선택합니다.
- 3-5단계를 반복하지만 Azure Data Lake Storage Gen2 대신 Azure Synapse Analytics 타일을 선택하고 해당 연결 자격 증명을 입력합니다. Azure Synapse Analytics의 경우 SQL 인증, 관리 ID 및 서비스 주체가 현재 지원됩니다.
파이프라인 만들기
파이프라인에는 일련의 활동을 실행하기 위한 논리적 흐름이 포함됩니다. 이 섹션에서는 ADLS Gen2에서 전용 SQL 풀로 데이터를 수집하는 복사 작업이 포함된 파이프라인을 만듭니다.
- 통합 탭으로 이동합니다. 파이프라인 헤더 옆에 있는 더하기 아이콘을 선택하고 파이프라인을 선택합니다.
- 작업 창의 이동 및 변환 아래에서 데이터 복사 를 파이프라인 캔버스로 끕니다.
- 복사 작업을 선택하고 원본 탭으로 이동합니다. 새로 만들기를 선택하여 새 원본 데이터 세트를 만듭니다.
- 데이터 저장소로 Azure Data Lake Storage gen2를 선택하고 계속을 선택합니다.
- 서식으로 DelimitedText를 선택하고 계속을 선택합니다.
- 설정 속성 창에서 만든 ADLS 연결된 서비스를 선택합니다. 원본 데이터의 파일 경로를 지정하고 첫 번째 행에 헤더가 있는지 여부를 지정합니다. 파일 저장소 또는 샘플 파일에서 스키마를 가져올 수 있습니다. 마치면 확인을 선택합니다.
- 싱크 탭으로 이동합니다. 새로 만들기를 선택하여 새 싱크 데이터 세트를 만듭니다.
- 데이터 저장소로 Azure Synapse Analytics를 선택하고 계속을 선택합니다.
- 속성 설정 창에서 만든 Azure Synapse Analytics 연결된 서비스를 선택합니다. 기존 테이블에 쓰는 경우 드롭다운에서 선택합니다. 그렇지 않으면 편집 을 선택하고 새 테이블 이름을 입력합니다. 완료되면 확인 선택
- 테이블을 만드는 경우 테이블 옵션 필드에서 테이블 자동 만들기 를 사용하도록 설정합니다.
파이프라인 디버그 및 게시
파이프라인 구성이 완료되면 아티팩트를 게시하기 전에 디버그 실행을 실행하여 모든 것이 올바른지 확인할 수 있습니다.
- 파이프라인을 디버그하려면 도구 모음에서 디버그를 선택합니다. 창의 아래쪽에 있는 출력 탭에서 파이프라인 실행 상태가 표시됩니다.
- 파이프라인이 성공적으로 실행되면 위쪽 도구 모음에서 모두 게시를 선택합니다. 이 작업은 만든 엔터티(데이터 세트 및 파이프라인)를 Synapse Analytics 서비스에 게시합니다.
- 게시됨 메시지가 표시될 때까지 기다립니다. 알림 메시지를 보려면 오른쪽 위에 있는 벨 단추를 선택합니다.
파이프라인을 트리거하고 모니터링하기
이 단계에서는 이전 단계에서 게시된 파이프라인을 수동으로 트리거합니다.
- 도구 모음에서 트리거 추가를 선택한 다음, 지금 트리거를 선택합니다. 파이프라인 실행 페이지에서 마침을 선택합니다.
- 왼쪽 사이드바에 있는 모니터 탭으로 이동합니다. 수동 트리거에 의해 시작된 파이프라인의 실행이 표시됩니다. 작업 열의 링크를 사용하여 활동 세부 정보를 보고 파이프라인을 다시 실행할 수 있습니다.
- 파이프라인 실행과 연결된 활동 실행을 보려면 작업 열에서 활동 실행 보기 링크를 선택합니다. 이 예제에서는 하나의 활동만 있으므로 목록에 하나의 항목만 표시됩니다. 복사 작업에 대한 자세한 내용은 작업 열에서 세부 정보 링크(안경 아이콘)를 선택합니다. 상단에서 파이프라인 실행을 선택하여 파이프라인 실행 보기로 돌아갑니다. 보기를 새로 고치려면 새로 고침을 선택합니다.
- 데이터가 전용 SQL 풀에 올바르게 기록되었는지 확인합니다.
다음 단계
Azure Synapse Analytics의 데이터 통합에 대한 자세한 내용은 Azure Data Lake Storage Gen2로 데이터 수집 문서를 참조하세요.