이 문서에서는 Azure Databricks 사용자가 ADLS의 데이터를 Azure Databricks의 테이블로 로드할 수 있도록 관리자 사용자가 ADLS(Azure Data Lake Storage)의 컨테이너에 있는 데이터에 대한 액세스를 구성하는 방법을 설명합니다.
이 문서에서는 원본 데이터에 대한 보안 액세스를 구성하는 다음과 같은 방법을 설명합니다.
- (권장) Unity 카탈로그 볼륨을 만듭니다.
- 스토리지 자격 증명을 사용하여 Unity 카탈로그 외부 위치를 만듭니다.
- 서비스 주체를 사용하는 컴퓨팅 리소스를 시작합니다.
- 임시 자격 증명(Blob SAS 토큰)을 생성합니다.
시작하기 전에
ADLS의 데이터에 대한 액세스를 구성하기 전에 다음이 있는지 확인합니다.
- Azure Storage 계정의 컨테이너에 있는 데이터입니다. 컨테이너를 만들려면 Azure Storage 설명서에서 컨테이너 만들기를 참조하세요.
- 데이터에 액세스하려면 Unity 카탈로그 볼륨(권장)을 사용하고, 볼륨에 대한
READ VOLUME권한이 필요합니다. 자세한 내용은Unity 카탈로그 볼륨이란? 및 를 참조하세요.Unity 카탈로그 권한 및 보안 개체 - Unity 카탈로그 외부 위치를 사용하여 데이터에 액세스하려면 외부 위치에 대한
READ FILES권한이 필요합니다. 자세한 내용은 외부 위치에 대한 권한 부여를 참조하세요.
- 서비스 주체와 함께 컴퓨팅 리소스를 사용하여 데이터에 액세스하려면 Azure Databricks 작업 영역 관리자 권한을 부여합니다.
- 임시 자격 증명을 사용하여 데이터에 액세스하려면 다음을 수행합니다.
- Azure Databricks 작업 영역 관리자 권한.
- Azure 계정에서 Blob SAS 토큰을 만들 수 있는 권한입니다. 이렇게 하면 임시 자격 증명을 생성할 수 있습니다.
- Databricks SQL 웨어하우스. SQL 웨어하우스를 만들려면 SQL 웨어하우스 만들기를 참조하세요.
- Databricks SQL 사용자 인터페이스에 익숙합니다.
클라우드 스토리지에 대한 액세스 구성
다음 방법 중 하나를 사용하여 ADLS에 대한 액세스를 구성합니다.
- (권장) Unity 카탈로그 볼륨을 만듭니다. 자세한 내용은 Unity 카탈로그의 볼륨은 무엇인가요?.
- 스토리지 자격 증명을 사용하여 Unity 카탈로그 외부 위치를 구성합니다. 외부 위치에 대한 자세한 내용은 외부 위치 개요를 참조하세요.
- 서비스 주체를 사용하도록 컴퓨팅 리소스를 구성합니다. 자세한 내용은 서비스 주체 구성을 참조하세요.
- 다른 Azure Databricks 사용자와 공유할 임시 자격 증명(Blob SAS 토큰)을 생성합니다. 자세한 내용은 수집대한 임시 자격 증명 생성을 참조하세요.
정리
더 이상 유지하지 않으려면 클라우드 계정 및 Azure Databricks에서 연결된 리소스를 정리할 수 있습니다.
ADLS 스토리지 계정 삭제
- 일반적으로 https://portal.azure.com에서 Azure 계정을 사용하여 Azure Portal을 엽니다.
- 스토리지 계정을 찾아 엽니다.
- 삭제를 클릭합니다.
- 스토리지 계정의 이름을 입력한 다음 삭제를 클릭합니다.
SQL 웨어하우스 중지
다른 작업에 SQL 웨어하우스를 사용하지 않는 경우 추가 비용을 방지하기 위해 SQL 웨어하우스를 중지해야 합니다.
- SQL 가상 사용자의 사이드바에서 SQL Warehouses를 클릭합니다.
- SQL 웨어하우스의 이름 옆에 있는 중지를 클릭합니다.
- 메시지가 표시되면 중지를 다시 클릭합니다.
다음 단계
이 문서의 단계를 완료한 후 사용자는 명령을 실행 COPY INTO 하여 ADLS 컨테이너의 데이터를 Azure Databricks 작업 영역으로 로드할 수 있습니다.