이 페이지에서는 파일 공유 커넥터를 사용하여 Salesforce Data 360(이전의 Data Cloud)에서 데이터를 읽는 방법을 설명합니다.
어떤 Salesforce 커넥터를 사용해야 하나요?
Databricks는 Salesforce용 여러 커넥터를 제공합니다. Salesforce Data 360 파일 공유 커넥터와 Salesforce Data 360 쿼리 페더레이션 커넥터의 두 가지 제로 복사본 커넥터가 있습니다. 이를 통해 Salesforce Data 360에서 데이터를 이동하지 않고 쿼리할 수 있습니다. 다양한 Salesforce 제품에서 데이터를 복사하는 Salesforce 수집 커넥터도 있습니다.
다음 표에서는 Databricks의 Salesforce 커넥터 간 차이점을 요약합니다.
| 커넥터 | 사용 사례 | 지원되는 Salesforce 제품 |
|---|---|---|
| Salesforce Data 360 파일 공유 | Lakehouse Federation에서 Salesforce Data 360 파일 공유 커넥터를 사용하는 경우 Databricks는 Salesforce DaaS(Data as a Service) API를 호출하여 기본 클라우드 개체 스토리지 위치에서 직접 데이터를 읽습니다. 쿼리는 JDBC 프로토콜을 사용하지 않고 Databricks 컴퓨팅에서 실행됩니다. 쿼리 페더레이션에 비해 파일 공유는 많은 양의 데이터를 페더레이션하는 데 적합합니다. 여러 데이터 원본에서 파일을 읽기 위한 향상된 성능과 더 나은 푸시다운 기능을 제공합니다. Salesforce Data 360 파일 공유를 위한 Lakehouse 페더레이션을 보십시오. |
Salesforce Data 360 |
| Salesforce Data 360 쿼리 페더레이션 | Lakehouse Federation에서 Salesforce Data 360 쿼리 페더레이션 커넥터를 사용하는 경우 Databricks는 JDBC를 사용하여 원본 데이터에 연결하고 쿼리를 Salesforce로 푸시합니다. Salesforce Data 360에서 페더레이션된 쿼리 실행을 참조하세요. | Salesforce Data 360 |
| Salesforce 데이터 수집 | Lakeflow Connect의 Salesforce 수집 커넥터를 사용하면 Salesforce Platform 데이터에서 완전히 관리되는 수집 파이프라인을 만들 수 있습니다. 이 커넥터는 CDP 데이터뿐만 아니라 데이터 인텔리전스 플랫폼의 CRM 데이터도 활용하여 값을 최대화합니다. Salesforce에서 데이터 수집 참고 보세요. | Salesforce 수집 커넥터가 지원하는 Salesforce 제품은 무엇입니까? |
시작하기 전 주의 사항:
작업 공간 요구 사항:
- Unity 카탈로그에 사용할 수 있는 작업 영역입니다.
컴퓨팅 요구 사항:
- Databricks 컴퓨팅 리소스에서 Salesforce Data 360 API 및 Salesforce Data 360의 공용 S3 버킷으로의 네트워크 연결(데이터가 상주함) Lakehouse Federation에 대한 네트워킹 권장 사항을 참조하세요.
- Azure Databricks 클러스터는 Databricks Runtime 16.3 이상 및 표준 액세스 모드를 사용해야 합니다.
- SQL 웨어하우스는 프로 또는 서버리스여야 합니다.
필요한 권한:
- 연결을 만들려면 메타스토어 관리자이거나 작업 영역에 연결된 Unity 카탈로그 메타스토어에 대한
CREATE CONNECTION권한이 있는 사용자여야 합니다. - 외부 카탈로그를 만들려면 메타스토어에 대한
CREATE CATALOG권한이 있어야 하며 연결의 소유자이거나 연결에 대한CREATE FOREIGN CATALOG권한이 있어야 합니다.
추가 권한 요구 사항은 다음 각 태스크 기반 섹션에 지정됩니다.
연결 및 외국 카탈로그 만들기
연결은 외부 데이터베이스 시스템에 액세스하기 위한 경로 및 자격 증명을 지정합니다. 연결을 만들려면 Azure Databricks Notebook 또는 Databricks SQL 쿼리 편집기에서 카탈로그 탐색기 또는 CREATE CONNECTION SQL 명령을 사용할 수 있습니다.
비고
Databricks REST API 또는 Databricks CLI를 사용하여 연결을 만들 수도 있습니다. POST /api/2.1/unity-catalog/connections과 Unity Catalog 명령을 참조하십시오.
필요한 권한: 메타스토어 관리자 또는 CREATE CONNECTION 권한이 있는 사용자.
카탈로그 탐색기
Azure Databricks 작업 영역에서
을 클릭합니다.카탈로그.
카탈로그 창 상단에서
추가 아이콘을 클릭한 후, 메뉴에서 연결 추가를 선택합니다.또는 빠른 액세스 페이지에서 외부 데이터 > 단추를 클릭하고 연결 탭으로 이동한 다음 연결 만들기를 클릭합니다.
연결 설정 마법사의 연결 기본 페이지에서 사용자에게 친숙한 연결 이름를 입력합니다.
Salesforce Data 360 파일 공유의 연결 유형을 선택합니다.
(선택 사항) 주석을 입력합니다.
을 클릭하여 연결을 만듭니다.
인증 페이지에서 Salesforce Data 360 파일 공유 인스턴스에 대해 다음 속성을 입력합니다.
-
테넌트별 엔드포인트: 예:
https://mvsw0mbrmqzdcyj-m02t0mrsh1.pc-rnd.c360a.salesforce.com -
핵심 테넌트 ID: 예를 들면 다음과 같습니다.
core/falcontest8-core4sdb26/00DVF000001E16v2AC
-
테넌트별 엔드포인트: 예:
카탈로그 기본 사항 페이지에서 외세 카탈로그의 이름을 입력합니다. 외부 카탈로그는 외부 데이터 시스템의 데이터베이스를 미러링하므로 Azure Databricks 및 Unity 카탈로그를 사용하여 해당 데이터베이스의 데이터에 대한 액세스를 쿼리하고 관리할 수 있습니다.
(선택 사항) 연결 테스트를 클릭하여 작동하는지 확인합니다.
카탈로그만들기를 클릭합니다.
액세스 페이지에서 사용자가 만든 카탈로그에 액세스할 수 있는 작업 영역을 선택합니다. 액세스 권한이 있는 모든 작업 영역을 선택하거나 작업 영역에 할당을 클릭하고 작업 영역을 선택한 다음 할당을 클릭할 수 있습니다.
카탈로그의 모든 개체에 대한 액세스를 관리할 수 있는 소유자 를 변경합니다. 텍스트 상자에 주체를 입력한 다음 반환된 결과에서 해당 주체를 클릭합니다.
카탈로그에 권한을 부여하시오. Grant을 클릭하세요.
a. 카탈로그의 객체에 액세스할 수 있는 주체를 지정하십시오. 텍스트 상자에 주체를 입력한 다음 반환된 결과에서 해당 주체를 클릭합니다. a. 각 주요 인물에게 부여할 권한 사전 설정을 선택합니다. 모든 계정 사용자에게는 기본적으로
BROWSE부여됩니다.- 드롭다운 메뉴에서 데이터 판독기 선택하여 카탈로그의 개체에
read권한을 부여합니다. - 드롭다운 메뉴에서 데이터 편집기를 선택하여 카탈로그의 개체에
read및modify권한을 부여합니다. - 부여할 권한을 수동으로 선택합니다.
a. Grant를 클릭합니다.
- 드롭다운 메뉴에서 데이터 판독기 선택하여 카탈로그의 개체에
다음을 클릭합니다.
메타데이터 페이지에서 태그의 키-값 쌍을 설정합니다. 자세한 내용은 Unity 카탈로그 보안 개체에 태그 적용을 참조하세요.
(선택 사항) 주석을 입력합니다.
저장을 클릭합니다.
Account URL과Connection URL을 기록해 두세요. Salesforce에서 데이터 공유 대상을 만들려면 이러한 값이 필요합니다.
SQL (영문)
Notebook 또는 Databricks SQL 쿼리 편집기에서 다음 명령을 실행합니다.
CREATE CONNECTION <connection-name> TYPE SALESFORCE_DATA_CLOUD_FILE_SHARING OPTIONS ( tenant_specific_endpoint '<tenant_specific_endpoint>', core_tenant_id '<core_tenant_id>' );새로 만든 연결의 연결 페이지로 이동하여
Account URL및Connection URL을 기록해 둡니다. Salesforce에서 데이터 공유 대상을 만들려면 이러한 값이 필요합니다.
Salesforce에서 데이터 공유 대상 만들기
이전 단계에서 검색한 Account URL 및 Connection URL을 사용하여 Salesforce에서 데이터 공유 대상을 만드세요.
Salesforce 설명서에서 데이터 공유 대상 만들기(Databricks) 를 참조하세요.
데이터 유형 매핑
Salesforce Data 360 파일 공유에서 Spark로 읽는 경우 데이터 형식은 다음과 같이 매핑됩니다.
| Salesforce Data 360 파일 공유 형식 | 스파크 유형 |
|---|---|
| 숫자 | DecimalType(38, 18) |
| 불리언 (Boolean) | 불리언 타입 |
| 문자 메시지 | 문자열 유형 |
| 날짜 | 날짜타입 |
| 날짜와 시간 | 타임스탬프 유형 |
| 전자 메일(텍스트) | 문자열 유형 |
| 백분율(숫자) | DecimalType(38, 18) |
| 휴대폰(문자) | 문자열 유형 |
| URL(텍스트) | 문자열 유형 |
제한점
- 커넥터는 단일 사용자 클러스터에서 사용할 수 없습니다.