중요합니다
MySQL 커넥터는 공개 미리 보기로 제공됩니다. 액세스를 요청하려면 Azure Databricks 계정 팀에 문의하세요.
Lakeflow Connect를 사용하여 Azure Databricks로 수집하도록 MySQL을 구성하는 방법을 알아봅니다. MySQL 커넥터는 이진 로그(binlog) 복제를 사용하여 MySQL 데이터베이스의 변경 내용을 캡처하고 증분 방식으로 Azure Databricks에 동기화합니다.
요구 사항
수집을 위해 MySQL을 구성하기 전에 환경이 다음 요구 사항을 충족하는지 확인합니다.
-
지원되는 데이터베이스 버전:
- Amazon RDS: 5.7.44 이상(독립 실행형 및 HA 배포 모두)
- Amazon Aurora: 5.7.mysql_aurora.2.12.2 이상(HA 설정의 경우 기본 인스턴스에서만 지원)
- Amazon Aurora Serverless: 지원됨
- Azure Database for MySQL 유연한 서버: 5.7.44 이상(독립 실행형 및 고가용성(HA) 배포 모두)
- MySQL on EC2: 5.7.44 및 그 이후 버전
- GCP Cloud SQL: 5.7.44 이상
-
이진 로깅 구성: 다음 서버 구성이 필요합니다.
- 이진 로깅을 사용하도록 설정합니다.
- binlog 형식을 .로
ROW설정합니다. - binlog 행 이미지를
FULL으로 설정합니다.
- 복제 권한이 있는 MySQL 사용자를 만들기 위한 액세스 권한입니다.
- Azure Databricks에서 MySQL 인스턴스로의 네트워크 연결
원본 설정 작업 개요
다음 작업을 완료하여 수집을 위해 MySQL을 구성합니다.
이진 로깅을 사용하도록 MySQL 서버 매개 변수를 구성하고 올바른 형식을 설정합니다.
구성 단계는 배포 유형에 따라 다릅니다.
복제에 필요한 권한이 있는 MySQL 사용자를 만듭니다. MySQL 사용자 권한 부여를 참조하세요.
Azure Databricks가 MySQL 인스턴스에 연결할 수 있도록 네트워킹을 구성합니다. 여기에는 방화벽 규칙, 보안 그룹 또는 네트워크 피어링 구성이 포함될 수 있습니다.
허용 목록에 대한 IP 주소 에 대한 자세한 내용은 Azure SQL Database에 대한 방화벽 설정 구성 을 참조하세요.
읽기 복제본 지원
MySQL 커넥터는 다음 배포 유형에 대해 읽기 전용 복제본에서 데이터 수집을 지원합니다.
- MySQL용 Amazon RDS
- Azure Database for MySQL (MySQL을 위한 Azure 데이터베이스)
- MySQL on EC2
경고
커넥터는 Amazon Aurora MySQL 읽기 복제본에서 수집을 지원하지 않습니다. Aurora 배포의 기본 인스턴스에 연결해야 합니다.
읽기 복제본을 사용하면 주 데이터베이스의 부하를 줄일 수 있습니다. 그러나 주 데이터베이스와 복제본 간에 복제 지연이 있을 수 있으므로 데이터 새로 고침에 영향을 줄 수 있습니다.