중요합니다
Lakeflow Connect용 PostgreSQL 커넥터는 공개 미리 보기로 제공됩니다. 공개 미리 보기에 등록하려면 Databricks 계정 팀에 문의하세요.
이 페이지에는 Databricks Lakeflow Connect의 PostgreSQL 커넥터에 대한 참조 자료가 포함되어 있습니다.
자동 데이터 변환
Databricks는 다음 PostgreSQL 데이터 형식을 델타 호환 데이터 형식으로 자동으로 변환합니다.
| PostgreSQL 형식 | 델타 유형 |
|---|---|
BOOLEAN |
BOOLEAN |
SMALLINT |
SMALLINT |
INTEGER |
INT |
BIGINT |
BIGINT |
DECIMAL(p,s) |
DECIMAL(p,s) |
NUMERIC(p,s) |
DECIMAL(p,s) |
REAL |
FLOAT |
DOUBLE PRECISION |
DOUBLE |
SMALLSERIAL |
SMALLINT |
SERIAL |
INT |
BIGSERIAL |
BIGINT |
MONEY |
DECIMAL(19,2) |
CHAR(n) |
STRING |
VARCHAR(n) |
STRING |
TEXT |
STRING |
BYTEA |
BINARY |
DATE |
DATE |
TIME |
STRING |
TIME WITH TIME ZONE |
STRING |
TIMESTAMP |
TIMESTAMP |
TIMESTAMP WITH TIME ZONE |
TIMESTAMP |
INTERVAL |
STRING |
UUID |
STRING |
JSON |
STRING |
JSONB |
STRING |
XML |
STRING |
ARRAY |
STRING |
CIDR |
STRING |
INET |
STRING |
MACADDR |
STRING |
BIT(n) |
BINARY |
BIT VARYING(n) |
BINARY |
날짜 및 시간 유형에 대한 중요 참고 사항
-
DATE열은 델타DATE형식으로 변환됩니다. -
TIMESTAMP및TIMESTAMP WITH TIME ZONE열은 델타TIMESTAMP타입으로 처리됩니다.TIMESTAMP WITH TIME ZONE의 경우, 표준 시간대 정보는 수집 중에 유지됩니다. -
TIME열,TIME WITH TIME ZONE열, 그리고INTERVAL열은 원래 형식의 문자열로 수집됩니다. Databricks SQL 함수를 사용하여 필요한 경우 이러한 문자열을 적절한 시간 표현으로 구문 분석할 수 있습니다.
사용자 정의 및 타사 데이터 형식
타사 PostgreSQL 확장의 사용자 정의 형식 및 데이터 형식은 문자열로 수집됩니다. 이러한 형식을 변환해야 하는 경우 Databricks SQL 함수를 사용하여 다운스트림 처리에서 문자열 표현을 구문 분석할 수 있습니다.
복합 형식
PostgreSQL 복합 형식(행 형식이라고도 함)은 문자열로 수집됩니다. 문자열 표현은 PostgreSQL의 복합 형식 형식 (value1,value2,value3)을 따릅니다.