Important
Lakeflow Connect 用 PostgreSQL コネクタはパブリック プレビュー段階です。 パブリック プレビューに登録する場合は、Databricks アカウント チームにお問い合わせください。
このページには、Databricks Lakeflow Connect の PostgreSQL コネクタのリファレンス 資料が含まれています。
自動的なデータ変換
Databricks は、次の PostgreSQL データ型をデルタ互換のデータ型に自動的に変換します。
| PostgreSQL の種類 | Delta の型 |
|---|---|
BOOLEAN |
BOOLEAN |
SMALLINT |
SMALLINT |
INTEGER |
INT |
BIGINT |
BIGINT |
DECIMAL(p,s) |
DECIMAL(p,s) |
NUMERIC(p,s) |
DECIMAL(p,s) |
REAL |
FLOAT |
DOUBLE PRECISION |
DOUBLE |
SMALLSERIAL |
SMALLINT |
SERIAL |
INT |
BIGSERIAL |
BIGINT |
MONEY |
DECIMAL(19,2) |
CHAR(n) |
STRING |
VARCHAR(n) |
STRING |
TEXT |
STRING |
BYTEA |
BINARY |
DATE |
DATE |
TIME |
STRING |
TIME WITH TIME ZONE |
STRING |
TIMESTAMP |
TIMESTAMP |
TIMESTAMP WITH TIME ZONE |
TIMESTAMP |
INTERVAL |
STRING |
UUID |
STRING |
JSON |
STRING |
JSONB |
STRING |
XML |
STRING |
ARRAY |
STRING |
CIDR |
STRING |
INET |
STRING |
MACADDR |
STRING |
BIT(n) |
BINARY |
BIT VARYING(n) |
BINARY |
日付と時刻の種類に関する重要な注意事項
-
DATE列は DeltaDATE型として取り込まれます。 -
TIMESTAMP列とTIMESTAMP WITH TIME ZONE列は、デルタTIMESTAMP型として取り込まれます。TIMESTAMP WITH TIME ZONEの場合、タイムゾーン情報はインジェスト中に保持されます。 -
TIME、TIME WITH TIME ZONE、およびINTERVAL列は、元の形式の文字列として取り込まれます。 Databricks SQL 関数を使用して、必要に応じてこれらの文字列を適切な時刻表現に解析できます。
ユーザー定義およびサードパーティのデータ型
サードパーティの PostgreSQL 拡張機能のユーザー定義型とデータ型は、文字列として取り込まれます。 これらの型を変換する必要がある場合は、Databricks SQL 関数を使用して、ダウンストリーム処理で文字列表現を解析できます。
複合型
PostgreSQL 複合型 (行型とも呼ばれます) は、文字列として取り込まれます。 文字列形式は、PostgreSQL の複合型形式 ( (value1,value2,value3)) に従います。