Partager via


Informations de référence sur le connecteur PostgreSQL

Important

Le connecteur PostgreSQL pour Lakeflow Connect est disponible en préversion publique. Contactez votre équipe de votre compte Databricks pour vous inscrire à la Préversion publique.

Cette page contient des documents de référence pour le connecteur PostgreSQL dans Databricks Lakeflow Connect.

Transformations automatiques de données

Databricks transforme automatiquement les types de données PostgreSQL suivants en types de données compatibles delta :

Type PostgreSQL Type Delta
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY DECIMAL(19,2)
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP TIMESTAMP
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID STRING
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Remarques importantes sur les types de date et d’heure

  • Les colonnes DATE sont ingérées comme type Delta DATE.
  • TIMESTAMP et TIMESTAMP WITH TIME ZONE les colonnes sont ingérées en tant que type Delta TIMESTAMP . Pour TIMESTAMP WITH TIME ZONE, les informations de fuseau horaire sont conservées pendant l’ingestion.
  • TIME, TIME WITH TIME ZONEet INTERVAL les colonnes sont ingérées sous forme de chaînes dans leur format d’origine. Vous pouvez utiliser les fonctions SQL Databricks pour analyser ces chaînes dans les représentations temporelles appropriées si nécessaire.

Types de données définis par l’utilisateur et tiers

Les types et types de données définis par l’utilisateur à partir d’extensions PostgreSQL tierces sont ingérés en tant que chaînes. Si vous devez transformer ces types, vous pouvez utiliser les fonctions SQL Databricks pour analyser les représentations sous forme de chaîne dans le traitement en aval.

Types composites

Les types composites PostgreSQL (également appelés types de lignes) sont ingérés en tant que chaînes. La représentation sous forme de chaîne suit le format de type composite de PostgreSQL : (value1,value2,value3).