Compartir a través de


Referencia del conector PostgreSQL

Importante

El conector de PostgreSQL para Lakeflow Connect está en versión preliminar pública. Póngase en contacto con el equipo de su cuenta de Databricks para inscribirse en la Vista previa pública.

Esta página contiene material de referencia para el conector postgreSQL en Databricks Lakeflow Connect.

Transformaciones automáticas de datos

Databricks transforma automáticamente los siguientes tipos de datos de PostgreSQL en tipos de datos compatibles con Delta:

Tipo de PostgreSQL Tipo Delta
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY DECIMAL(19,2)
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP TIMESTAMP
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID STRING
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Notas importantes sobre los tipos de fecha y hora

  • DATE Las columnas se cargan como el tipo Delta DATE .
  • TIMESTAMP y TIMESTAMP WITH TIME ZONE las columnas se ingieren como el tipo Delta TIMESTAMP . Para TIMESTAMP WITH TIME ZONE, la información de zona horaria se conserva durante la ingesta.
  • TIMELas columnas , TIME WITH TIME ZONEy INTERVAL se ingieren como cadenas en su formato original. Puede usar funciones SQL de Databricks para analizar estas cadenas en las representaciones de tiempo adecuadas si es necesario.

Tipos de datos definidos por el usuario y de terceros

Los tipos definidos por el usuario y los tipos de datos de extensiones de PostgreSQL de terceros se ingieren como cadenas. Si necesita transformar estos tipos, puede usar funciones SQL de Databricks para analizar las cadenas de representación durante el procesamiento posterior.

Tipos compuestos

Los tipos compuestos de PostgreSQL (también conocidos como tipos de fila) se ingieren como cadenas. La representación de cadena sigue el formato de tipo compuesto de PostgreSQL: (value1,value2,value3).