Partilhar via


Referência do conector PostgreSQL

Importante

O conector PostgreSQL para Lakeflow Connect está em Visualização Pública. Entre em contato com a sua equipa de conta Databricks para se inscrever na Pré-visualização Pública.

Esta página contém material de referência para o conector PostgreSQL no Databricks Lakeflow Connect.

Transformações automáticas de dados

O Databricks transforma automaticamente os seguintes tipos de dados PostgreSQL em tipos de dados compatíveis com Delta:

Tipo PostgreSQL Tipo delta
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY DECIMAL(19,2)
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP TIMESTAMP
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID STRING
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Notas importantes sobre tipos de data e hora

  • DATE as colunas são processadas como o tipo Delta DATE.
  • TIMESTAMP e TIMESTAMP WITH TIME ZONE as colunas são ingeridas como tipo Delta TIMESTAMP. Para TIMESTAMP WITH TIME ZONE, a informação do fuso horário é preservada durante a ingestão.
  • TIME, TIME WITH TIME ZONE, e INTERVAL as colunas são ingeridas como cadeias no seu formato original. Podes usar as funções SQL do Databricks para analisar estas cadeias nas representações temporais apropriadas, se necessário.

Tipos de dados definidos pelo utilizador e de terceiros

Tipos definidos pelo utilizador e tipos de dados provenientes de extensões PostgreSQL de terceiros são ingeridos como strings. Se precisares de transformar estes tipos, podes usar as funções SQL do Databricks para analisar as representações de strings no processamento a jusante.

Tipos compostos

Os tipos compostos do PostgreSQL (também conhecidos como tipos de linha) são tratados como strings. A representação das strings segue o formato de tipo composto do PostgreSQL: (value1,value2,value3).