Compartilhar via


Referência do conector do PostgreSQL

Importante

O conector do PostgreSQL para Lakeflow Connect está em Versão Prévia Pública. Entre em contato com sua equipe de conta do Databricks para se inscrever na Versão Prévia Pública.

Esta página contém material de referência para o conector PostgreSQL no Databricks Lakeflow Connect.

Transformações de dados automáticas

O Databricks transforma automaticamente os seguintes tipos de dados PostgreSQL em tipos de dados compatíveis com Delta:

Tipo postgreSQL Tipo Delta
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY DECIMAL(19,2)
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP TIMESTAMP
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID STRING
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Notas importantes sobre tipos de data e hora

  • DATE as colunas são ingeridas como o tipo Delta DATE .
  • TIMESTAMP e TIMESTAMP WITH TIME ZONE colunas são ingeridas como o tipo Delta TIMESTAMP . Para TIMESTAMP WITH TIME ZONE, as informações de fuso horário são preservadas durante a ingestão.
  • TIME, TIME WITH TIME ZONEe INTERVAL as colunas são ingeridas como cadeias de caracteres em seu formato original. Você pode usar funções SQL do Databricks para analisar essas cadeias de caracteres nas representações de tempo apropriadas, se necessário.

Tipos de dados definidos pelo usuário e de terceiros

Tipos definidos pelo usuário e tipos de dados de extensões PostgreSQL de terceiros são ingeridos como cadeias de caracteres. Se você precisar transformar esses tipos, poderá usar funções SQL do Databricks para analisar as representações de cadeia de caracteres no processamento downstream.

Tipos compostos

Tipos de composição PostgreSQL (também conhecidos como tipos de linha) são ingeridos como cadeias de caracteres. A representação de cadeia de caracteres segue o formato de tipo composto do PostgreSQL: (value1,value2,value3).