Freigeben über


PostgreSQL-Connectorreferenz

Von Bedeutung

Der PostgreSQL-Connector für Lakeflow Connect befindet sich in der öffentlichen Vorschau. Wenden Sie sich an Ihr Databricks-Kontoteam, um sich für die Public Preview zu registrieren.

Diese Seite enthält Referenzmaterial für den PostgreSQL-Connector in Databricks Lakeflow Connect.

Automatische Datentransformationen

Databricks transformiert automatisch die folgenden PostgreSQL-Datentypen in deltakompatible Datentypen:

PostgreSQL-Typ Delta-Typ
BOOLEAN BOOLEAN
SMALLINT SMALLINT
INTEGER INT
BIGINT BIGINT
DECIMAL(p,s) DECIMAL(p,s)
NUMERIC(p,s) DECIMAL(p,s)
REAL FLOAT
DOUBLE PRECISION DOUBLE
SMALLSERIAL SMALLINT
SERIAL INT
BIGSERIAL BIGINT
MONEY DECIMAL(19,2)
CHAR(n) STRING
VARCHAR(n) STRING
TEXT STRING
BYTEA BINARY
DATE DATE
TIME STRING
TIME WITH TIME ZONE STRING
TIMESTAMP TIMESTAMP
TIMESTAMP WITH TIME ZONE TIMESTAMP
INTERVAL STRING
UUID STRING
JSON STRING
JSONB STRING
XML STRING
ARRAY STRING
CIDR STRING
INET STRING
MACADDR STRING
BIT(n) BINARY
BIT VARYING(n) BINARY

Wichtige Hinweise zu Datums- und Uhrzeittypen

  • DATE-Spalten werden als Typ Delta DATE aufgenommen.
  • Die TIMESTAMP- und TIMESTAMP WITH TIME ZONE-Spalten werden als Delta-TIMESTAMP-Typ aufgenommen. Bei der Aufnahme von TIMESTAMP WITH TIME ZONE bleiben die Zeitzoneninformationen erhalten.
  • TIME, TIME WITH TIME ZONEund INTERVAL Spalten werden als Zeichenfolgen im ursprünglichen Format aufgenommen. Sie können Databricks SQL-Funktionen verwenden, um diese Zeichenfolgen bei Bedarf in die entsprechenden Zeitdarstellungen zu analysieren.

Benutzerdefinierte und Drittanbieterdatentypen

Benutzerdefinierte Typen und Datentypen von Drittanbieter-PostgreSQL-Erweiterungen werden als Zeichenfolgen aufgenommen. Wenn Sie diese Typen transformieren müssen, können Sie databricks SQL-Funktionen verwenden, um die Zeichenfolgendarstellungen in der nachgelagerten Verarbeitung zu analysieren.

Zusammengesetzte Typen

PostgreSQL-Zusammengesetzte Typen (auch als Zeilentypen bezeichnet) werden als Zeichenfolgen aufgenommen. Die Zeichenfolgendarstellung folgt dem Zusammengesetzten Typformat von PostgreSQL: (value1,value2,value3).