Udostępnij przez


Kopiowanie danych z usługi Presto przy użyciu usługi Azure Data Factory lub Synapse Analytics

DOTYCZY: Azure Data Factory Azure Synapse Analytics

Wskazówka

Wypróbuj Data Factory in Microsoft Fabric, kompleksowe rozwiązanie analityczne dla przedsiębiorstw. Microsoft Fabric obejmuje wszystko od przemieszczania danych po naukę o danych, analitykę w czasie rzeczywistym, inteligencję biznesową i raportowanie. Dowiedz się, jak rozpocząć nowy okres próbny za darmo!

W tym artykule opisano, jak używać działanie kopiowania w ramach potoku Azure Data Factory lub Synapse Analytics, aby kopiować dane z Presto. Opiera się na artykule przegląd aktywności kopiowania, który przedstawia ogólny przegląd aktywności kopiowania.

Ważne

Łącznik presto w wersji 1.0 jest na etapie usuwania. Zaleca się uaktualnienie łącznika presto z wersji 1.0 do 2.0.

Obsługiwane funkcje

Wtyczka Presto jest obsługiwana dla następujących możliwości:

Obsługiwane funkcje środowisko IR
Kopiuj aktywność (źródło/-) (1) (2)
Aktywność wyszukiwania (1) (2)

① Środowisko uruchomieniowe integracji Azure ② Środowisko uruchomieniowe integracji lokalne

Aby uzyskać listę magazynów danych obsługiwanych jako źródła/zlewy przez czynność kopiowania, zobacz tabelę Obsługiwane magazyny danych.

Usługa zapewnia wbudowany sterownik umożliwiający łączność, dlatego nie musisz ręcznie instalować żadnego sterownika za pomocą tego łącznika.

Rozpoczęcie

Aby wykonać działanie kopiowania za pomocą potoku, możesz użyć jednego z następujących narzędzi lub zestawów SDK:

Utwórz połączoną usługę do Presto za pomocą interfejsu użytkownika

Aby utworzyć powiązaną usługę w Presto w portalu Azure, wykonaj następujące kroki.

  1. Przejdź do karty Zarządzaj w swoim obszarze roboczym Azure Data Factory lub Synapse i wybierz Usługi powiązane, a następnie kliknij Nowy.

  2. Wyszukaj Presto i wybierz konektor Presto.

    Zrzut ekranu z łącznika Presto.

  3. Skonfiguruj szczegóły usługi, przetestuj połączenie i utwórz nowe połączone usługę.

    Zrzut ekranu konfiguracji połączonej usługi dla Presto.

Szczegóły konfiguracji złącza

W dalszej części znajdziesz szczegóły dotyczące właściwości używanych do definiowania jednostek Data Factory, specyficznych dla konektora Presto.

Właściwości połączonej usługi

Łącznik presto obsługuje teraz wersję 2.0. Aby zaktualizować wersję konektora Presto z wersji 1.0, zapoznaj się z tą sekcją. Aby uzyskać informacje szczegółowe dotyczące nieruchomości, zobacz odpowiednie sekcje.

Wersja 2.0

Połączona usługa Presto obsługuje następujące właściwości w przypadku zastosowania wersji 2.0:

Własność Opis Wymagane
typ Właściwość typu musi być ustawiona na: Presto Tak
wersja Wersja, którą określisz. Wartość to 2.0. Tak
gospodarz Adres IP lub nazwa hosta serwera Presto. (np. 192.168.222.160) Tak
katalog Kontekst katalogu dla wszystkich żądań do serwera. Tak
port Port TCP, którego serwer Presto używa do nasłuchiwania połączeń klientów. Domyślna wartość to 8443. Nie
Typ uwierzytelniania Mechanizm uwierzytelniania używany do łączenia się z serwerem Presto.
Dozwolone wartości to: Anonymous, LDAP
Tak
nazwa użytkownika Nazwa użytkownika używana do połączenia z serwerem Presto. Nie
hasło Hasło odpowiadające nazwie użytkownika. Oznacz to pole jako SecureString, aby bezpiecznie je przechowywać, lub odwołaj się do tajemnicy przechowywanej w Azure Key Vault. Nie
włączSsl Określa, czy połączenia z serwerem są szyfrowane za pomocą TLS. Wartość domyślna to true. Nie
włączWeryfikacjęCertyfikatuSerwera Określ, czy włączyć weryfikację certyfikatu SSL serwera podczas łączenia.
Zawsze używaj magazynu zaufania systemu. Wartość domyślna to true.
Nie
identyfikator strefy czasowej Strefa czasowa lokalna używana przez połączenie. Prawidłowe wartości dla tej opcji są określone w bazie danych stref czasowych IANA. Wartość domyślna to strefa czasowa systemu Presto. Nie

Przykład:

{
    "name": "PrestoLinkedService",
    "properties": {
        "type": "Presto",
        "version" : "2.0",
        "typeProperties": {
            "host" : "<host>",
            "catalog" : "<catalog>",
            "port" : 8443,
            "authenticationType" : "LDAP",
            "username" : "<username>",
            "password": {
                 "type": "SecureString",
                 "value": "<password>"
            },
            "enableSsl": true,
            "enableServerCertificateValidation": true,
            "timeZoneID" : ""
        }
    }
}

Wersja 1.0

Połączona usługa Presto obsługuje następujące właściwości w przypadku zastosowania wersji 1.0:

Własność Opis Wymagane
typ Właściwość typu musi być ustawiona na: Presto Tak
gospodarz Adres IP lub nazwa hosta serwera Presto. (np. 192.168.222.160) Tak
wersja serwera Wersja serwera Presto. (np. 0,148 t) Tak
katalog Kontekst katalogu dla wszystkich żądań do serwera. Tak
port Port TCP, którego serwer Presto używa do nasłuchiwania połączeń klientów. Domyślna wartość to 8080. Nie
Typ uwierzytelniania Mechanizm uwierzytelniania używany do łączenia się z serwerem Presto.
Dozwolone wartości to: Anonymous, LDAP
Tak
nazwa użytkownika Nazwa użytkownika używana do połączenia z serwerem Presto. Nie
hasło Hasło odpowiadające nazwie użytkownika. Oznacz to pole jako SecureString, aby bezpiecznie je przechowywać, lub odwołaj się do tajemnicy przechowywanej w Azure Key Vault. Nie
włączSsl Określa, czy połączenia z serwerem są szyfrowane za pomocą TLS. Wartość domyślna to fałsz. Nie
ścieżkaZaufanychCertyfikatów Pełna ścieżka do pliku .pem zawierającego zaufane certyfikaty CA do weryfikacji serwera podczas połączenia przez TLS. To ustawienie można skonfigurować tylko podczas korzystania z TLS na lokalnym IR. Domyślna wartość to plik cacerts.pem zainstalowany wraz z IR. Nie
użyjSystemowegoMagazynuZaufania Określa, czy użyć certyfikatu CA z systemowego magazynu zaufanych certyfikatów, czy z określonego pliku PEM. Wartość domyślna to fałsz. Nie
zezwólNaNiezgodnośćNazwyHostaiCN Określa, czy wymagać, aby nazwa certyfikatu TLS/SSL wystawionego przez urząd certyfikacji (CA) pasowała do nazwy hosta serwera podczas łączenia się przez TLS. Wartość domyślna to fałsz. Nie
zezwólNaSamoPodpisanyCertyfikatSerwera Określa, czy zezwolić na certyfikaty samopodpisane z serwera. Wartość domyślna to fałsz. Nie
identyfikator strefy czasowej Strefa czasowa lokalna używana przez połączenie. Prawidłowe wartości dla tej opcji są określone w bazie danych stref czasowych IANA. Wartość domyślna to strefa czasowa usługi Azure Data Factory. Nie

Przykład:

{
    "name": "PrestoLinkedService",
    "properties": {
        "type": "Presto",
        "typeProperties": {
            "host" : "<host>",
            "serverVersion" : "0.148-t",
            "catalog" : "<catalog>",
            "port" : "<port>",
            "authenticationType" : "LDAP",
            "username" : "<username>",
            "password": {
                 "type": "SecureString",
                 "value": "<password>"
            },
            "timeZoneID" : "Europe/Berlin"
        }
    }
}

Właściwości zbioru danych

Aby uzyskać pełną listę sekcji i właściwości dostępnych do definiowania zbiorów danych, zobacz artykuł datasets. Ta sekcja zawiera listę właściwości obsługiwanych przez zestaw danych Presto.

Aby skopiować dane z Presto, ustaw właściwość typu zestawu danych na PrestoObject. Następujące właściwości są obsługiwane:

Własność Opis Wymagane
typ Właściwość typu zbioru danych musi być ustawiona na: PrestoObject Tak
schemat Nazwa schematu. Nie (jeśli "zapytanie" w źródle aktywności jest określone)
tabela Nazwa tabeli. Nie (jeśli "zapytanie" w źródle aktywności jest określone)
nazwaTabeli Nazwa tabeli ze schematem. Ta właściwość jest obsługiwana dla zgodności wstecznej. Użyj schema i table dla nowego obciążenia pracą. Nie (jeśli "zapytanie" w źródle aktywności jest określone)

Przykład

{
    "name": "PrestoDataset",
    "properties": {
        "type": "PrestoObject",
        "typeProperties": {},
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Presto linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Właściwości czynności kopiowania

Aby uzyskać pełną listę sekcji i właściwości dostępnych do definiowania działań, zobacz artykuł Pipelines. Ta sekcja zawiera listę właściwości obsługiwanych przez źródło Presto.

Presto jako źródło

Aby skopiować dane z Presto, ustaw typ źródła w czynności kopiowania na PrestoSource. W sekcji source operacji kopiowania obsługiwane są następujące właściwości:

Własność Opis Wymagane
typ Właściwość typu źródła operacji kopiowania musi być ustawiona na: PrestoSource Tak
kwerenda Użyj niestandardowego zapytania SQL do odczytu danych. ** Na przykład: "SELECT * FROM MyTable". Nie (jeśli "tableName" w zestawie danych jest określony)

Przykład:

"activities":[
    {
        "name": "CopyFromPresto",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Presto input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "PrestoSource",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Mapowanie typów danych dla Presto

Podczas kopiowania danych z Presto stosowane są następujące mapowania z typów danych Presto do wewnętrznych typów danych używanych przez usługę. Aby dowiedzieć się, jak działanie kopiowania mapuje schemat źródłowy i typ danych na docelowy, zobacz Mapowanie schematu i typu danych.

Typ danych Presto Typ danych usługi tymczasowej (wersja 2.0) Typ danych usługi tymczasowej (wersja 1.0)
TABLICA Sznurek Sznurek
BIGINT Int64 Int64
BOOLOWSKI logiczny logiczny
CHAR Sznurek Sznurek
DATA Data kalendarzowa Data i czas
DECIMAL (Precyzja < 28) Liczba dziesiętna Liczba dziesiętna
DECIMAL (Precyzja >= 28) Liczba dziesiętna Sznurek
Podwójny Podwójny Podwójny
LICZBA CAŁKOWITA Int32 Int32
INTERVAL_DAY_TO_SECOND (przedział od dnia do sekundy) Przedział czasu Niewspierane.
OKRES_R_OKRES_M Sznurek Niewspierane.
IPADDRESS Sznurek Niewspierane.
JSON Sznurek Sznurek
MAPA Sznurek Sznurek
PRAWDZIWY Singiel Singiel
RZĄD Sznurek Sznurek
SMALLINT Int16 Int16
CZAS Czas Przedział czasu
CZAS_ZE_STREFĄ_CZASOWĄ Sznurek Sznurek
ZNACZNIK CZASU Data i czas Data i czas
ZNACZNIK_CZASU_Z_STREFĄ_CZASOWĄ Datetimeoffset Niewspierane.
TINYINT SByte Int16
Identyfikator UUID Przewodnik Niewspierane.
VARBINARY Bajt[] Bajt[]
VARCHAR Sznurek Sznurek

Właściwości czynności wyszukiwania

Aby dowiedzieć się więcej o właściwościach, sprawdź aktywność przeszukiwania.

Zaktualizuj łącznik Presto

Oto kroki, które pomogą Ci zaktualizować łącznik Presto:

  1. Na stronie Edytowanie połączonej usługi wybierz wersję 2.0 i skonfiguruj połączoną usługę, odwołując się do właściwości połączonej usługi w wersji 2.0.

  2. Mapowanie typu danych dla połączonej usługi Presto w wersji 2.0 różni się od tego dla wersji 1.0. Aby dowiedzieć się więcej na temat najnowszego mapowania typów danych, zobacz Mapowanie typów danych dla usługi Presto.

Różnice między łącznikiem presto w wersji 2.0 i wersji 1.0

Łącznik Presto w wersji 2.0 oferuje nowe funkcje i jest zgodny z większością funkcji wersji 1.0. W poniższej tabeli przedstawiono różnice funkcji między wersją 2.0 a wersją 1.0.

Wersja 2.0 Wersja 1.0
serverVersion nie jest obsługiwana. serverVersion jest obsługiwany.
Wartość domyślna to port 8443. Wartość domyślna to port 8080.
Wartość domyślna enableSSL to prawda.

enableServerCertificateValidation jest obsługiwany.

trustedCertPath, useSystemTrustStoreallowHostNameCNMismatch i allowSelfSignedServerCert nie są obsługiwane.
Domyślna wartość enableSSL to fałsz.

enableServerCertificateValidation nie jest obsługiwana.

trustedCertPath, useSystemTrustStore, allowHostNameCNMismatch i allowSelfSignedServerCert są obsługiwane.
Wartość domyślna to strefa czasowa timeZoneID systemu Presto. Wartość domyślna to strefa czasowa timeZoneID usługi Azure Data Factory.
Następujące mapowania są używane z typów danych Presto do tymczasowego typu danych usługi.

DATA —> data
DECYMALNY (dokładność >= 28) —> liczba dziesiętna
INTERVAL_DAY_TO_SECOND -> PrzedziałCzasu
INTERVAL_YEAR_TO_MONTH —> ciąg znaków
IPADDRESS —> ciąg znaków
CZAS -> Czas
TIMESTAMPWITHTIMEZONE —> Datetimeoffset
TINYINT —> SByte
UUID —> GUID
Następujące mapowania są używane z typów danych Presto do tymczasowego typu danych usługi.

DATA -> Data i czas
DECIMAL (Precyzja >= 28) -> String
TIME —> TimeSpan
TINYINT — > Int16
Inne mapowania obsługiwane przez wersję 2.0 po lewej stronie nie są obsługiwane przez wersję 1.0.

Aby uzyskać listę magazynów danych obsługiwanych jako źródła i odbiorniki przez czynność kopiowania, zobacz obsługiwane magazyny danych.