Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
DOTYCZY:
Azure Data Factory
Azure Synapse Analytics
Napiwek
Wypróbuj usługę Data Factory w usłudze Microsoft Fabric — rozwiązanie analityczne typu all-in-one dla przedsiębiorstw. Usługa Microsoft Fabric obejmuje wszystko, od przenoszenia danych do nauki o danych, analizy w czasie rzeczywistym, analizy biznesowej i raportowania. Dowiedz się, jak bezpłatnie rozpocząć nową wersję próbną !
W tym artykule opisano sposób używania działania kopiowania w potoku usługi Azure Data Factory lub Synapse Analytics do kopiowania danych z usługi Impala. Jest on oparty na artykule Omówienie działania kopiowania, który przedstawia ogólne omówienie działania kopiowania.
Ważne
Łącznik Impala w wersji 1.0 jest na etapie usuwania. Zaleca się uaktualnienie łącznika Impala z wersji 1.0 do 2.0.
Obsługiwane możliwości
Ten łącznik Impala jest obsługiwany w przypadku następujących możliwości:
| Obsługiwane możliwości | środowisko IR |
|---|---|
| działanie Kopiuj (źródło/-) | (1) (2) |
| Działanie Lookup | (1) (2) |
(1) Środowisko Azure Integration Runtime (2) Self-hosted Integration Runtime
Aby uzyskać listę magazynów danych obsługiwanych jako źródła lub ujścia przez działanie kopiowania, zobacz tabelę Obsługiwane magazyny danych.
Usługa udostępnia wbudowany sterownik umożliwiający łączność. W związku z tym nie trzeba ręcznie instalować sterownika do korzystania z tego łącznika.
Wymagania wstępne
Jeśli magazyn danych znajduje się wewnątrz sieci lokalnej, sieci wirtualnej platformy Azure lub chmury prywatnej Amazon Virtual, musisz skonfigurować własne środowisko Integration Runtime , aby się z nim połączyć.
Jeśli magazyn danych jest zarządzaną usługą danych w chmurze, możesz użyć środowiska Azure Integration Runtime. Jeśli dostęp jest ograniczony do adresów IP zatwierdzonych w regułach zapory, możesz dodać adresy IP środowiska Azure Integration Runtime do listy dozwolonych.
Możesz również użyć funkcji środowiska Integration Runtime zarządzanej sieci wirtualnej w usłudze Azure Data Factory, aby uzyskać dostęp do sieci lokalnej bez instalowania i konfigurowania własnego środowiska Integration Runtime.
Aby uzyskać więcej informacji na temat mechanizmów zabezpieczeń sieci i opcji obsługiwanych przez usługę Data Factory, zobacz Strategie dostępu do danych.
Uwaga / Notatka
Wersja 2.0 jest obsługiwana w przypadku własnego środowiska Integration Runtime w wersji 5.55 lub nowszej.
Wprowadzenie
Aby wykonać działanie kopiowania za pomocą pipeline'u, możesz użyć jednego z następujących narzędzi lub zestawów SDK:
- Narzędzie do kopiowania danych
- Portal Azure
- zestawu SDK platformy .NET
- Zestaw SDK dla języka Python
- Azure PowerShell
- API REST
- Szablon usługi Azure Resource Manager
Tworzenie połączonej usługi z usługą Impala przy użyciu interfejsu użytkownika
Wykonaj poniższe kroki, aby utworzyć połączoną usługę z aplikacją Impala w interfejsie użytkownika witryny Azure Portal.
Przejdź do karty Zarządzanie w obszarze roboczym usługi Azure Data Factory lub Synapse i wybierz pozycję Połączone usługi, a następnie kliknij pozycję Nowy:
Wyszukaj ciąg Impala i wybierz łącznik Impala.
Skonfiguruj szczegóły usługi, przetestuj połączenie i utwórz nową połączoną usługę.
Szczegóły konfiguracji łącznika
Poniższe sekcje zawierają szczegółowe informacje o właściwościach używanych do definiowania jednostek usługi Data Factory specyficznych dla łącznika Impala.
Właściwości połączonej usługi
Łącznik Impala obsługuje teraz wersję 2.0. Zapoznaj się z tą sekcją , aby uaktualnić wersję łącznika Impala z wersji 1.0. Aby uzyskać informacje szczegółowe dotyczące nieruchomości, zobacz odpowiednie sekcje.
Wersja 2.0
Połączona usługa Impala obsługuje następujące właściwości w przypadku zastosowania wersji 2.0:
| Właściwości | Opis | Wymagania |
|---|---|---|
| typ | Właściwość type musi być ustawiona na Impala. | Tak |
| wersja | Wersja, którą określisz. Wartość to 2.0. |
Tak |
| gospodarz | Adres IP lub nazwa hosta serwera Impala (tj. 192.168.222.160). | Tak |
| port | Port TCP używany przez serwer Impala do nasłuchiwania połączeń klienckich. Wartość domyślna to 21050. | Nie. |
| thriftTransportProtocol (protokół transportowy) | Protokół transportowy do użycia w warstwie Thrift. Dozwolone wartości to: Binary, HTTP. Wartość domyślna to Binary. | Tak |
| Typ uwierzytelniania | Typ uwierzytelniania do użycia. Dozwolone wartości to Anonimowe i UsernameAndPassword. |
Tak |
| nazwa użytkownika | Nazwa użytkownika używana do uzyskiwania dostępu do serwera Impala. | Nie. |
| hasło | Hasło odpowiadające nazwie użytkownika podczas korzystania z nazwy użytkownikaAndPassword. Oznacz to pole jako element SecureString w celu bezpiecznego przechowywania go lub odwołuj się do wpisu tajnego przechowywanego w usłudze Azure Key Vault. | Nie. |
| włączSsl | Określa, czy połączenia z serwerem są szyfrowane przy użyciu protokołu TLS. Wartość domyślna to true. | Nie. |
| włączWeryfikacjęCertyfikatuSerwera | Określ, czy włączyć weryfikację certyfikatu SSL serwera podczas łączenia. Zawsze używaj magazynu zaufania systemu. Wartość domyślna to true. | Nie. |
| connectVia (połącz się) | Środowisko Integration Runtime do nawiązania połączenia z magazynem danych. Dowiedz się więcej w sekcji Wymagania wstępne . Jeśli nie zostanie określony, używa domyślnego środowiska Azure Integration Runtime. Możesz użyć własnego środowiska Integration Runtime, a jego wersja powinna mieć wartość 5.55 lub nowszą. | Nie. |
Przykład:
{
"name": "ImpalaLinkedService",
"properties": {
"type": "Impala",
"version": "2.0",
"typeProperties": {
"host" : "<host>",
"port" : "<port>",
"authenticationType" : "UsernameAndPassword",
"username" : "<username>",
"password": {
"type": "SecureString",
"value": "<password>"
},
"enableSsl": true,
"thriftTransportProtocol": "Binary",
"enableServerCertificateValidation": true
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Wersja 1.0
Następujące właściwości są obsługiwane w przypadku połączonej usługi Impala w przypadku zastosowania wersji 1.0:
Następujące właściwości są obsługiwane w przypadku połączonej usługi Impala.
| Właściwości | Opis | Wymagania |
|---|---|---|
| typ | Właściwość type musi być ustawiona na Impala. | Tak |
| gospodarz | Adres IP lub nazwa hosta serwera Impala (tj. 192.168.222.160). | Tak |
| port | Port TCP używany przez serwer Impala do nasłuchiwania połączeń klienckich. Wartość domyślna to 21050. | Nie. |
| Typ uwierzytelniania | Typ uwierzytelniania do użycia. Dozwolone wartości to Anonimowe, SASLUsername i UsernameAndPassword. |
Tak |
| nazwa użytkownika | Nazwa użytkownika używana do uzyskiwania dostępu do serwera Impala. Wartość domyślna jest anonimowa w przypadku używania nazwy SASLUsername. | Nie. |
| hasło | Hasło odpowiadające nazwie użytkownika podczas korzystania z nazwy użytkownikaAndPassword. Oznacz to pole jako element SecureString w celu bezpiecznego przechowywania go lub odwołuj się do wpisu tajnego przechowywanego w usłudze Azure Key Vault. | Nie. |
| włączSsl | Określa, czy połączenia z serwerem są szyfrowane przy użyciu protokołu TLS. Domyślna wartość to false. | Nie. |
| ścieżkaZaufanychCertyfikatów | Pełna ścieżka pliku pem zawierającego zaufane certyfikaty urzędu certyfikacji używane do weryfikowania serwera podczas nawiązywania połączenia za pośrednictwem protokołu TLS. Tę właściwość można ustawić tylko wtedy, gdy używasz protokołu TLS w własnym środowisku Integration Runtime. Wartość domyślna to plik cacerts.pem zainstalowany w środowisku Integration Runtime. | Nie. |
| użyjSystemowegoMagazynuZaufania | Określa, czy należy użyć certyfikatu urzędu certyfikacji z magazynu zaufania systemu, czy z określonego pliku PEM. Domyślna wartość to false. | Nie. |
| zezwólNaNiezgodnośćNazwyHostaiCN | Określa, czy podczas nawiązywania połączenia za pośrednictwem protokołu TLS/SSL nazwa certyfikatu TLS/SSL ma być zgodna z nazwą hosta serwera. Domyślna wartość to false. | Nie. |
| zezwólNaSamopodpisanyCertyfikatSerwera | Określa, czy zezwalać na certyfikaty z podpisem własnym z serwera. Domyślna wartość to false. | Nie. |
| connectVia (połącz się) | Środowisko Integration Runtime do nawiązania połączenia z magazynem danych. Dowiedz się więcej w sekcji Wymagania wstępne . Jeśli nie zostanie określony, używa domyślnego środowiska Azure Integration Runtime. | Nie. |
Przykład:
{
"name": "ImpalaLinkedService",
"properties": {
"type": "Impala",
"typeProperties": {
"host" : "<host>",
"port" : "<port>",
"authenticationType" : "UsernameAndPassword",
"username" : "<username>",
"password": {
"type": "SecureString",
"value": "<password>"
}
},
"connectVia": {
"referenceName": "<name of Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Właściwości zestawu danych
Aby uzyskać pełną listę sekcji i właściwości dostępnych do definiowania zestawów danych, zobacz artykuł Zestawy danych. Ta sekcja zawiera listę właściwości obsługiwanych przez zestaw danych Impala.
Aby skopiować dane z impala, ustaw właściwość type zestawu danych na ImpalaObject. Obsługiwane są następujące właściwości:
| Właściwości | Opis | Wymagania |
|---|---|---|
| typ | Właściwość type zestawu danych musi być ustawiona na: ImpalaObject | Tak |
| schemat | Nazwa schematu. | Nie (jeśli określono "zapytanie" w źródle działania) |
| tabela | Nazwa tabeli. | Nie (jeśli określono "zapytanie" w źródle działania) |
| nazwaTabeli | Nazwa tabeli ze schematem. Ta właściwość jest obsługiwana w celu zapewnienia zgodności z poprzednimi wersjami. Użyj polecenia schema i table dla nowego obciążenia. |
Nie (jeśli określono "zapytanie" w źródle działania) |
Przykład
{
"name": "ImpalaDataset",
"properties": {
"type": "ImpalaObject",
"typeProperties": {},
"schema": [],
"linkedServiceName": {
"referenceName": "<Impala linked service name>",
"type": "LinkedServiceReference"
}
}
}
Właściwości działania kopiowania
Aby uzyskać pełną listę sekcji i właściwości dostępnych do definiowania działań, zobacz artykuł Pipelines (Potoki ). Ta sekcja zawiera listę właściwości obsługiwanych przez typ źródła Impala.
Impala jako typ źródła
Aby skopiować dane z impala, ustaw typ źródła w działaniu kopiowania na ImpalaSource. Poniższe właściwości są obsługiwane w sekcji źródła działania kopiowania.
| Właściwości | Opis | Wymagania |
|---|---|---|
| typ | Właściwość type źródła działania kopiowania musi być ustawiona na Wartość ImpalaSource. | Tak |
| kwerenda | Użyj niestandardowego zapytania SQL, aby odczytać dane. Może to być na przykład "SELECT * FROM MyTable". |
Nie (jeśli określono "tableName" w zestawie danych) |
Przykład:
"activities":[
{
"name": "CopyFromImpala",
"type": "Copy",
"inputs": [
{
"referenceName": "<Impala input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "ImpalaSource",
"query": "SELECT * FROM MyTable"
},
"sink": {
"type": "<sink type>"
}
}
}
]
Mapowanie typów danych dla impala
Podczas kopiowania danych z i do Impala stosuje się następujące tymczasowe mapowania typów danych w usłudze. Aby dowiedzieć się, jak działanie kopiowania mapuje schemat źródłowy i typ danych na docelowy, zobacz Mapowanie schematu i typu danych.
| Typ danych Impala | Typ danych usługi tymczasowej (wersja 2.0) | Typ danych usługi tymczasowej (wersja 1.0) |
|---|---|---|
| TABLICA | Sznurek | Sznurek |
| BIGINT | Int64 | Int64 |
| BOOLOWSKI | logiczny | logiczny |
| CHAR | Sznurek | Sznurek |
| DATA | Data i Czas | Data i Czas |
| DZIESIĘTNA | Liczba dziesiętna | Liczba dziesiętna |
| Podwójny | Podwójny | Podwójny |
| PŁYWAĆ | Singiel | Singiel |
| INT | Int32 | Int32 |
| MAPA | Sznurek | Sznurek |
| SMALLINT | Int16 | Int16 |
| STRUNA | Sznurek | Sznurek |
| STRUKTURA | Sznurek | Sznurek |
| ZNACZNIK CZASU | PrzesunięcieDatyICzasu | Data i Czas |
| TINYINT | SByte | Int16 |
| VARCHAR | Sznurek | Sznurek |
Właściwości działania wyszukiwania
Aby dowiedzieć się więcej o właściwościach, sprawdź działanie Wyszukiwania.
Cykl życia i uaktualnianie łącznika Impala
W poniższej tabeli przedstawiono etap wydania i dzienniki zmian dla różnych wersji łącznika Impala:
| wersja | Etap wydania | Dziennik zmian |
|---|---|---|
| Wersja 1.0 | Removed | Nie dotyczy. |
| Wersja 2.0 | Wersja GA dostępna | • Wersja własnego środowiska Integration Runtime powinna być 5.55 lub nowsza. • Wartość domyślna enableSSL to true.
enableServerCertificateValidation jest obsługiwany.trustedCertPath, useSystemTrustStoreallowHostNameCNMismatch i allowSelfSignedServerCert nie są obsługiwane. • TIMESTAMP jest odczytywana jako typ danych DateTimeOffset. • TINYINT jest odczytywany jako typ danych SByte. • Typ uwierzytelniania SASLUsername nie jest obsługiwany. |
Uaktualnianie łącznika Impala z wersji 1.0 do wersji 2.0
Na stronie Edytowanie połączonej usługi wybierz wersję 2.0 i skonfiguruj połączoną usługę, odwołując się do właściwości połączonej usługi w wersji 2.0.
Mapowanie typu danych dla połączonej usługi Impala w wersji 2.0 różni się od tego dla wersji 1.0. Aby dowiedzieć się więcej na temat najnowszego mapowania typów danych, zobacz Mapowanie typów danych dla programu Impala.
Zastosuj samodzielnie hostowane środowisko Integration Runtime w wersji 5.55 lub nowszej.
Powiązana zawartość
Aby uzyskać listę magazynów danych obsługiwanych jako źródła i ujścia działania kopiowania, zobacz Obsługiwane magazyny danych.