Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
W tym artykule opisano, jak używać aktywności kopiowania w rurze przetwarzającej danych z użyciem protokołu HTTP do kopiowania danych.
Obsługiwany format
Protokół HTTP obsługuje następujące formaty plików. Zapoznaj się z każdym artykułem, aby zapoznać się z ustawieniami opartymi na formacie.
- Format Avro
- Format binarny
- Format tekstu rozdzielanego
- Format programu Excel
- Format JSON
- Format ORC
- Format Parquet
- Format XML
Obsługiwana konfiguracja
W przypadku konfiguracji każdej zakładki podczas czynności kopiowania przejdź odpowiednio do poniższych sekcji.
Uwaga / Notatka
Miejsce docelowe nie jest obsługiwane w łączniku HTTP.
General
Zapoznaj się z wskazówkami dotyczącymi ustawień ogólnych, aby skonfigurować kartę ustawień ogólnych.
Źródło
Następujące właściwości są obsługiwane dla protokołu HTTP na karcie Źródło działania kopiowania.
Wymagane są następujące trzy właściwości:
- Połączenie: wybierz połączenie HTTP z listy połączeń. Jeśli połączenie nie istnieje, utwórz nowe połączenie HTTP, wybierając pozycję Nowy.
- Typ połączenia: wybierz pozycję HTTP.
-
Względny adres URL: względny adres URL zasobu, który zawiera dane. Jeśli ta właściwość nie jest określona, używany jest tylko adres URL określony w definicji połączenia. Łącznik HTTP kopiuje dane z połączonego adresu URL:
/[relative URL specified]. - Ustawienia pliku: wybierz pozycję Ustawienia pliku , aby skonfigurować format pliku. Aby uzyskać szczegółowe informacje o ustawieniach różnych formatów plików, zobacz artykuły w obsługiwanych formatach.
W obszarze Zaawansowane można określić następujące pola:
Metoda żądania: metoda HTTP. Dozwolone wartości to Get (wartość domyślna) i Post.
Dodatkowe nagłówki: dodatkowe nagłówki do żądań HTTP.
Treść żądania HTTP: żądanie HTTP.
Limit czasu żądania: limit czasu (wartość przedziału czasu) żądania HTTP w celu uzyskania odpowiedzi. Ta wartość to limit czasu pobierania odpowiedzi, a nie limit czasu odczytu danych odpowiedzi. Wartość domyślna to 00:01:40.
Maksymalna liczba współbieżnych połączeń: górny limit połączeń współbieżnych ustanowionych z magazynem danych podczas uruchamiania działania. Określ wartość tylko wtedy, gdy chcesz ograniczyć połączenia współbieżne.
Pomiń liczbę wierszy: liczba niepustych wierszy do pominięcia podczas odczytywania danych z plików wejściowych.
dodatkowe kolumny: Dodaj dodatkowe kolumny danych, aby przechowywać ścieżkę względną plików źródłowych lub wartość statyczną. Wyrażenie jest obsługiwane dla tego ostatniego przypadku.
Mapowanie
Aby uzyskać informacje o konfiguracji karty Mapowanie , zobacz Konfigurowanie mapowań na karcie mapowania. Jeśli wybierzesz plik binarny jako format pliku, mapowanie nie będzie obsługiwane.
Ustawienia
Aby uzyskać konfigurację karty Ustawienia, przejdź do Konfiguruj pozostałe ustawienia na karcie ustawień.
Podsumowanie tabeli
Poniższa tabela zawiera więcej informacji o działaniu kopiowania w protokole HTTP.
Źródło
| Name | Description | Wartość | Wymagane | Właściwość skryptu JSON |
|---|---|---|---|---|
| Połączenie | Twoja łączność z źródłowym magazynem danych. | <połączenie> | Tak | połączenie |
| Connection type (Typ połączenia) | Połączenie danych źródłowych. | <połączenie źródła> | Tak | / |
| Względny adres URL | Względny adres URL zasobu, który zawiera dane. Jeśli ta właściwość nie jest określona, używany jest tylko adres URL określony w definicji połączenia. Łącznik HTTP kopiuje dane z połączonego adresu URL: /[relative URL specified]. |
<względny adres URL> | Nie. | relativeUrl |
| Metoda żądania | Metoda HTTP. Dozwolone wartości to Get (wartość domyślna) i Post. | •GET •POST |
Nie. | requestMethod |
| Dodatkowe nagłówki | Dodatkowe nagłówki żądań HTTP. | <dodatkowe nagłówki> | Nie. | additionalHeaders |
| Treść żądania | Treść żądania dla żądania HTTP. | <treść żądania HTTP POST> | Nie. | requestBody |
| Limit czasu żądania | Limit czasu (wartość przedziału czasu) żądania HTTP w celu uzyskania odpowiedzi. Ta wartość to limit czasu pobierania odpowiedzi, a nie limit czasu odczytu danych odpowiedzi. Wartość domyślna to 00:01:40. | timespan | Nie. | requestTimeout |
| maksymalna liczba współbieżnych połączeń | Górny limit nawiązywanych jednocześnie połączeń z magazynem danych podczas wykonywania działania. Określ wartość tylko wtedy, gdy chcesz ograniczyć połączenia współbieżne. | <maksymalna liczba współbieżnych połączeń> | Nie. | maxConcurrentConnections |
| Pomiń liczbę wierszy | Liczba niepustych wierszy do pominięcia podczas odczytywania danych z plików wejściowych. | <licznik pominiętych wierszy> | Nie. | skipLineCount |
| Dodatkowe kolumny | Dodaj dodatkowe kolumny danych, aby przechowywać ścieżkę względną plików źródłowych lub wartość statyczną. Wyrażenie jest obsługiwane dla tego ostatniego przypadku. | •Nazwa •Wartość |
Nie. | dodatkoweKolumny: •nazwa •wartość |