Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Typowym scenariuszem podczas dołączania do usługi Azure Data Explorer jest pozyskiwanie danych historycznych, czasami nazywanych wypełnianiem kopii zapasowych. Proces obejmuje pozyskiwanie danych z istniejącego systemu magazynowania do tabeli, która jest kolekcją zakresów.
Pozyskiwanie danych historycznych przy użyciu właściwości pozyskiwania creationTime w celu ustawienia czasu tworzenia zakresów do czasu utworzenia danych. Użycie czasu tworzenia jako kryterium partycjonowania pozyskiwania może starzeć dane zgodnie z zasadami pamięci podręcznej i przechowywania oraz zwiększyć wydajność filtrów czasu.
Domyślnie czas tworzenia zakresów jest ustawiany na czas pozyskiwania danych, co może nie generować oczekiwanego zachowania. Załóżmy na przykład, że masz tabelę zawierającą okres pamięci podręcznej 30 dni i okres przechowywania dwóch lat. W normalnym przepływie dane pozyskane podczas ich produkcji są buforowane przez 30 dni, a następnie przenoszone do magazynu zimnego. Po dwóch latach, na podstawie czasu tworzenia, starsze dane są usuwane jeden dzień naraz. Jeśli jednak pozyskujesz dwa lata danych historycznych, w których domyślnie dane są oznaczone czasem tworzenia w miarę pozyskiwania danych. To zachowanie może nie wygenerować żądanego wyniku, ponieważ:
- Wszystkie dane ląduje w pamięci podręcznej i pozostają tam przez 30 dni, używając większej ilości pamięci podręcznej niż oczekiwano.
- Starsze dane nie są usuwane jeden dzień naraz; w związku z tym dane są przechowywane w klastrze dłużej niż jest to konieczne, a po dwóch latach wszystkie zostaną usunięte jednocześnie.
- Dane, wcześniej pogrupowane według daty w systemie źródłowym, mogą być teraz wsadowe w tym samym zakresie, co prowadzi do nieefektywnych zapytań.
Z tego artykułu dowiesz się, jak partycjonować dane historyczne:
Używanie właściwości pozyskiwania podczas pozyskiwania
creationTime(zalecane)Jeśli to możliwe, pozyskaj dane historyczne, korzystając z
creationTimewłaściwości pozyskiwania, która pozwala ustawić czas tworzenia zakresów, wyodrębniając go ze ścieżki pliku lub obiektu blob. Jeśli struktura folderów nie używa wzorca daty utworzenia, zmień strukturę pliku lub ścieżki obiektu blob, aby odzwierciedlić czas tworzenia. Przy użyciu tej metody dane są pozyskiwane do tabeli z prawidłowym czasem tworzenia, a okresy przechowywania i pamięci podręcznej są stosowane poprawnie.Uwaga
Domyślnie zakresy są partycjonowane według czasu tworzenia (pozyskiwania) i w większości przypadków nie ma potrzeby ustawiania zasad partycjonowania danych.
Używanie zasad partycjonowania po pozyskaniu
Jeśli nie możesz użyć
creationTimewłaściwości pozyskiwania, na przykład w przypadku pozyskiwania danych przy użyciu łącznika usługi Azure Cosmos DB , w którym nie możesz kontrolować czasu tworzenia lub jeśli nie możesz restrukturyzacji struktury folderów, możesz ponownie podzielić tabelę po pozyskiwaniu, aby osiągnąć ten sam efekt przy użyciu zasad partycjonowania. Jednak ta metoda może wymagać metody prób i błędów w celu zoptymalizowania parametrów polityki i jest mniej wydajna niż użycie właściwości pozyskiwaniacreationTime. Użyj tej metody tylko wtedy, gdy użycie właściwości pozyskiwaniacreationTimenie jest możliwe.
Wymagania wstępne
- Konto Microsoft lub tożsamość użytkownika Microsoft Entra. Nie potrzebujesz subskrypcji platformy Azure.
- Baza danych i klaster usługi Azure Data Explorer. Utwórz klaster i bazę danych.
- Konto magazynu.
- Aby uzyskać zalecaną metodę używania właściwości pozyskiwania podczas pozyskiwania, zainstaluj metodę
creationTimeLightIngest.
Pozyskiwanie danych historycznych
Partycjonuj dane historyczne, używając właściwości importowania podczas wczytywania creationTime. Jeśli nie możesz użyć tej metody, możesz ponownie podzielić tabelę po zaimportowaniu danych przy użyciu polityki partycjonowania.
LightIngest przydaje się do ładowania danych historycznych z istniejącego systemu magazynu do usługi Azure Data Explorer. Chociaż możesz utworzyć własne polecenie przy użyciu listy argumentów wiersza polecenia, w tym artykule pokazano, jak automatycznie wygenerować to polecenie za pomocą kreatora importu danych. Oprócz utworzenia polecenia można użyć tego procesu, aby utworzyć nową tabelę i utworzyć mapowanie schematu. To narzędzie wywnioskowuje mapowanie schematu z zestawu danych.
Element docelowy
W internetowym interfejsie użytkownika usługi Azure Data Explorer z menu po lewej stronie wybierz pozycję Zapytanie.
Kliknij prawym przyciskiem myszy bazę danych, w której chcesz pozyskać dane, a następnie wybierz pozycję LightIngest.
Zostanie otwarte okno Pozyskiwanie danych z wybraną kartą Miejsce docelowe . Pola Klaster i Baza danych są wypełniane automatycznie.
Wybierz tabelę docelową. Aby pozyskać dane do nowej tabeli, wybierz pozycję Nowa tabela, a następnie wprowadź nazwę tabeli.
Uwaga
Nazwy tabel mogą zawierać maksymalnie 1024 znaki, w tym spacje, znaki alfanumeryczne, łączniki i podkreślenia. Znaki specjalne nie są obsługiwane.
Wybierz pozycję Dalej: Źródło.
Źródło
W obszarze Wybierz źródło wybierz pozycję Dodaj adres URL lub Wybierz kontener.
Podczas dodawania adresu URL w obszarze Link do źródła określ klucz konta lub adres URL sygnatury dostępu współdzielonego do kontenera. Adres URL sygnatury dostępu współdzielonego można utworzyć ręcznie lub automatycznie.
Podczas wybierania kontenera z konta magazynu wybierz subskrypcję magazynu, konto magazynu i kontener z menu rozwijanych.
Uwaga
Maksymalny rozmiar pliku obsługiwany w pozyskiwaniu wynosi 6 GB. Zaleceniem jest pozyskiwanie plików z zakresu od 100 MB do 1 GB.
Wybierz pozycję Ustawienia zaawansowane, aby zdefiniować dodatkowe ustawienia procesu pozyskiwania przy użyciu technologii LightIngest.
W okienku Konfiguracja zaawansowana zdefiniuj ustawienia LightIngest zgodnie z poniższą tabelą.
Właściwości opis Wzorzec czasu tworzenia Określ, aby zastąpić właściwość czasu pozyskiwania utworzonego zakresu wzorcem, na przykład, aby zastosować datę na podstawie struktury folderów kontenera. Zobacz również Wzorzec czasu tworzenia. Wzorzec nazwy obiektu blob Określ wzorzec używany do identyfikowania plików do importu. Pozyskaj wszystkie pliki zgodne ze wzorcem nazwy obiektu blob w danym kontenerze. Obsługuje symbole wieloznaczne. Zalecamy ujęcie w cudzysłów podwójnych. Tag Tag przypisany do pozyskanych danych. Tag może być dowolnym ciągiem. Ograniczanie ilości plików Określ liczbę plików do przetworzenia. Pozyskiwanie pierwszych nplików, które są zgodne ze wzorcem nazwy obiektu blob, do określonej liczby.Nie czekaj na zakończenie pozyskiwania W przypadku ustawienia obiekty blob są kolejki do pozyskiwania bez monitorowania procesu pozyskiwania. Jeśli nie zostanie ustawiona, funkcja LightIngest będzie nadal sondować stan pozyskiwania do momentu ukończenia pozyskiwania. Wyświetlanie tylko wybranych elementów Wyświetl listę plików w kontenerze, ale nie pozyskuje ich. Wybierz pozycję Gotowe , aby powrócić do karty Źródło .
Opcjonalnie wybierz pozycję Filtry plików, aby filtrować dane w celu pozyskiwania tylko plików w określonej ścieżce folderu lub przy użyciu określonego rozszerzenia pliku.
Domyślnie jeden z plików w kontenerze jest losowo wybierany i używany do generowania schematu dla tabeli.
Opcjonalnie w obszarze Plik definiujący schemat określ plik do użycia.
Wybierz pozycję Dalej: Schemat , aby wyświetlić i edytować konfigurację kolumny tabeli.
Schemat
Karta schematu zawiera podgląd danych.
Aby wygenerować polecenie LightIngest, wybierz pozycję Dalej: Rozpocznij pozyskiwanie.
Opcjonalnie:
- Zmień automatycznie wnioskowany format danych, wybierając żądany format z menu rozwijanego.
- Zmień automatycznie wnioskowaną nazwę mapowania. Można użyć znaków alfanumerycznych i podkreśleń. Spacje, znaki specjalne i łączniki nie są obsługiwane.
- W przypadku korzystania z istniejącej tabeli można zachować bieżący schemat tabeli, jeśli schemat tabeli jest zgodny z wybranym formatem.
- Wybierz pozycję Przeglądarka poleceń, aby wyświetlić i skopiować polecenia automatyczne wygenerowane na podstawie danych wejściowych.
- Edytuj kolumny. W obszarze Podgląd częściowych danych wybierz menu rozwijane kolumn, aby zmienić różne aspekty tabeli.
Zmiany, które można wprowadzić w tabeli, zależą od następujących parametrów:
- Typ tabeli jest nowy lub istniejący
- Typ mapowania to nowy lub istniejący
| Typ tabeli | Typ mapowania | Dostępne korekty |
|---|---|---|
| Nowa tabela | Nowe mapowanie | Zmień typ danych, Zmień nazwę kolumny, Nowa kolumna, Usuń kolumnę, Aktualizuj kolumnę, Sortuj rosnąco, Sortuj malejąco |
| Istniejąca tabela | Nowe mapowanie | Nowa kolumna (na której można następnie zmienić typ danych, zmienić nazwę i zaktualizować) Aktualizuj kolumnę, Sortuj rosnąco, Sortuj malejąco |
| Istniejące mapowanie | Sortuj rosnąco, Sortuj malejąco |
Uwaga
Podczas dodawania nowej kolumny lub aktualizowania kolumny można zmienić przekształcenia mapowania. Aby uzyskać więcej informacji, zobacz Przekształcenia mapowania
Pozyskiwanie
Gdy tabela, mapowanie i polecenie LightIngest wyświetlają zielone znaczniki wyboru, wybierz ikonę kopiowania w prawym górnym rogu pola wygenerowane polecenie, w celu skopiowania wygenerowanego polecenia LightIngest.
Uwaga
Jeśli jest to wymagane, możesz pobrać narzędzie LightIngest, wybierając pozycję Pobierz lightingest.
Aby ukończyć proces pozyskiwania, należy uruchomić polecenie LightIngest przy użyciu skopiowanego polecenia.