Udostępnij przez


Importowanie domen z pliku programu Excel w odkrywaniu wiedzy — Data Quality Services (DQS)

Dotyczy:programu SQL Server

Ważne

Usługi Data Quality Services (DQS) są usuwane w programie SQL Server 2025 (17.x). Nadal obsługujemy DQS w programie SQL Server 2022 (16.x) i starszych wersjach.

W tym temacie opisano sposób importowania co najmniej jednej domeny z pliku programu Excel w działaniu odnajdywania wiedzy usług Data Quality Services (DQS). Proces importowania upraszcza proces generowania wiedzy, oszczędzając czas i nakład pracy. Umożliwia to osobom, które mają dane w pliku programu Excel lub pliku tekstowym, aby utworzyć bazę wiedzy przy użyciu tych danych. (Zobacz Importowanie wartości z pliku programu Excel do domeny, aby uzyskać więcej informacji na temat importowania wartości do domeny istniejącej bazy wiedzy). Eksportowanie do pliku programu Excel nie jest obsługiwane.

Przed rozpoczęciem

Warunki wstępne

Aby zaimportować domeny z pliku programu Excel, program Excel musi być zainstalowany na komputerze, na którym jest zainstalowany klient jakości danych; Musisz utworzyć plik programu Excel z wartościami domeny (zobacz Jak działa importowanie); i musisz utworzyć i otworzyć bazę wiedzy, aby zaimportować domenę do.

Zabezpieczenia

Uprawnienia

Aby zaimportować domeny z pliku programu Excel, musisz mieć rolę dqs_kb_editor lub rolę dqs_administrator w bazie danych DQS_MAIN.

Importowanie domen z pliku programu Excel do bazy wiedzy

  1. Uruchom klienta jakości danych. Aby uzyskać więcej informacji na ten temat, zapoznaj się z Uruchamianie aplikacji Data Quality Client.

  2. Na ekranie głównym Klienta jakości danych wykonaj jedną z następujących czynności:

    • Utwórz nową bazę wiedzy do zaimportowania, klikając pozycję Nowa baza wiedzy, wprowadzając nazwę bazy wiedzy, wybierając pozycję Brak dla Utwórz bazę wiedzy z, wybierając działanie Odkrywanie wiedzy, a następnie klikając pozycję Utwórz.

    • Otwórz istniejącą bazę wiedzy, aby ją zaimportować, klikając Otwórz bazę wiedzy, następnie wybierz bazę wiedzy, wybierz Odnajdywanie wiedzy, a następnie kliknij Dalej.

  3. Na stronie mapy wybierz pozycję plik programu Excel dla źródła danych .

  4. Kliknij pozycję Przeglądaj w wierszu pliku programu Excel.

  5. W oknie dialogowym Wybierz plik programu Excel przejdź do folderu zawierającego plik programu Excel, z którego chcesz zaimportować, wybierz plik programu Excel, a następnie kliknij przycisk Otwórz.

  6. Z listy rozwijanej arkusza wybierz arkusz w pliku programu Excel, z którego chcesz zaimportować.

  7. Wybierz Użyj pierwszego wiersza jako nagłówka, jeśli chcesz, aby pierwszy wiersz był traktowany jako nagłówek danych, a jeśli chcesz, aby wartości w pierwszym wierszu były używane jako nazwy kolumn. Usuń zaznaczenie Użyj pierwszego wiersza jako nagłówka, jeśli chcesz, aby pierwszy wiersz był traktowany jako wartość danych, w tym przypadku DQS będzie używać nazw nagłówków programu Excel (liter alfabetycznych) dla kolumny.

  8. Wybierz kolumnę, a następnie przypisz do niej istniejącą domenę lub utwórz nową domenę, klikając ikonę Utwórz domenę, w oknie dialogowym Utwórz domenę, a następnie przypisując domenę do kolumny. Typ danych domeny musi być zgodny z typem danych kolumny. Powtórz dla wszystkich kolumn arkusza kalkulacyjnego.

  9. Kliknij przycisk Dalej.

  10. Na stronie Odkryj kliknij Rozpocznij , aby przeanalizować dane w skoroszycie Excel.

    Notatka

    Jeśli opuścisz stronę przed przekazaniem danych, proces przekazywania plików zostanie zakończony.

  11. Sprawdź, czy analiza zakończyła się pomyślnie, a następnie kliknij przycisk Dalej.

  12. Na stronie Zarządzanie wartościami domeny sprawdź, czy prawidłowe domeny są wymienione na liście domen i czy wartości są wprowadzane w tabeli domeny.

  13. Kliknij Zakończ, a następnie kliknij Publikuj, aby opublikować bazę wiedzy, lub Nie publikuj.

  14. Sprawdź, czy baza wiedzy została opublikowana, a następnie kliknij przycisk OK.

Kontynuacja: Po zaimportowaniu domen z pliku Excel

Po zaimportowaniu domen z pliku programu Excel można dodać wiedzę do domen lub użyć domen w projekcie czyszczenia lub dopasowywania, w zależności od zawartości domen. Aby uzyskać więcej informacji, zobacz Przeprowadzanie odkrywania wiedzy, Zarządzanie domeną, Zarządzanie domeną złożoną, Tworzenie polityki dopasowania, Oczyszczanie danychlub Dopasowywanie danych.

Jak działa importowanie

W operacji importowania DQS interpretuje plik programu Excel w następujący sposób:

  • Kolumna reprezentuje domenę

  • Wiersz reprezentuje rekord danych

  • Pierwszy wiersz reprezentuje nazwy domen lub jest pierwszą wartością lub rekordem danych, w zależności od ustawienia pola wyboru Użyj pierwszego wiersza jako nagłówka.

Następujące reguły dotyczą operacji importowania:

  • Ta operacja importuje wartości domeny do bazy wiedzy. Nie importuje reguł domeny ani pasujących zasad.

  • Plik programu Excel może mieć rozszerzenie .xlsx, .xlslub .csv. Program Microsoft Excel musi być zainstalowany na komputerze z Klientem Jakości Danych, aby zaimportować wartości domeny lub pełną domenę. Obsługiwane są wersje programu Excel 2003 i nowsze. Jeśli jest używana 64-bitowa wersja programu Excel, będą obsługiwane tylko pliki programu Excel 2003; Pliki programu Excel 2007 lub 2010 nie będą obsługiwane.

  • Pliki programu Excel typu .xlsx nie są obsługiwane w przypadku instalacji programu Excel w wersji 64-bitowej. Jeśli używasz 64-bitowego programu Excel, zapisz plik arkusza kalkulacyjnego jako plik .xls.

  • W plikach .xlsx i .xls typ danych kolumny jest określany przez najbardziej rozpowszechniony typ danych w pierwszych ośmiu wierszach. Jeśli komórka nie jest zgodna z tym typem danych, zostanie podana wartość null.

  • W plikach .csv typ danych jest określany przez najbardziej rozpowszechniony typ danych w pierwszych ośmiu wierszach.

  • Wartość w arkuszu kalkulacyjnym programu Excel, który nie jest zgodny z regułą domeny, zostanie zaimportowana jako nieprawidłowa wartość.

  • Jeśli plik programu Excel nie jest w odpowiednim formacie lub jest uszkodzony, operacja importowania spowoduje wystąpienie błędu.