Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Dotyczy:SQL Server
Ważne
Usługi Data Quality Services (DQS) są usuwane w programie SQL Server 2025 (17.x). Nadal obsługujemy DQS w programie SQL Server 2022 (16.x) i starszych wersjach.
W tym temacie opisano sposób czyszczenia danych przy użyciu projektu jakości danych w usługach Data Quality Services (DQS). Czyszczenie danych jest wykonywane na danych źródłowych przy użyciu bazy wiedzy, która została zbudowana w DQS na podstawie wysokiej jakości zestawu danych. Aby uzyskać więcej informacji, zobacz Tworzenie bazy wiedzy.
Czyszczenie danych odbywa się w czterech etapach: etap mapowania , w którym można zidentyfikować źródło danych do oczyszczenia i zamapować je na wymagane domeny w bazie wiedzy, etap czyszczenia wspomaganego komputerowo, w którym DQS stosuje bazę wiedzy do danych do oczyszczenia i proponuje/wprowadza zmiany w danych źródłowych, interaktywny etap czyszczenia , w którym stewardzy danych mogą analizować zmiany danych, i zaakceptuj/odrzuć zmiany danych, a na koniec etap eksportu , który umożliwia wyeksportowanie oczyszczonych danych. Każdy z tych procesów jest wykonywany na oddzielnej stronie kreatora czynności czyszczenia, umożliwiając poruszanie się między różnymi stronami, ponowne uruchomienie procesu, zamknięcie określonego procesu czyszczenia, a następnie powrót do tego samego etapu procesu. DQS zapewnia statystyki dotyczące danych źródłowych i wyników czyszczenia, które umożliwiają podejmowanie świadomych decyzji dotyczących czyszczenia danych.
Przed rozpoczęciem
Wymagania wstępne
Musisz określić odpowiednie wartości progowe dla działania czyszczenia. Aby uzyskać informacje o tym, zobacz Konfigurowanie wartości progowych na potrzeby czyszczenia i dopasowywania.
Baza wiedzy DQS musi być obecna na serwerze jakości danych, na którym chcesz porównać i oczyścić dane źródłowe. Ponadto baza wiedzy musi zawierać wiedzę na temat typu danych, które mają zostać oczyszczone. Jeśli na przykład chcesz oczyścić dane źródłowe zawierające adresy USA, musisz mieć bazę wiedzy utworzoną na podstawie przykładowych danych "wysokiej jakości" dla adresów amerykańskich.
Program Microsoft Excel musi być zainstalowany na komputerze klienckim jakości danych, jeśli dane źródłowe do oczyszczenia są w pliku programu Excel. W przeciwnym razie nie będzie można wybrać pliku programu Excel na etapie mapowania. Pliki utworzone przez program Microsoft Excel mogą mieć rozszerzenie .xlsx, .xlslub .csv. Jeśli jest używana 64-bitowa wersja programu Excel, obsługiwane są tylko pliki programu Excel 2003 (.xls). Pliki programu Excel 2007 lub 2010 (.xlsx) nie są obsługiwane. Jeśli używasz 64-bitowej wersji programu Excel 2007 lub 2010, zapisz plik jako plik .xls lub plik .csv albo zainstaluj 32-bitową wersję programu Excel.
Zabezpieczenia
Uprawnienia
Aby przeprowadzić czyszczenie danych, musisz mieć rolę dqs_kb_editor lub dqs_kb_operator w bazie danych DQS_MAIN.
Utwórz projekt poprawy jakości danych przez oczyszczanie
Aby wykonać operację czyszczenia danych, należy użyć projektu jakości danych. Aby utworzyć projekt poprawy jakości danych poprzez ich oczyszczanie.
Wykonaj kroki 1–3 w temacie Tworzenie projektu jakości danych.
W kroku 3.d wybierz działanie Czyszczenie .
Kliknij przycisk Utwórz, aby utworzyć projekt dotyczący jakości danych czyszczących.
Spowoduje to utworzenie projektu jakości danych czyszczenia i otwarcie strony Mapa kreatora jakości danych czyszczenia.
Etap mapowania
Na etapie mapowania należy określić połączenie z danymi źródłowymi, które mają zostać oczyszczone, i zamapować kolumny w danych źródłowych z odpowiednimi domenami w wybranej bazie wiedzy.
Na stronie Mapa kreatora czyszczenia danych wybierz dane źródłowe do oczyszczenia: SQL Server lub Plik programu Excel:
SQL Server: wybierz pozycję DQS_STAGING_DATA jako źródłową bazę danych, jeśli skopiowano dane źródłowe do tej bazy danych, a następnie wybierz odpowiednią tabelę/widok zawierający dane źródłowe. W przeciwnym razie wybierz źródłową bazę danych i odpowiednią tabelę/widok. Źródłowa baza danych musi znajdować się w tym samym wystąpieniu SQL Server co Data Quality Server, aby była dostępna na liście rozwijanej Baza danych.
Plik programu Excel: kliknij przycisk Przeglądaj i wybierz plik programu Excel zawierający dane do oczyszczenia. Program Microsoft Excel musi być zainstalowany na komputerze Data Quality Client, aby można było wybrać plik Excel. W przeciwnym razie przycisk Przeglądaj nie będzie dostępny i otrzymasz powiadomienie pod tym polem tekstowym, że program Microsoft Excel nie jest zainstalowany. Pozostaw również pole wyboru Użyj pierwszego wiersza jako nagłówka zaznaczone, jeśli pierwszy wiersz pliku programu Excel zawiera dane nagłówka.
W obszarze Mapowania zamapuj kolumny danych w danych źródłowych z odpowiednimi domenami w bazie wiedzy, wybierając kolumnę źródłową z listy rozwijanej w kolumnie Kolumna źródłowa , a następnie wybierając domenę z listy rozwijanej w kolumnie Domena w tym samym wierszu. Powtórz ten krok, aby zamapować wszystkie kolumny w danych źródłowych z odpowiednimi domenami w bazie wiedzy. Jeśli jest to wymagane, możesz kliknąć ikonę Dodaj mapowanie kolumn , aby dodać wiersze do tabeli mapowania.
Uwaga / Notatka
Dane źródłowe można mapować na domenę DQS na potrzeby czyszczenia danych tylko wtedy, gdy typ danych źródłowych jest obsługiwany w DQS i pasuje do typu danych domeny DQS. Aby uzyskać informacje o obsługiwanych typach danych źródłowych, zobacz Obsługiwane typy danych programu SQL Server i usług SSIS dla domen DQS.
Kliknij ikonę Podgląd źródła danych , aby wyświetlić dane w wybranej tabeli lub widoku programu SQL Server albo wybrany arkusz programu Excel.
Kliknij pozycję Widok/Wybierz domeny złożone , aby wyświetlić listę domen złożonych, które są mapowane na kolumnę źródłową. Ten przycisk jest dostępny tylko wtedy, gdy co najmniej jedna domena kompozytowa została przypisana do kolumny źródłowej.
Kliknij przycisk Dalej , aby przejść do etapu czyszczenia wspomaganego przez komputer (strona Oczyszczanie ).
Etap Czyszczenia Computer-Assisted
Na etapie czyszczenia wspomaganego komputerowo uruchamiasz zautomatyzowany proces czyszczenia danych, który analizuje dane źródłowe względem zamapowanych domen w bazie wiedzy i wprowadza/proponuje zmiany danych.
Na stronie Oczyszczanie kreatora jakości danych kliknij Uruchom, aby uruchomić komputerowo wspomagany proces czyszczenia. DQS używa zaawansowanych algorytmów i poziomów ufności na podstawie poziomów progowych określonych do analizowania danych względem wybranej bazy wiedzy, a następnie czyszczenia ich. Aby uzyskać szczegółowe informacje na temat sposobu czyszczenia wspomaganego przez komputer w programie DQS, zobacz Oczyszczanie wspomagane komputerowo w czyszczeniu danych.
Ważne
Po zakończeniu analizy danych, przycisk Uruchom zmieni się na przycisk Uruchom ponownie. Jeśli wyniki poprzedniej analizy nie zostały jeszcze zapisane, kliknięcie Uruchom ponownie spowoduje utratę poprzednich danych. Gdy analiza jest uruchomiona, nie opuszczaj strony lub proces analizy zostanie zakończony.
Jeśli baza wiedzy używana do czyszczenia projektu została zaktualizowana i opublikowana po utworzeniu projektu czyszczenia, kliknięcie przycisku Uruchom wyświetli monit o użycie najnowszej bazy wiedzy do czyszczenia. Zazwyczaj może się to zdarzyć, jeśli utworzyłeś projekt jakości danych przy użyciu bazy wiedzy, przerwałeś w połowie czyszczenie, klikając przycisk Zamknij, a następnie ponownie otworzyłeś projekt jakości danych w późniejszym czasie, aby przeprowadzić dalsze czyszczenie. W międzyczasie baza wiedzy używana w projekcie czyszczenia została zaktualizowana i opublikowana.
Podobnie, jeśli baza wiedzy używana do oczyszczania projektu została zaktualizowana i opublikowana po ostatnim uruchomieniu czyszczenia wspomaganego przez komputer, kliknięcie przycisku Uruchom ponownie wyświetli monit o to, czy używać najnowszej bazy wiedzy do czyszczenia.
W obu przypadkach kliknij przycisk Tak , aby użyć zaktualizowanej bazy wiedzy na potrzeby czyszczenia wspomaganego przez komputer. Ponadto, jeśli występują konflikty między bieżącymi mapowaniami a zaktualizowaną bazą wiedzy (np. domeny zostały usunięte lub zmieniono typ danych domeny), zostanie również wyświetlony monit o naprawienie bieżących mapowań w celu użycia zaktualizowanej bazy wiedzy. Kliknięcie przycisku Tak spowoduje przejście do strony Mapa , na której można naprawić mapowania przed kontynuowaniem czyszczenia wspomaganego przez komputer.
Podczas etapu czyszczenia wspomaganego przez komputer można włączyć profilera, klikając kartę Profiler , aby wyświetlić profilowanie i powiadomienia w czasie rzeczywistym. Aby uzyskać więcej informacji, zobacz Profiler Statistics (Statystyki profilera).
Jeśli wyniki nie są zadowalające, kliknij przycisk Wstecz , aby powrócić do strony Mapa , zmodyfikuj co najmniej jedno mapowanie zgodnie z potrzebami, wróć do strony Oczyszczanie , a następnie kliknij przycisk Uruchom ponownie.
Po zakończeniu procesu czyszczenia wspomaganego przez komputer kliknij przycisk Dalej , aby przejść do interaktywnego etapu czyszczenia (strona Zarządzaj i Wyświetl wyniki ).
Etap interakcyjnego czyszczenia
Na etapie interaktywnego czyszczenia można zobaczyć zmiany proponowane przez DQS i zdecydować, czy je wdrożyć, zatwierdzając lub odrzucając zmiany. W panelu po lewej stronie Zarządzania i wyświetlania wyników DQS wyświetla listę wszystkich domen, które zamapowano wcześniej w fazie mapowania, wraz z liczbą wartości w danych źródłowych analizowanych względem każdej domeny podczas etapu komputerowo wspomaganego czyszczenia. Na stronie po prawej stronie Zarządzanie i wyświetlanie wyników, zgodnie z regułami domeny, regułami składni oraz zaawansowanymi algorytmami, DQS klasyfikuje dane na pięciu zakładkach z użyciem poziomu ufności. Poziom ufności wskazuje zakres pewności DQS dla korekty lub sugestii i jest oparty na następujących wartościach progowych:
Próg automatycznej korekty: każda wartość, która ma poziom ufności powyżej tego progu, jest automatycznie poprawiana przez DQS. Jednak steward danych może zastąpić zmianę podczas interaktywnego czyszczenia. Wartość progu autokorekty można określić na karcie Ustawienia ogólne na ekranie Konfiguracja . Aby uzyskać więcej informacji, zobacz
Configure Threshold Values for Cleansing and Matching ( Konfigurowanie wartości progowych na potrzeby czyszczenia i dopasowywania).Próg automatycznej sugestii: każda wartość, która ma poziom ufności powyżej tego progu, ale poniżej progu autokorekty, jest sugerowana jako wartość zastępcza. DQS wprowadzi zmianę tylko wtedy, gdy steward danych je zatwierdzi. Wartość progu automatycznej sugestii można określić na karcie Ustawienia ogólne na ekranie Konfiguracja. Aby uzyskać więcej informacji, zobacz
Configure Threshold Values for Cleansing and Matching ( Konfigurowanie wartości progowych na potrzeby czyszczenia i dopasowywania).Inne: Każda wartość poniżej wartości progu automatycznej sugestii pozostaje niezmieniona przez DQS.
Na podstawie poziomu ufności wartości są wyświetlane na następujących pięciu kartach:
| Zakładka | Opis |
|---|---|
| Sugerowane | Przedstawia wartości domeny, dla których DQS znalazł sugerowane wartości, które mają poziom ufności wyższy niż wartość progowa automatycznej sugestii , ale niższe niż wartość progowa autokorekty . Sugerowane wartości są wyświetlane w kolumnie Poprawna do w porównaniu do wartości oryginalnej. Możesz kliknąć przycisk radiowy w kolumnie Zatwierdź lub Odrzuć względem wartości w górnej siatce, aby zaakceptować lub odrzucić sugestię dla wszystkich wystąpień wartości. W takim przypadku zaakceptowana wartość zostanie przeniesiona na kartę Poprawiono , a odrzucona wartość zostanie przeniesiona na kartę Nieprawidłowy . |
| Nowy | Wyświetla prawidłową domenę, dla której DQS nie ma wystarczającej ilości informacji i dlatego nie można zamapować na inną kartę. Ponadto ta karta zawiera również wartości, które mają poziom ufności mniejszy niż wartość progu automatycznej sugestii , ale wystarczająco wysokie, aby były oznaczone jako prawidłowe. Jeśli uważasz, że wartość jest poprawna, kliknij przycisk radiowy w kolumnie Zatwierdź . W przeciwnym razie kliknij przycisk radiowy w kolumnie Odrzuć . Zaakceptowana wartość zostanie przeniesiona na kartę Poprawna, a odrzucona wartość zostanie przeniesiona na kartę Nieprawidłowa. Możesz również ręcznie wpisać poprawną wartość jako zamianę oryginalnej wartości w kolumnie Popraw do, a następnie kliknąć przycisk radiowy w kolumnie Zatwierdź, aby zaakceptować zmianę. W takim przypadku wartość zostanie przeniesiona na kartę Poprawiono . |
| nieprawidłowy | Wyświetla wartości domeny, które zostały oznaczone jako nieprawidłowe w bazie wiedzy domeny lub wartości, które nie spełniły reguły domeny. Ta karta zawiera również wartości odrzucone przez użytkownika na dowolnej z pozostałych czterech kart. Jeśli jednak uważasz, że wartość jest poprawna, kliknij przycisk radiowy w kolumnie Zatwierdź . Zaakceptowana wartość zostanie przeniesiona na kartę Poprawna . Możesz również ręcznie wpisać poprawną wartość jako zamianę oryginalnej wartości w kolumnie Correct To (Poprawne do ) względem wartości, a następnie kliknąć przycisk radiowy w kolumnie Zatwierdź , aby zaakceptować zmianę. W takim przypadku wartość zostanie przeniesiona na kartę Poprawiono . |
| Poprawione | Przedstawia wartości domen, które są poprawiane przez DQS w zautomatyzowanym procesie oczyszczania, ponieważ DQS znalazła poprawki dla wartości z poziomem pewności przekraczającym próg automatycznej korekty. Poprawione wartości są wyświetlane w kolumnie Popraw do obok oryginalnej wartości. Domyślnie zaznaczony jest przycisk radiowy w kolumnie Zatwierdź odpowiadającej wartości. Jeśli jest to wymagane, możesz odrzucić proponowaną korektę, klikając przycisk radiowy w kolumnie Odrzuć, aby przenieść ją na kartę Nieprawidłowe, lub ręcznie wpisz poprawną wartość w kolumnie Do poprawy, a następnie kliknij przycisk radiowy w kolumnie Zatwierdź, by zaakceptować zmianę i przenieść ją na kartę Poprawiono. |
| Odpowiedź prawidłowa. | Wyświetla wartości domeny, które zostały znalezione poprawnie. Na przykład wartość jest zgodna z wartością domeny. Ta karta zawiera również wartości zatwierdzone przez użytkownika, klikając przycisk radiowy w kolumnie Zatwierdź na kartach Nowe i Nieprawidłowe . Domyślnie przycisk radiowy w kolumnie Zatwierdź jest wybierany względem każdej wartości. Jeśli jednak uważasz, że wartość na tej karcie jest niepoprawna, możesz kliknąć przycisk radiowy w kolumnie Odrzuć względem wartości, aby przenieść ją na nieprawidłową kartę , lub ręcznie wpisać poprawną wartość jako zamianę wartości w kolumnie Correct To względem wartości, a następnie kliknąć przycisk radiowy w kolumnie Zatwierdź , aby zaakceptować zmianę, i przenieś go na kartę Poprawiono . |
Aby interaktywnie oczyścić dane:
Na stronie Zarządzanie i wyświetlanie wyników kreatora jakości czyszczenia danych kliknij nazwę domeny w okienku po lewej stronie.
Przejrzyj wartości domeny na pięciu kartach i podejmij odpowiednie działania, jak wyjaśniono wcześniej.
W prawym górnym okienku są wyświetlane następujące informacje dotyczące każdej wartości w wybranej domenie: oryginalna wartość, liczba wystąpień (rekordów), pole umożliwiające określenie innej (poprawnej) wartości, poziom ufności (niedostępny dla wartości na karcie Poprawna ), przyczyna akcji DQS dla wartości oraz opcja zatwierdzenia i odrzucenia poprawek i sugestii dotyczących wartości.
Wskazówka
Możesz zatwierdzić lub odrzucić wszystkie wartości w wybranej domenie w prawym górnym okienku, klikając odpowiednio pozycję Zatwierdź wszystkie terminy lub Odrzuć wszystkie terminy . Alternatywnie możesz kliknąć prawym przyciskiem myszy wartość w wybranej domenie, a następnie kliknąć pozycję Akceptuj wszystkie lub Odrzuć wszystko w menu skrótów.
W dolnym okienku są wyświetlane poszczególne wystąpienia wartości domeny wybranej w prawym górnym okienku. Wyświetlane są następujące informacje: pole umożliwiające określenie innej (poprawnej) wartości, poziomu ufności (niedostępnego dla wartości na karcie Poprawna ), przyczyny akcji DQS dla wartości, opcji zatwierdzenia i odrzucenia poprawek i sugestii dla wartości oraz oryginalnej wartości.
Jeśli funkcja Speller została włączona dla domeny podczas jej tworzenia, falujące czerwone podkreślenia są wyświetlane przy wartościach domeny, które są uznane za potencjalny błąd. Podkreślenie jest wyświetlane dla całej wartości. Jeśli na przykład "Nowy Jork" jest niepoprawnie wpisany jako "Neu York", korektor pisowni wyświetli czerwone podkreślenie pod "Neu York", a nie tylko pod "Neu". Jeśli klikniesz prawym przyciskiem myszy wartość, zobaczysz sugerowane poprawki. Jeśli istnieje więcej niż 5 sugestii, możesz kliknąć pozycję Więcej sugestii w menu kontekstowym, aby wyświetlić pozostałe sugestie. Podobnie jak w przypadku wyświetlania błędów, sugestie stanowią zamienniki dla całej wartości. Na przykład "Nowy Jork" będzie wyświetlany jako sugestia w poprzednim przykładzie, a nie tylko "Nowy". Możesz wybrać jedną z sugestii lub dodać wartość do słownika, która ma być wyświetlana dla tej wartości. Wartości są przechowywane w słowniku na poziomie konta użytkownika. Po wybraniu sugestii z menu kontekstowego modułu sprawdzania pisowni wybrana sugestia zostanie dodana do kolumny Popraw. Jednak jeśli wybierzesz sugestię w kolumnie Zamień na, wartość w kolumnie zostanie zamieniona na wybraną sugestię.
Funkcja sprawdzania pisowni jest domyślnie włączona na etapie interaktywnego czyszczenia. Pisownię można wyłączyć na etapie czyszczenia interakcyjnego, klikając ikonę Włącz/Wyłącz pisownię lub klikając prawym przyciskiem myszy w obszarze wartości domeny, a następnie klikając pozycję Pisownia w menu skrótów. Aby włączyć go ponownie, wykonaj to samo.
Uwaga / Notatka
Opcja sprawdzania pisowni jest dostępna tylko w górnym panelu (wartości domen). Ponadto nie można włączyć ani wyłączyć modułu sprawdzania pisowni dla domen złożonych. Domeny podrzędne w domenie złożonej, które są typu tekstowego i mają włączoną funkcję sprawdzania pisowni, będą miały tę funkcjonalność domyślnie włączoną podczas interaktywnego etapu czyszczenia.
Podczas interaktywnego etapu czyszczenia można włączyć profilera, klikając kartę Profiler , aby wyświetlić profilowanie i powiadomienia w czasie rzeczywistym. Aby uzyskać więcej informacji, zobacz Profiler Statistics (Statystyki profilera).
Po przejrzeniu wszystkich wartości domeny kliknij przycisk Dalej , aby przejść do etapu eksportu.
Etap eksportu
Na etapie eksportowania należy określić parametry eksportowania oczyszczonych danych: co i gdzie mają być eksportowane.
Na stronie Eksportowanie kreatora czyszczenia danych wybierz typ docelowy eksportowania oczyszczonych danych: SQL Server, plik CSV lub plik programu Excel.
Ważne
Jeśli używasz 64-bitowej wersji programu Excel, nie możesz wyeksportować oczyszczonych danych do pliku programu Excel; Można wyeksportować tylko do bazy danych programu SQL Server lub do pliku .csv.
SQL Server: wybierz DQS_STAGING_DATA jako docelową bazę danych, jeśli chcesz wyeksportować dane tutaj, a następnie określ nazwę tabeli, która zostanie utworzona do przechowywania wyeksportowanych danych. W przeciwnym razie wybierz inną bazę danych, jeśli chcesz wyeksportować dane do innej bazy danych, a następnie określ nazwę tabeli, która zostanie utworzona do przechowywania wyeksportowanych danych. Docelowa baza danych musi być obecna w tym samym wystąpieniu serwera SQL, co serwer jakości danych, aby była dostępna na liście rozwijanej Baza danych.
Plik CSV: kliknij przycisk Przeglądaj i określ nazwę i lokalizację pliku .csv, w którym chcesz wyeksportować oczyszczone dane. Możesz również wpisać nazwę pliku .csv wraz z pełną ścieżką, w której chcesz wyeksportować oczyszczone dane. Na przykład "c:\ExportedData.csv". Plik jest zapisywany na komputerze, na którym jest zainstalowany serwer jakości danych.
Plik programu Excel: kliknij przycisk Przeglądaj i określ nazwę i lokalizację pliku programu Excel, w którym chcesz wyeksportować oczyszczone dane. Możesz również wpisać nazwę pliku programu Excel wraz z pełną ścieżką, w której chcesz wyeksportować oczyszczone dane. Na przykład "c:\ExportedData.xlsx". Plik jest zapisywany na komputerze, na którym jest zainstalowany serwer jakości danych.
Zaznacz pole wyboru Standaryzacja danych wyjściowych , aby standandaryzować dane wyjściowe na podstawie formatu danych wyjściowych wybranego dla domeny. Na przykład zmień wartość ciągu na wielkie litery lub wprowadź pierwszą literę słowa. Aby uzyskać informacje na temat określania formatu wyjściowego domeny, zobacz listę Formatuj wynik do w Ustaw właściwości domeny.
Następnie wybierz dane wyjściowe: wyeksportuj tylko oczyszczone dane lub wyeksportuj oczyszczone dane wraz z informacjami czyszczenia.
Tylko dane: kliknij przycisk radiowy, aby wyeksportować tylko oczyszczone dane.
Informacje o danych i czyszczeniu: kliknij przycisk radiowy, aby wyeksportować następujące dane dla każdej domeny:
<Domain>_Source: oryginalna wartość w domenie.
<Domain>_Output: Oczyszczone wartości w domenie.
<Domena>_Reason: przyczyna określona dla korekty wartości.
<Domena>_Confidence: poziom ufności dla wszystkich terminów, które zostały poprawione. Jest on wyświetlany jako wartość dziesiętna równoważna odpowiadającej odpowiedniej wartości procentowej. Na przykład poziom ufności 95% zostanie wyświetlony jako .9500000.
<Domena>_Status: stan wartości domeny po oczyszczeniu danych. Na przykład Sugerowane, Nowe, Nieprawidłowe, Poprawione lub Poprawne.
Stan rekordu: poza polem stanu dla każdej zamapowanej domeny (<DomainName>_Status) pole Stan rekordu wyświetla stan rekordu. Jeśli którykolwiek ze stanów domeny w rekordzie ma wartość Nowa lub Poprawna, stan rekordu jest ustawiony na Wartość Prawidłowa. Jeśli którykolwiek ze stanów domeny w rekordzie to Sugerowane, Nieprawidłowe lub Poprawione, stan rekordu jest ustawiony na odpowiednią wartość. Jeśli na przykład którykolwiek ze stanów domeny w rekordzie ma wartość Sugerowane, stan rekordu jest ustawiony na Sugerowane.
Uwaga / Notatka
Jeśli używasz usługi danych referencyjnych do operacji czyszczenia, niektóre dodatkowe dane dotyczące wartości domeny są również dostępne do eksportowania. Aby uzyskać więcej informacji, zobacz Oczyszczanie danych przy użyciu informacji referencyjnych (zewnętrznych).
Kliknij pozycję Eksportuj , aby wyeksportować dane do wybranego miejsca docelowego danych. W przypadku wybrania:
Program SQL Server jako miejsce docelowe danych zostanie utworzona nowa tabela o określonej nazwie w wybranej bazie danych.
Plik CSV jako miejsce docelowe danych plik .csv zostanie utworzony w lokalizacji na komputerze serwera jakości danych o nazwie pliku określonej wcześniej w polu Nazwa pliku CSV .
Plik programu Excel jako miejsce docelowe danych plik programu Excel zostanie utworzony w lokalizacji na komputerze serwera jakości danych z nazwą pliku określoną wcześniej w polu Nazwa pliku programu Excel .
Kliknij przycisk Zakończ , aby zamknąć projekt jakości danych.
Statystyki profilera
Karta Profiler zawiera statystyki wskazujące jakość danych źródłowych. Profilowanie pomaga ocenić skuteczność działania czyszczenia danych i potencjalnie określić zakres, w jakim czyszczenie danych mogło poprawić jakość danych.
Karta Profiler zawiera następujące statystyki dotyczące danych źródłowych według pola i domeny:
Rekordy: ile rekordów w przykładzie danych zostało przeanalizowanych pod kątem działania czyszczenia danych
Poprawne rekordy: Ile rekordów znaleziono jako poprawne
Poprawione rekordy: ile rekordów zostało poprawionych
Sugerowane rekordy: liczba sugerowanych rekordów
Nieprawidłowe rekordy: ile rekordów było nieprawidłowych
Statystyki pól obejmują następujące elementy:
Pole: nazwa pola w danych źródłowych
domena: nazwa domeny mapowania na pole
Poprawione wartości: liczba wartości domeny, które zostały poprawione
Sugerowane wartości: liczba sugerowanych wartości domeny
Kompletność: Kompletność każdego pola źródłowego, zmapowanego dla działania czyszczenia
Dokładność: Dokładność każdego pola źródłowego mapowanego na działanie czyszczenia
Profilowanie DQS zapewnia dwa wymiary jakości danych: kompletność (zakres, w jakim dane są obecne) i dokładność (zakres, w jakim dane mogą być używane do zamierzonego użycia). Jeśli profilowanie informuje o tym, że pole jest stosunkowo niekompletne, możesz usunąć je z bazy wiedzy projektu jakości danych. Profilowanie może nie zapewniać niezawodnych statystyk kompletności dla domen złożonych. Jeśli potrzebujesz statystyk kompletności, użyj pojedynczych domen zamiast domen złożonych. Jeśli chcesz używać domen złożonych, możesz utworzyć jedną bazę wiedzy z pojedynczymi domenami na potrzeby profilowania, określić kompletność i utworzyć inną domenę z domeną złożoną na potrzeby procesu czyszczenia. Na przykład profilowanie może pokazać 95% kompletność rekordów adresów przy użyciu domeny złożonej, ale może istnieć znacznie wyższy poziom niekompletności dla jednej z kolumn, na przykład kolumny kodu pocztowego (zip). W tym przykładzie możesz ocenić kompletność kolumny kodu pocztowego w ramach jednej domeny. Profilowanie prawdopodobnie zapewni niezawodne statystyki dokładności dla domen złożonych, ponieważ można mierzyć dokładność dla wielu kolumn razem. Wartość tych danych znajduje się w agregacji złożonej, dlatego warto zmierzyć dokładność z domeną złożoną.
Statystyki dokładności prawdopodobnie będą wymagały większej interpretacji, jeśli nie korzystasz z usługi danych referencyjnych. Jeśli używasz usługi danych referencyjnych do czyszczenia danych, będziesz mieć poziom zaufania do statystyk dokładności. Aby uzyskać więcej informacji na temat czyszczenia danych przy użyciu usługi danych referencyjnych, zobacz Oczyszczanie danych przy użyciu danych referencyjnych (zewnętrznej) Wiedza.
Powiadomienia dotyczące czyszczenia
Następujące warunki powodują powiadomienia:
Brak poprawek ani sugestii dotyczących pola. Możesz usunąć go z mapowania, uruchomić odnajdywanie wiedzy jako pierwszy lub użyć innej bazy wiedzy.
Istnieje stosunkowo niewiele poprawek lub sugestii dotyczących pola. Możesz usunąć go z mapowania, uruchomić odnajdywanie wiedzy jako pierwszy lub użyć innej bazy wiedzy.
Poziom dokładności pola jest bardzo niski. Warto zweryfikować mapowanie lub najpierw rozważyć uruchomienie odnajdywania wiedzy.
Aby uzyskać więcej informacji na temat profilowania, zobacz Profilowanie danych i powiadomienia w DQS.