Udostępnij przez


Koncepcje usług Data Quality Services (Usługi Jakości Danych)

Dotyczy:SQL Server

Ważne

Usługi Data Quality Services (DQS) są usuwane w programie SQL Server 2025 (17.x). Nadal obsługujemy DQS w programie SQL Server 2022 (16.x) i starszych wersjach.

Ten temat zawiera krótkie podsumowanie pojęć dotyczących usług Data Quality Services (DQS) w zakresie zarządzania wiedzą, projektów jakości danych i administrowania jakością danych.

Pojęcia dotyczące zarządzania wiedzą

Baza wiedzy DQS to repozytorium metadanych, które jest tworzone przez stewarda danych lub informatyka do użycia w ulepszaniu jakości danych poprzez czyszczenie danych i dopasowywanie danych. Zarządzanie wiedzą dQS obejmuje procesy używane do tworzenia bazy wiedzy i zarządzania nią, zarówno w sposób wspomagany komputerowo, jak i interaktywnie.

Odkrywanie wiedzy

Odnajdywanie wiedzy to proces wspomagany komputerowo, który analizuje próbki danych organizacji w celu uzyskania wiedzy na temat danych. Po uzyskaniu wyników analizy możesz zweryfikować i poprawić wiedzę, a następnie zastosować ją do przeprowadzania czyszczenia, dopasowywania i profilowania danych. Aby uzyskać więcej informacji, zobacz DQS Knowledge Bases and Domains (Bazy wiedzy i domeny DQS).

zarządzanie domeną

Proces zarządzania domeną umożliwia zmianę lub rozszerzenie wiedzy wygenerowanej przez proces odnajdywania wiedzy. Możesz interaktywnie edytować, aktualizować i przeglądać wiedzę w bazie wiedzy. Baza wiedzy składa się z domen danych, które zawierają wartości domeny i ich stan, reguły domeny, relacje oparte na terminach i dane referencyjne. W zarządzaniu domenami można zmieniać właściwości domeny, dołączać dane referencyjne do domeny, zarządzać regułami domeny, zarządzać wartościami domeny i wprowadzać relacje danych oraz tworzyć, usuwać, importować lub eksportować domeny. Można również użyć domen złożonych, które agregują więcej niż jedną domenę. Aby uzyskać więcej informacji, zobacz DQS Knowledge Bases and Domains (Bazy wiedzy i domeny DQS).

Polityka dopasowania

Polityka dopasowywania zawiera reguły dopasowywania używane do przeprowadzania deduplikacji danych. Proces dopasowywania zasad umożliwia tworzenie pasujących reguł, dostosowywanie ich na podstawie pasujących wyników i profilowania danych oraz dodawanie zasad do bazy wiedzy. Aby uzyskać więcej informacji, zobacz Dopasowywanie danych.

Usługi danych referencyjnych

Możesz użyć danych referencyjnych, aby zweryfikować, poprawić i wzbogacić dane, korzystając z usług firm, które gwarantują jakość swoich danych referencyjnych. Możesz użyć usług witryny Azure Marketplace, aby nawiązać połączenie z dostawcami danych referencyjnymi lub użyć bezpośredniego połączenia z dostawcą. Aby uzyskać więcej informacji, zobacz Reference Data Services in DQS (Usługi danych referencyjnych w usługach DQS).

Aby uzyskać więcej informacji na temat zarządzania wiedzą w programie DQS, zobacz DQS Knowledge Bases and Domains (Bazy wiedzy i domeny DQS).

Pojęcia dotyczące projektu jakości danych

Steward danych wykonuje operacje dotyczące jakości danych (czyszczenie i dopasowywanie) przy użyciu projektu jakości danych w aplikacji klienta jakości danych.

czyszczenie danych

Czyszczenie danych w DQS odbywa się na podstawie wiedzy w bazie wiedzy DQS. Czyszczenie danych w DQS jest procesem dwuetapowym:

  • Czyszczenie wspomagane komputerowo: DQS wykorzystuje wiedzę w wybranej bazie wiedzy do projektu oczyszczania w celu zaproponowania poprawek/sugestii wartości w źródle danych.

  • Czyszczenie interakcyjne: steward danych może wykonać interaktywny proces czyszczenia, aby zmienić lub rozszerzyć poprawki danych, które zostały zaproponowane przez proces czyszczenia danych wspomaganych przez komputer. Steward danych wykonuje to przy użyciu poziomów ufności i statystyk zidentyfikowanych przez proces czyszczenia danych lub ręcznie wprowadzając własne zmiany w projekcie.

Po oczyszczeniu danych, zarządzający danymi może wyeksportować przetworzone dane do bazy danych programu SQL Server, .csv, lub pliku programu Excel. Aby uzyskać więcej informacji, zobacz Czyszczenie danych.

Dopasowywanie danych

Proces dopasowywania umożliwia stewardowi danych porównywanie danych w celu uporządkowania podobnych, ale nieco innych danych przez proces deduplikacji. DQS wykonuje deduplikację na podstawie reguł dopasowania zawartych w bazie wiedzy, a steward danych określa parametry procesu dopasowywania w ramach projektu dotyczącego jakości danych. Aby uzyskać więcej informacji, zobacz Dopasowywanie danych.

Profilowanie i powiadomienia

Profilowanie danych dostarcza opiekunom danych statystyk i informacji w czasie rzeczywistym o danych przetwarzanych przez DQS na potrzeby działań związanych z czyszczeniem lub dopasowywaniem, podczas realizacji projektu jakości danych. Profilowanie danych pomaga ocenić skuteczność czyszczenia i dopasowywania działań w projekcie jakości danych, a powiadomienia pomagają użytkownikowi w akcji, które można podjąć w celu ulepszenia działań czyszczenia danych i dopasowywania danych. Aby uzyskać więcej informacji, zobacz Profilowanie danych i powiadomienia w DQS.

Aby uzyskać więcej informacji na temat projektów dotyczących jakości danych w DQS, zobacz Projekty jakości danych (DQS).

Pojęcia dotyczące administrowania jakością danych

Administrator DQS może wykonywać różne zadania administracyjne przy użyciu aplikacji klienckiej jakości danych.

Monitorowanie aktywności

Monitorowanie działań wyświetla stan i stan każdego działania wykonywanego w zakresie danych, udostępnia dane dla każdego działania i umożliwia administratorom DQS kontrolowanie działania. Aby uzyskać więcej informacji, zobacz Monitorowanie działań DQS.

Konfiguracja

Opcja Konfiguracja umożliwia:

Zabezpieczenia DQS

Używasz ról w mechanizmie zabezpieczeń SQL Server, aby zabezpieczyć DQS. Istnieją trzy role DQS, które określają poziom dostępu dla użytkownika w aplikacji klienta jakości danych: dqs_administrator, dqs_kb_editor i dqs_kb_operator. Nie można udzielać ról użytkownikom przy użyciu klienta Data Quality; odbywa się to przy użyciu programu SQL Server Management Studio. Aby uzyskać więcej informacji, zobacz Zabezpieczenia DQS.

Aby uzyskać więcej informacji na temat administrowania DQS, zobacz Administracja DQS.

Zobacz też

Usługi Data Quality Services