Freigeben über


Anfügen einer Domäne oder zusammengesetzten Domäne an Referenzdaten

In diesem Thema wird beschrieben, wie Domänen/zusammengesetzte Domänen in einer Datenqualitäts-Knowledge Base an einen Referenzdatendienst in Azure Marketplace angefügt werden, um Wissen über die qualitativ hochwertigen Referenzdaten zu erstellen. Jeder Referenzdatendienst enthält ein Schema (Datenspalten). Nachdem Sie eine Domäne oder eine zusammengesetzte Domäne an einen Referenzdatendienst angefügt haben, müssen Sie die angefügte Domäne oder die einzelnen Domänen innerhalb der angefügten zusammengesetzten Domäne den entsprechenden Spalten in einem Referenzdatendienstschema zuordnen. Durch das Anfügen einer zusammengesetzten Domäne an einen Referenzdatendienst können Sie nur eine Domäne an einen Referenzdatendienst anfügen und dann die einzelnen Domänen innerhalb der zusammengesetzten Domäne den entsprechenden Spalten im Referenzdatendienstschema zuordnen.

Warnung

Die zusammengesetzte Domäne, die einem Referenzdatendienst zugeordnet ist, ist in der Dropdown-Liste für Domänen verfügbar, wenn Sie Domänen mit den Spalten im Schema des Referenzdatendienstes abgleichen. Ordnen Sie die zusammengesetzte Domäne nicht einer Spalte im Referenzdatendienstschema zu; Sie müssen nur einzelne Domänen innerhalb einer zusammengesetzten Domäne den entsprechenden Spalten im Referenzdatendienstschema zuordnen. Andernfalls führt dies zu einem Fehler.

Ein Referenzdatendienstschema kann eine obligatorische Spalte aufweisen, die der entsprechenden Domäne zugeordnet werden muss, wenn Sie den Referenzdatendienst verwenden möchten. Die obligatorische Spalte in einem Referenzdatenschema wird mit "(M)" anhand des Spaltennamens identifiziert. AddressLine ist beispielsweise die obligatorische Schemaspalte in Melissa Data - Address Data und CompanyName ist die obligatorische Schemaspalte in Digital Trowel Inc. - Us-Unternehmen und professionelle Daten für SQL-Benutzer.

In diesem Thema erstellen wir vier Domänen: Adresszeile, Ort, Bundesland und Zip, unter einer zusammengesetzten Domäne, Adressüberprüfung, fügen die zusammengesetzte Domäne an den Melissa Data - Address Check-Referenzdatendienst an und ordnen dann die einzelnen Domänen innerhalb der zusammengesetzten Domäne den entsprechenden Spalten im Referenzdatendienstschema zu.

Bevor Sie beginnen

Voraussetzungen

Sie müssen Datenqualitätsdienste (Data Quality Services, DQS) für die Verwendung von Referenzdatendiensten konfiguriert haben. Siehe Konfigurieren von DQS zur Verwendung von Referenzdaten.

Sicherheit

Erlaubnisse

Sie müssen die Rolle des dqs_kb_editor in der DQS_MAIN-Datenbank haben, um Domänen mit Referenzdaten zu verknüpfen.

Zuordnen von Domänen zu Referenzdaten aus Melissa Data

  1. Starten Sie Data Quality Client. Informationen dazu finden Sie unter Ausführen der Data Quality-Client-Anwendung.

  2. Klicken Sie auf der Startseite des Datenqualitätsclients unter Knowledge Base Management auf "Neue Wissensbasis".

  3. Geben Sie im Bildschirm " Neue Wissensbasis " einen Namen für die neue Wissensbasis ein, klicken Sie auf die Aktivität "Domänenverwaltung ", und klicken Sie auf " Erstellen".

  4. Klicken Sie im Bildschirm "Domänenverwaltung " auf das Symbol "Domäne erstellen", um eine Domäne zu erstellen. Erstellen Sie die folgenden vier Domänen: Adresszeile, Ort, Bundesland und ZIP.

  5. Klicken Sie auf das Symbol "Zusammengesetzte Domäne erstellen", um eine zusammengesetzte Domäne zu erstellen. Geben Sie im Dialogfeld "Zusammengesetzte Domäne erstellen" im Feld "Zusammengesetzter Domänenname" den Namen "Adresse überprüfen" ein, und schließen Sie alle domänen ein, die in Schritt 3 in der zusammengesetzten Domäne erstellt wurden. Klicke auf OK.

  6. Wählen Sie im Bereich "Domäne " auf der linken Seite die zusammengesetzte Domäne aus, indem Sie auf " Adressüberprüfung" klicken und dann auf die Registerkarte " Referenzdaten " auf der rechten Seite klicken.

  7. Klicken Sie auf das Symbol "Durchsuchen ".

  8. Im Dialogfeld " Katalog für Onlinereferenzdatenanbieter ":

    1. Aktivieren Sie unter DataMarket Data Quality Services das Kästchen Melissa Data - Address Check.

    2. Ordnen Sie die Spalten des Melissa Data - Address Check-Referenzdatendiensts den entsprechenden Domänen zu (Adresszeile, Ort, Bundesland und ZIP). Sie ordnen die Spalten zu, indem Sie in der SPALTE "RDS-Schema " eine Spalte für den Referenzdatendienst auswählen und dann in der Spalte "Domäne " die entsprechende Domäne auswählen. Wenn Sie der Tabelle weitere Zeilen hinzufügen möchten, klicken Sie auf das Symbol "Schemaeintrag hinzufügen ".

    3. Klicken Sie auf "OK ", um die Änderungen zu speichern, und schließen Sie das Dialogfeld "Katalog für Onlinereferenzdatenanbieter ".

      Dialogfeld 'Katalog der Onlinereferenzdatenanbieter''

      Hinweis

      • Im Dialogfeld " Katalog für Onlinereferenzdatenanbieter " zeigt der Knoten DataMarket Data Quality Services alle Referenzdatendienstanbieter an, die Sie in Azure Marketplace abonniert haben. Wenn Sie direkte Onlineanbieter für Referenzdatendienste von Drittanbietern in DQS konfiguriert haben, werden diese unter einem anderen Knoten namens Direct Online-Anbieter von Drittanbietern angezeigt (jetzt nicht verfügbar, da keine direkten Onlineanbieter für Referenzdatendienste von Drittanbietern in DQS konfiguriert sind).
  9. Sie kehren zur Registerkarte " Referenzdaten " zurück. Ändern Sie im Bereich "Anbietereinstellungen " die Werte in den folgenden Feldern, falls erforderlich:

    • Schwellenwert für die automatische Korrektur: Korrekturen vom Referenzdatendienst mit Konfidenzniveau über diesen Schwellenwerten werden automatisch durchgeführt. Geben Sie einen Wert in der Dezimalnotation des entsprechenden Prozentwerts ein. Geben Sie z. B. 0,9 für 90%ein.

    • Vorgeschlagene Kandidaten: Anzahl der vorgeschlagenen Kandidaten, die vom Referenzdatendienst angezeigt werden sollen.

    • Min Confidence: Vorschläge aus dem Referenzdatendienst mit niedrigerer Konfidenzstufe als dieser Wert werden ignoriert. Geben Sie einen Wert in der Dezimalnotation des entsprechenden Prozentwerts ein. Geben Sie beispielsweise 0,6 für 60%ein.

  10. Klicken Sie auf "Fertig stellen ", um die Wissensbasis zu veröffentlichen. Nach erfolgreicher Veröffentlichung der Knowledge Base wird eine Bestätigungsmeldung angezeigt.

Sie können jetzt diese Wissensbasis für die Reinigung von Aktivitäten in einem Datenqualitätsprojekt verwenden, um US-Adressen in Ihren Quelldaten basierend auf den Kenntnissen von Melissa Data über Azure Marketplace zu standardisieren und zu bereinigen.

Nachverfolgung: Nach dem Zuordnen einer Domäne zu Referenzdaten

Erstellen Sie ein Datenqualitätsprojekt, und führen Sie die Bereinigungsaktivität für Ihre Quelldaten aus, die US-Adressen enthalten, indem Sie sie mit der in diesem Thema erstellten Wissensbasis vergleichen. Siehe Bereinigen von Daten mithilfe von Referenzdaten (externem) Wissen.

Siehe auch

Referenzdatendienste in DQS
Datenbereinigung