Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
In diesem Thema wird beschrieben, wie Sie mithilfe der Wissensermittlung eine Wissensbasis erstellen. Im Ermittlungsprozess analysiert Data Quality Services (DQS) die Daten in einer Stichprobendatenquelle über einen computergestützten Prozess und fügt das Wissen hinzu, das sie der Wissensbasis zugewinnt. Dieses Wissen kann im Schritt " Domänenwerte verwalten" der Wissensermittlungsaktivität oder in der Domänenverwaltungsaktivität geändert und verbessert werden.
Die Wissensentdeckung ist ein assistentengeführter Prozess, der drei Schritte umfasst, die jeweils abgeschlossen werden müssen.
Bevor Sie beginnen
Voraussetzungen
Microsoft Excel muss auf dem Clientcomputer für Datenqualität installiert sein, wenn sich die Quelldaten, für die Sie die Ermittlung ausführen, in einer Excel-Datei befinden. Andernfalls können Sie die Excel-Datei in der Zuordnungsphase nicht auswählen. Die von Microsoft Excel erstellten Dateien können eine Erweiterung von .xlsx, .xlsoder .csvhaben. Wenn die 64-Bit-Version von Excel verwendet wird, werden nur Excel 2003-Dateien (.xls) unterstützt; Excel 2007- oder 2010-Dateien (.xlsx) werden nicht unterstützt. Wenn Sie 64-Bit-Version von Excel 2007 oder 2010 verwenden, speichern Sie die Datei als .xls Datei oder als .csv-Datei, oder installieren Sie stattdessen eine 32-Bit-Version von Excel.
Sicherheit
Erlaubnisse
Sie müssen über die Rolle DQS_KB_EDITOR oder DQS_ADMINISTRATOR in der DQS_MAIN-Datenbank verfügen, um eine Wissensbasis zu erstellen.
Erster Schritt: Start Knowledge Discovery
Starten Sie Data Quality Client. Informationen dazu finden Sie unter Ausführen der Data Quality-Client-Anwendung.
Wenn Sie die Wissenssuche auf einer neuen Wissensbasis durchführen möchten, klicken Sie auf "Neue Wissensbasis", geben Sie den Namen und die Beschreibung ein, und geben Sie gegebenenfalls an, aus welcher Wissensbasis Sie die Wissensbasis erstellen. Wenn Sie Wissensermittlungen auf einer vorhandenen Wissensbasis durchführen möchten, klicken Sie auf "Wissensbasis öffnen", und wählen Sie dann eine Wissensbasis aus.
Wählen Sie Knowledge Discovery als Aktivität aus, und klicken Sie dann auf "Erstellen ", um die neue Wissensbasis zu erstellen oder auf "Öffnen ", um eine vorhandene Wissensbasis zu öffnen.
Zuordnungsphase
Wählen Sie im Feld "Datenquelle" SQL Server (standardmäßig) oder Excel-Datei aus.
Hinweis
Auf dieser Seite erstellen Sie eine Verbindung mit einer SQL Server- oder Excel-Datenquelle und ordnen anschließend die Spalten der Datenquelle einer Domäne in der Wissensdatenbank zu. In der Tabelle "Zuordnungen" werden alle Spalten in der Quelldatenbank angezeigt, die analysiert werden, um den entsprechenden Domänen Wissen hinzuzufügen. Zuordnungen werden zwischen Spalten in der Datenquelle und einer Domäne in der Wissensbasis hergestellt.
Wenn die Datenquelle SQL Server ist, fahren Sie wie folgt fort:
Wählen Sie im Feld "Datenbank " die Quelldatenbank aus, die Sie analysieren möchten, um die Wissensbasis zu erstellen. In der Dropdownliste des Textfelds werden die verfügbaren Datenbanken aufgelistet. Die Quelldatenbank muss in derselben SQL Server-Instanz wie der Data Quality Server vorhanden sein. Andernfalls wird sie nicht in der Dropdownliste angezeigt.
Wählen Sie im Feld "Tabelle/Ansicht " die Tabelle oder Ansicht aus, die Sie analysieren möchten, um die Wissensbasis zu erstellen. Diese Tabelle oder Ansicht sollte Beispieldaten sein, nicht eine gesamte Quelldatenbank, für die Sie datenbereinigung oder -abgleich durchführen. In der Dropdownliste des Textfelds werden die Tabellen und Ansichten aufgelistet, die für die ausgewählte Datenbank verfügbar sind.
Wenn die Datenquelle Excel ist, fahren Sie wie folgt fort:
Klicken Sie auf "Durchsuchen ", und wählen Sie die Excel-Datei aus, die Sie analysieren möchten, um die Wissensbasis zu erstellen. Excel muss auf dem Clientcomputer für Datenqualität installiert sein, um eine Excel-Datei auszuwählen. Wenn Excel nicht auf dem Clientcomputer für Datenqualität installiert ist, ist die Schaltfläche "Durchsuchen" nicht verfügbar, und Sie werden unter diesem Textfeld benachrichtigt, dass Excel nicht installiert ist.
Aktivieren Sie das Kontrollkästchen "Erste Zeile als Kopfzeile verwenden ", wenn die erste Zeile der Excel-Datei Kopfzeilendaten enthält.
Ordnen Sie in der Tabelle Zuordnungen jede Quellspalte, auf der Knowledge Discovery durchgeführt werden soll, einer Domäne in der Wissensdatenbank zu, wie folgt:
Erstellen Sie eine Zuordnung, indem Sie eine Quellspalte aus der Dropdownliste für die Spalte " Quellspalte " einer leeren Zeile auswählen und dann in der Dropdownliste für die Spalte "Domäne " in derselben Zeile eine Domäne auswählen, falls eine Domäne vorhanden ist. Wenn keine Domäne vorhanden ist, klicken Sie auf die Domäne erstellen oder eine zusammengesetzte Domäne erstellen, um eine Domäne zu erstellen. Weitere Informationen finden Sie unter Erstellen einer Domänenregel oder erstellen einer zusammengesetzten Domäne.
Wiederholen Sie den vorherigen Schritt für jede Zuordnung. Wenn Sie die Anzahl der Zeilen in der Tabelle ändern möchten, klicken Sie auf "Spaltenzuordnung hinzufügen", oder wählen Sie eine Zeile aus, und klicken Sie auf die ausgewählte Spaltenzuordnung entfernen. Wenn Sie auf "Ausgewählte Spaltenzuordnung entfernen " klicken, wenn eine ausgefüllte Zeile ausgewählt ist, wird die ausgewählte Zeile auch dann gelöscht, wenn eine nicht aufgefüllte Zeile vorhanden ist.
Hinweis
Sie können Ihre Quelldaten einer DQS-Domäne zuordnen, um Die Wissensermittlung nur durchzuführen, wenn der Quelldatentyp in DQS unterstützt wird und mit dem DQS-Domänendatentyp übereinstimmt. Weitere Informationen zu unterstützten Datentypen finden Sie unter Unterstützte SQL Server- und SSIS-Datentypen für DQS-Domänen.
Klicken Sie auf "Zusammengesetzte Domänen anzeigen/auswählen ", um die zusammengesetzten Domänen anzuzeigen, die definiert wurden. Wenn keine zusammengesetzten Domänen definiert wurden, ist das Steuerelement nicht verfügbar.
Klicken Sie auf "Datenquelle in der Vorschau anzeigen ", um alle Daten in der Datenquelle anzuzeigen, die Sie im Textfeld "Tabelle/Ansicht " oder "Excel-Datei " ausgewählt haben.
Klicken Sie auf "Weiter" , um mit der Seite " Entdecken " des Wissensermittlungs-Assistenten fortzufahren. Sie können auch Folgendes auswählen:
Klicken Sie auf "Abbrechen ", um die Knowledge Discovery-Aktivität zu beenden, Ihre Arbeit zu verlieren und zur DQS-Startseite zurückzukehren.
Klicken Sie auf "Schließen ", um zur DQS-Startseite zurückzukehren, während Sie Ihre Arbeit speichern. Die Wissensbasis wird für Sie gesperrt, und der Status der Wissensbasis in der Wissensbasistabelle auf dem Bildschirm "Open Knowledge Base " lautet "Discovery – Mapping". Nachdem Sie auf "Schließen" geklickt haben, müssen Sie zum Ausführen der Domänenverwaltungsaktivität im Bildschirm "Knowledge Base Öffnen" auf "Knowledge Discovery" klicken, auf "Knowledge Base Management: Domänenbedingungen verwalten", auf "Fertig stellen" klicken und dann auf "Ja" klicken, um die Wissensbasis zu veröffentlichen, oder auf "Nein", um die Arbeit auf der Wissensbasis zu speichern und zu beenden.
Entdeckungsphase
Klicken Sie auf "Start" , um die Datenquelle zu analysieren.
Hinweis
Die Ermittlung wird für die Spalten ausgeführt, die in der Tabelle „Zuordnungen“ auf der Seite „Karte“ eingegeben wurden. Die Domäne, die jeder Spalte zugeordnet ist, wird mit Wissen aufgefüllt, das aus der Entdeckung gewonnen wird. Wenn es sich bei der Domäne um eine zusammengesetzte Domäne handelt, wird das Wissen den einzelnen Domänen hinzugefügt, aus denen die zusammengesetzte Domäne besteht.
Während der Entdeckungsprozess läuft, überprüfen Sie den Abschlussstatus, der für jeden Schritt der Entdeckung angezeigt wird: Vorverarbeiten von Datensätzen, Ausführen von Domänenregeln und Durchführung der Entdeckung. Der Prozentsatz der Fertigstellung und der Abschlussstatus werden für jede dieser Phasen angezeigt.
Überprüfen Sie nach Abschluss der Analyse, ob die Statuszeile unter den Abschlussstatistiken angibt, dass sie erfolgreich abgeschlossen wurde.
Hinweis
Wenn Sie den Bildschirm verlassen, bevor die Datei hochgeladen wurde, wird der Dateiuploadvorgang beendet.
Überprüfen Sie nach Abschluss der Analyse die Statistiken auf der Registerkarte "Profiler ", um den Status der Daten anzuzeigen. Weitere Informationen finden Sie unter Data Profiling and Notifications in DQS.
Nach Abschluss der Analyse wird die Schaltfläche " Start " in eine Schaltfläche " Neustart " umgewandelt. Klicken Sie auf "Neu starten ", um den Analysevorgang erneut auszuführen. Die Ergebnisse aus der vorherigen Analyse wurden jedoch noch nicht gespeichert, sodass durch Klicken auf "Neu starten " die vorherigen Daten verloren gehen. Klicken Sie zum Fortfahren im Popup auf "Ja ". Wenn die Analyse ausgeführt wird, verlassen Sie die Seite nicht, oder der Analyseprozess wird beendet.
Klicken Sie auf "Weiter ", um mit der Seite " Domänenwerte verwalten " des Wissensermittlungs-Assistenten fortzufahren. Auf dieser Seite können Sie das Wissen ändern, das den Domänen der Wissensbasis hinzugefügt wurde. Sie können auch Folgendes auswählen:
Klicken Sie auf "Abbrechen ", um die Knowledge Discovery-Aktivität zu beenden, Ihre Arbeit zu verlieren und zur DQS-Startseite zurückzukehren.
Klicken Sie auf "Schließen ", um zur DQS-Startseite zurückzukehren, während Sie Ihre Arbeit speichern. Die Wissensbasis wird für Sie gesperrt, und der Status der Wissensbasis in der Wissensbasistabelle auf dem Bildschirm "Open Knowledge Base " lautet "Discovery – Entdecken". Nachdem Sie auf "Schließen" geklickt haben, müssen Sie zum Ausführen der Domänenverwaltungsaktivität im Bildschirm "Knowledge Base Öffnen" auf "Knowledge Discovery" klicken, auf "Knowledge Base Management: Domänenbedingungen verwalten", auf "Fertig stellen" klicken und dann auf "Ja" klicken, um die Wissensbasis zu veröffentlichen, oder auf "Nein", um die Arbeit auf der Wissensbasis zu speichern und zu beenden.
Klicken Sie, um zur Seite " Entdecken" zurückzukehren.
Datenermittlungsergebnisstufe verwalten
Nachdem Sie die Wissensermittlungsaktivität durchgeführt haben, können Sie werte wie folgt ändern:
Fügen Sie der Wertliste einen Domänenwert hinzu, oder wählen Sie einen Wert aus, und löschen Sie ihn aus der Liste.
Ändern Sie den Status eines Domänenwerts von dem, was der DQS-Ermittlungsprozess festgelegt hat, in richtig, fehlerhaft oder ungültig.
Geben Sie einen Ersatzwert für einen Wert ein, der fehlerhaft ist oder ungültig ist.
Legen Sie zwei oder mehr Werte als Synonyme fest, und ändern Sie den führenden Wert, wie durch den Ermittlungsprozess festgelegt, mit dem Ergebnis, dass der führende Wert den Synonymwert ersetzt, wenn die Eigenschaft "Führende Werte verwenden " beim Erstellen der Domäne festgelegt wurde
Importieren sie Domänenwerte aus einer Excel-Datei.
In der Tabelle "Wert " werden die Kenntnisse angezeigt, die der Wissensbasis für eine einzelne Domäne hinzugefügt wurden. Sie wählen diese Domäne in der Domänenliste im Bereich links aus. Die Spalten im Feld sind die folgenden:
In der Spalte Wert werden alle Werte angezeigt, die der Ermittlungsprozess aus einem Feld im Datenbeispiel zur ausgewählten Domäne hinzugefügt hat. Jeder Wert, der als Fehler projiziert wird, wird als Synonym für einen Wert angezeigt, der als korrekt projiziert wird.
In der Spalte "Häufigkeit " wird die Anzahl der Instanzen des Werts im Beispieldatenbankfeld angezeigt, dem die Domäne zugeordnet ist. Bei einer zusammengesetzten Domäne werden nur diese Werte mit einer Häufigkeit angezeigt, die größer oder gleich 20 ist. Die Häufigkeitsdaten sind verfügbar, da der Wissensermittlungsprozess immer noch über eine Verbindung mit der Beispieldatenbank verfügt. Häufigkeitsdaten sind in der Domänentabelle auf der Registerkarte "Domänenwerte" des Bildschirms "Domänenverwaltung" nicht verfügbar, da der Domänenverwaltungsprozess keine Verbindung mit der Beispieldatenbank hat.
In der Spalte "Typ " wird der Status des Werts angezeigt, wie durch den Ermittlungsprozess bestimmt. Ein grünes Häkchen gibt an, dass der Wert korrekt oder korrigiert ist; ein rotes Kreuz gibt an, dass der Wert fehlerhaft ist; und ein orangefarbenes Dreieck mit einem Ausrufezeichen gibt an, dass der Wert ungültig ist. Ein ungültiger Wert entspricht nicht den Datenanforderungen für die Domäne. Ein Fehlerwert kann gültig sein, ist jedoch aus Datengründen nicht der richtige Wert.
Die Spalte "Richtig an " zeigt einen korrekten Wert an, in den der ursprüngliche Wert, der als Fehler oder ungültig markiert ist, geändert wird. DQS kann den richtigen Wert als Ergebnis des Ermittlungsprozesses vorschlagen.
Verwalten Sie die Ermittlungsergebnisse wie folgt:
Wählen Sie im Bereich "Domänenliste " auf der linken Seite eine Domäne aus, für die Domänenwerte festgelegt werden sollen. Sie können die folgenden Schritte ausführen, um die angezeigten Werte zu ändern.
Zeigen Sie die gewünschten Ergebnisse in der Tabelle basierend auf ihrem Status an, indem Sie den Status in der Filterliste auswählen.
Suchen Sie die Daten, die Sie überprüfen oder ändern möchten, indem Sie im Textfeld "Suchen" nach einem weiteren Buchstaben suchen. Dadurch werden diese Buchstaben überall dort hervorgehoben, wo sie in jedem angezeigten Wert vorkommen.
Klicken Sie auf " Nur Neu anzeigen ", um die in der Tabelle angezeigten Werte nur auf Werte zu beschränken, die in der aktuellen Sitzung ermittelt wurden, nicht auf vorherige Sitzungen.
Klicken Sie auf die Schaltfläche " Alle erweitern", um alle Werte in einer Gruppe von Synonymen anzuzeigen, wenn der aktuelle Zustand reduziert ist, oder auf die Schaltfläche "Alle reduzieren", um alle, aber den führenden Wert in einer Gruppe von Synonymen auszublenden, wenn der aktuelle Zustand erweitert wird.
Klicken Sie auf die Schaltfläche Zum Anzeigen/Ausblenden des Bereichs "Änderungen der Domänenwerte" , um ein Vorschau-Popup unten in der Wertetabelle anzuzeigen, in dem aktuelle Änderungen an der Sammlung von Domänenwerten angezeigt werden.
Suchen Sie alle Korrekturen, die Datenqualitätsdienste vorgeschlagen haben, indem Sie Filter auf Fehler festlegen. Vergewissern Sie sich, dass der Wert tatsächlich fehlerhaft ist und dass der Wert in der Spalte "Korrekte Werte" angemessen ist.
Legen Sie "Filter auf alle Werte " fest, und stellen Sie sicher, dass der Status der Werte geeignet ist. Wenn Sie den Status eines Werts ändern möchten, wählen Sie den Wert aus, und klicken Sie dann auf die Schaltfläche "Als korrigiert festlegen" (Überprüfen), die Schaltfläche "Als Fehler festlegen" (Kreuz) oder die Schaltfläche "Als ungültig festlegen" (Dreieck).
Gehen Sie wie folgt vor, um den Status eines Werts zu ändern:
Markieren Sie ausgewählte Domänenwerte als korrigiert: Um den Status eines Werts von "Fehler" oder "Ungültig" in "Richtig" zu ändern, wählen Sie den Wert aus, und klicken Sie dann auf den Abwärtspfeil in der Icon-Leiste oder in der Dropdown-Liste "Typ" auf ausgewählte Domänenwerte als korrigiert markieren (überprüfen). Wenn der fehlerhafte oder ungültige Wert mit einem korrekten Wert gruppiert ist, löschen Sie diesen Wert nach Abschluss des Vorgangs.
Legen Sie ausgewählte Domänenwerte als Fehler fest: Wenn Sie den Status eines Werts von "Richtig" oder "Ungültig" in "Fehler" ändern möchten, wählen Sie den Wert aus, und klicken Sie dann auf das Symbol " Ausgewählte Domäne als Fehler festlegen " (Kreuz) aus dem Abwärtspfeil in der Symbolleiste oder in der Dropdownliste "Typ". Sie können entweder eine Korrektur in die Spalte "Richtig " eingeben oder sie leer lassen.
Legen Sie ausgewählte Domänenwerte als ungültig fest: Um den Status eines Werts von "Richtig" oder "Fehler" in "Ungültig" zu ändern, wählen Sie den Wert aus, und klicken Sie dann auf das Symbol "Ungültige Domäne festlegen " (Dreieck) aus dem Abwärtspfeil in der Symbolleiste oder aus der Dropdownliste "Typ". Sie können entweder eine Korrektur in die Spalte "Richtig " eingeben oder sie leer lassen.
Richtig an: Geben Sie nach dem Festlegen eines Fehlers oder ungültigen Werts einen neuen Wert in die Spalte "Korrigieren nach" ein. DQS fügt eine neue Zeile für den Ersetzungswert hinzu, legt ihn als richtig fest und gruppiert dann die beiden Werte. Der neue Wert wird als vorangestellter Wert angezeigt, wobei der führende Wert fett formatiert und der In-Error- oder ungültige Wert eingerückt wird.
Wenn Sie Werte als Eine Gruppe von Synonymen festlegen möchten, wählen Sie mehrere werte aus, die korrekt sind, und fahren Sie dann wie folgt fort:
Legen Sie ausgewählte Domänenwerte als Synonyme fest: Klicken Sie, um die ausgewählten Werte als Synonyme festzulegen. DQS bestimmt einen der Werte als führenden Wert, durch den die anderen ersetzt werden.
Hinweis
Wenn Sie zwei oder mehr Werte in einer Gruppe und einen anderen Wert außerhalb der Gruppe auswählen und diese dann als Synonyme festlegen, wird eine falsche Fehlermeldung angezeigt. Nach dem Schließen des Popups für Fehlermeldungen werden die Werte ordnungsgemäß als Synonyme festgelegt.
Aufheben der Beziehung zwischen ausgewählten Synonymen: Klicken Sie, um die Synonymbezeichnung rückgängig zu machen.
Legen Sie den ausgewählten Domänenwert als führenden Wert ihrer Gruppe fest: Ändern Sie den führenden Wert der Gruppe, indem Sie einen Wert in der Gruppe auswählen, der nicht als führender Wert festgelegt ist, und klicken Sie dann auf den ausgewählten Domänenwert als führenden Wert seiner Gruppenschaltfläche .
Rechtschreibprüfung: Wenn Sie die Rechtschreibprüfung auf der Seite "Domäneneigenschaften" aktiviert haben, suchen Sie nach allen Werten mit einem wellenförmigen roten Unterstrich, was darauf hinweist, dass die Rechtschreibprüfung eine Korrektur vorschlägt. Klicken Sie mit der rechten Maustaste auf den Wert mit dem Unterstrich, und wählen Sie bei Anwendung eine Korrektur aus. Der Typ des Werts wird (oder bleibt) ein Fehler, und die Korrektur wird der Anpassen zu Spalte hinzugefügt. Klicken Sie auf den Pfeil nach unten, um weitere vorgeschlagene Korrekturen anzuzeigen. Geben Sie eine Korrektur manuell ein, um sie dem Wörterbuch hinzuzufügen und als Korrektur auswählen zu können. Weitere Informationen finden Sie unter "Verwenden der DQS Speller " und "Festlegen von Domäneneigenschaften".
Hinweis
Um die Rechtschreibprüfung zu verwenden, können Sie sie entweder auf der Seite "Domäneneigenschaften" aktivieren oder, wenn sie dort deaktiviert ist, auf der Seite "Ergebnisse der Datenermittlung verwalten" das Symbol "Rechtschreibprüfung aktivieren/Deaktivieren" anklicken, um sie dort zu aktivieren.
Neuen Domänenwert hinzufügen: Fügen Sie der Domäne einen neuen Wert hinzu, indem Sie auf die Schaltfläche " Neuen Domänenwert hinzufügen " klicken, um am Ende der Tabelle eine Zeile hinzuzufügen. Nachdem Sie einen Wert eingegeben haben, wird die Zeile in alphabetischer Reihenfolge neu positioniert.
Importieren sie Domänenwerte aus Excel: Fügen Sie neue Werte aus einer Excel-Tabelle hinzu, indem Sie auf den Abwärtspfeil für das Symbol " Werte importieren " klicken und dann "Domänenwerte aus Excel importieren" auswählen. Geben Sie den Dateinamen ein, wählen Sie bei Bedarf die erste Zeile als Kopfzeile verwenden aus, und klicken Sie dann auf "OK". Weitere Informationen finden Sie unter Importieren von Werten aus einer Excel-Datei in eine Domäne.
Importieren von Projektwerten: Fügen Sie neue Werte aus einem Datenqualitätsprojekt hinzu, indem Sie auf den Abwärtspfeil für das Symbol " Werte importieren " klicken und "Projektwerte importieren" auswählen. Geben Sie den Dateinamen ein, wählen Sie bei Bedarf die erste Zeile als Kopfzeile verwenden aus, und klicken Sie dann auf "OK". Wählen Sie das Projekt aus, aus dem Sie Werte importieren möchten, und klicken Sie dann auf "OK". Die importierten Werte werden angezeigt. Klicken Sie auf Fertig stellen. Weitere Informationen finden Sie unter Importieren von Projektwerten in eine Domäne.
Ausgewählte Domänenwerte löschen: Entfernen Sie einen oder mehrere vorhandene Werte aus der Domäne, indem Sie die Werte auswählen und dann auf die Schaltfläche "Ausgewählte Domänenwerte löschen " klicken. Ein Eintrag von DQS_NULL kann nicht gelöscht werden. Wenn Sie also mehrere zu löschende Werte auswählen und ein Eintrag von DQS_NULL einer davon ist, schlägt der Vorgang fehl.
Klicken Sie auf "Fertig stellen ", um die Wissensermittlungsaktivität abzuschließen. Wenn Sie nicht alle Domänen überprüft haben, wird ein Popup angezeigt. Klicken Sie auf "Ja ", um die Überprüfung fortzusetzen, oder auf "Nein ", um fortzufahren. Wenn Sie auf "Nein" klicken, wird ein weiteres Popup angezeigt, in dem Sie folgende Aktionen ausführen können:
Veröffentlichen: Die Wissensdatenbank wird für den aktuellen Nutzer oder andere zur Nutzung bereitgestellt. Die Wissensbasis wird nicht gesperrt, der Status der Wissensbasis (in der Wissensbasistabelle) wird auf "leer" festgelegt, und sowohl die Aktivitäten "Domänenverwaltung" als auch "Knowledge Discovery" sind verfügbar. Sie werden zur Startseite zurückkehren. Um den Vorgang abzuschließen, klicken Sie im Popup auf "Ja ".
Nein: Ihre Arbeit wird gespeichert, die Wissensbasis bleibt gesperrt, und der Status der Wissensbasis wird auf "In der Arbeit" festgelegt. Sowohl die Aktivitäten "Domänenverwaltung" als auch "Knowledge Discovery" sind verfügbar. Sie werden zur Startseite zurückkehren.
Abbrechen: Das Popup wird geschlossen, und Sie bleiben auf der Seite "Domänenwert verwalten " erhalten.
Sie können auch auf Folgendes klicken:
Abbrechen , um die Knowledge Discovery-Aktivität zu beenden, Ihre Arbeit zu verlieren und zur DQS-Startseite zurückzukehren.
Schließen Sie, um zur DQS-Startseite zurückzukehren und Ihre Arbeit zu speichern. Die Wissensbasis wird für Sie gesperrt, und der Status der Wissensbasis in der Wissensbasistabelle auf dem Bildschirm "Open Knowledge Base " lautet "Ermittlung – Wertverwaltung".
Klicken Sie auf "Zurück ", um zur Seite " Entdecken" zurückzukehren. Nachdem Sie auf "Schließen" geklickt haben, müssen Sie zum Ausführen der Domänenverwaltungsaktivität im Bildschirm "Knowledge Base Öffnen" auf "Knowledge Discovery" klicken, auf "Knowledge Base Management: Domänenbedingungen verwalten", auf "Fertig stellen" klicken und dann auf "Ja" klicken, um die Wissensbasis zu veröffentlichen, oder auf "Nein", um die Arbeit auf der Wissensbasis zu speichern und zu beenden.
Nachverfolgung: Nach der Durchführung der Wissensermittlung
Nachdem Sie dem Wissensfall im Computerunterstützten Wissensermittlungsprozess Kenntnisse hinzugefügt haben, können Sie entweder die Wissensbasis für ein Reinigungsprojekt sofort verwenden, oder Sie können die Domänenverwaltung vor dem Durchführen der Reinigung durchführen. Weitere Informationen zur Datenbereinigung oder Domänenverwaltung finden Sie unter "Datenbereinigung" oder "Verwalten einer Domäne".
Die Bedeutung von "Richtig", "Fehler" und "Ungültige Werte"
Jedem Wert in der Werttabelle der Seite "Domänenwerte " wird eine Typeinstellung von "Richtig", "Fehler" oder "Ungültig" zugewiesen. Der Typ des Werts wird anfänglich von der Wissensermittlungsaktivität generiert, und Sie können ihn nach Bedarf ändern. Der letzte Typ, der sowohl auf Entdeckungs- als auch interaktiven Änderungen basiert, wird durch die Reinigungsaktivität generiert. Diese Einstellungen haben die folgenden Bedeutungen:
Richtig: Dies ist ein Wert, der zur Domäne gehört und keine Syntaxfehler aufweist. Beispielsweise ist "Chicago" in einer City-Domäne richtig.
Fehler: Dies ist ein Wert, der zur Domäne gehört, aber ein falscher Wert ist. Beispielsweise ist "Shicago" anstelle von "Chicago" in einer City-Domäne fehlerhaft. DQS kennzeichnet einen Wert als fehlerhaft, wenn es im Ermittlungsprozess einen Syntaxfehler und eine zugehörige Korrektur erkennt. Syntaxfehler umfassen Rechtschreibfehler.
Ungültig: Dies ist ein Wert, der nicht zur Domäne gehört und keine Korrektur aufweist. Beispielsweise ist der Wert "12345" in einer Stadtdomäne ungültig. DQS bezeichnet einen Wert als ungültig, wenn eine Domänenregel fehlschlägt.
Sie können den Typ eines Werts manuell in einen der beiden anderen Werte ändern. DQS erzwingt keine Gültigkeits- und Fehlersemantik für manuelle Vorgänge. Sie können eine Korrektur für einen ungültigen Wert eingeben, ohne den Status zu ändern. Sie können einen Wert auch dann als ungültig festlegen, wenn er keine Domänenregel nicht bestanden hat. Sie können einen Wert als Fehler festlegen, auch wenn der Ermittlungsprozess nicht darauf hinweist, dass er einen Syntaxfehler aufweist. Sie können auch eine Korrektur auf einen Fehlerwert entfernen, der als "Richtig" gekennzeichnet ist, ohne den Status zu ändern.
Wenn Sie die interaktive Datenbereinigung auf der Seite " Ergebnisse verwalten" und "Ergebnisse anzeigen " der Bereinigungsaktivität ausführen, sind sowohl ungültige als auch Fehlerwerte auf der Registerkarte "Ungültig " auf der Seite " Ergebnisse verwalten" und "Ergebnisse anzeigen " enthalten.
So zeigen Sie die entsprechenden Werte an
Sie können die Anzeige wie folgt ändern:
Filtern Sie die gewünschten Ergebnisse in der Tabelle anhand ihres Status, indem Sie den Status in der Dropdownliste "Filter" auswählen.
Suchen Sie die Daten, die Sie überprüfen oder ändern möchten, indem Sie im Textfeld "Suchen " nach einem weiteren Buchstaben suchen. Dadurch werden diese Buchstaben überall dort hervorgehoben, wo sie in jedem angezeigten Wert vorkommen.
Klicken Sie auf " Nur Neu anzeigen ", um die in der Tabelle angezeigten Werte nur auf Werte zu beschränken, die in der aktuellen Sitzung ermittelt wurden, nicht auf vorherige Sitzungen.
Klicken Sie auf die Schaltfläche Alle erweitern, um alle Werte einer Gruppe von Synonymen anzuzeigen, wenn der aktuelle Zustand eingeklappt ist.
Klicken Sie auf die Schaltfläche "Alle reduzieren", um alle, aber den führenden Wert in jeder Gruppe von Synonymen auszublenden , wenn der aktuelle Zustand erweitert wird.
Klicken Sie auf die Schaltfläche Zum Anzeigen/Ausblenden des Bereichs "Änderungen der Domänenwerte" , um ein Vorschau-Popup unten in der Wertetabelle anzuzeigen, in dem aktuelle Änderungen an der Sammlung von Domänenwerten angezeigt werden.
Profiler Statistik
Die Registerkarte "Profiler" enthält Statistiken, die die Qualität der Quelldaten angeben. Diese Statistiken messen nicht die Qualität der Wissensbasis. Profiling in der Wissensentdeckung bietet Einblicke in die Vollständigkeit und Einzigartigkeit. Die Profilerstellung bei der Wissensermittlung misst nicht die Genauigkeit. Die Profilerstellung für das Wissensmanagement hilft Ihnen, den Umfang zu bewerten, in dem die Datenquelle für die Erstellung und Verbesserung des Wissens in einer Wissensbasis wertvoll ist.
Die Registerkarte "Profiler " enthält die folgenden Statistiken für den Ermittlungsprozess nach Feld und Domäne:
Datensätze: Wie viele Datensätze im Datenbeispiel ermittelt wurden
Gesamtwerte: Wie viele Gesamtwerte wurden für jedes Feld und insgesamt gefunden?
Neue Werte: Anzahl der Gesamtwerte für jedes Feld und alle zugeordneten Felder waren seit dem letzten Ermittlungsprozess neu und deren Prozentsatz der Gesamtwerte.
Eindeutige Werte: Wie viele der Gesamtwerte für jedes Feld und alle zugeordneten Felder einzigartig waren und ihr Anteil an den Gesamtwerten
Neue eindeutige Werte: Anzahl der eindeutigen Werte für jedes Feld und alle zugeordneten Felder waren seit dem letzten Ermittlungsprozess neu und deren Prozentsatz der Gesamtwerte
Gültig in "Domänenwerte": Anzahl der Gesamtwerte für jedes Feld und alle zugeordneten Felder waren gültig, und ihr Prozentsatz der Gesamtwerte
Die Feldstatistik umfasst Folgendes:
Feld: Name des Felds in der Quelldatenbank
Domäne: Name der Domäne, die dem Feld zugeordnet ist
Neu: Die Anzahl der neuen Werte und der Prozentwert neuer Werte im Vergleich zu vorhandenen Werten im Feld
Eindeutig: Die Anzahl der eindeutigen Datensätze im Feld und deren Prozentsatz der Gesamtzahl
Gültig in Domäne: Die Anzahl der gültigen Domänenwerte und deren Prozentsatz der Summe
Vollständigkeit: Die Vollständigkeit jedes Quellfelds, das für den Abgleichvorgang zugeordnet ist
Profilerstellung in der Wissensentdeckung liefert Einblicke in die Vollständigkeit. Wenn Ihnen die Profilerstellung mitteilt, dass ein Feld relativ unvollständig ist, können Sie es aus der Wissensdatenbank eines Datenqualitätsprojekts entfernen. Profilerstellung stellt möglicherweise keine zuverlässige Vollständigkeitsstatistik für zusammengesetzte Domänen bereit. Wenn Sie Vollständigkeitsstatistiken benötigen, verwenden Sie einzelne Domänen anstelle zusammengesetzter Domänen. Wenn Sie zusammengesetzte Domänen verwenden möchten, können Sie eine Wissensbasis mit einzelnen Domänen zur Profilerstellung erstellen, die Vollständigkeit bestimmen und eine andere Domäne mit einer zusammengesetzten Domäne für den Reinigungsprozess erstellen. Beispielsweise könnte das Profiling eine Vollständigkeit von 95% für Adressdatensätze mithilfe einer kombinierten Domäne anzeigen, aber es könnte für eine der Spalten, wie etwa die Postleitzahlspalte, ein wesentlich höheres Maß an Unvollständigkeit geben. In diesem Beispiel können Sie die Vollständigkeit der Postleitzahlspalte mit einer einzigen Domäne messen. Profilerstellung bietet wahrscheinlich zuverlässige Genauigkeitsstatistiken für zusammengesetzte Domänen, da Sie die Genauigkeit für mehrere Spalten zusammen messen können. Der Wert dieser Daten befindet sich in der zusammengesetzten Aggregation, daher können Sie die Genauigkeit mit einer zusammengesetzten Domäne messen.
Statistiken werden in den folgenden Phasen auf der Registerkarte "Profiler" angezeigt:
In der Phase der Vorverarbeitung von Datensätzen lädt DQS die Daten und indiziert sie. Dies erfolgt datensatzweise oder stapelweise, sodass der Fortschritt durch die Datensätze angezeigt werden kann. Während der Ausführung dieses Schritts können die meisten Profilerstellungsdaten generiert werden, mit Ausnahme von "Valid in Domain "-Werten.
In der Phase Domänenregeln ausführen wird die Spalte In Domäne gültig befüllt, während die Domänenregeln als atomare Einheit für jeden Domänenwert durchgeführt werden.
In der Phase "Running Discovery " werden keine neuen Daten auf der Registerkarte "Profiler" aktualisiert. Alle aufgetretenen Syntaxfehler können im nächsten Schritt des Assistenten, der Phase "Domänenwerte verwalten" , angezeigt werden.
Für die Wissensermittlungsaktivität führen die folgenden Bedingungen zu Benachrichtigungen:
Es gibt keine neuen Werte in einem Feld; es wird empfohlen, das Feld aus der Zuordnung zu entfernen.
Es gibt nur wenige neue Werte in einem Feld; Möglicherweise möchten Sie es von der Zuordnung entfernen.
Ein Feld ist leer; es wird vorgeschlagen, es aus der Zuordnung zu entfernen.
Die Feld-Vollständigkeitsbewertung ist sehr niedrig; Möglicherweise möchten Sie es von der Zuordnung entfernen.
Alle Werte in einem Feld sind ungültig; Sie sollten die Zuordnung und die Relevanz von Domänenregeln für den Feldinhalt überprüfen.
Es gibt eine geringe Anzahl gültiger Werte im Feld. Sie sollten die Zuordnung und die Relevanz der Domain-Regeln für den Feldinhalt überprüfen.
Weitere Informationen zur Profilerstellung finden Sie unter Data Profiling and Notifications in DQS.