Freigeben über


Kommentieren von Datenquellen in Azure Data Catalog

Wichtig

Der Azure-Datenkatalog wurde am 15. Mai 2024 eingestellt.

Verwenden Sie für Datenkatalogfeatures den Microsoft Purview-Dienst, der einheitliche Datengovernance für Ihren gesamten Datenbestand bietet.

Einführung

Der Microsoft Azure-Datenkatalog ist ein vollständig verwalteter Clouddienst, der als System der Registrierung und des Ermittlungssystems für Unternehmensdatenquellen dient. Data Catalog unterstützt Benutzer also beim Ermitteln, Nachvollziehen und Verwenden von Datenquellen und Unternehmen dabei, mehr Nutzen aus ihren vorhandenen Daten zu ziehen. Wenn eine Datenquelle in Data Catalog registriert wird, werden ihre Metadaten vom Dienst kopiert und indiziert. Das ist aber noch nicht alles. Data Catalog bietet Benutzern die Möglichkeit, die aus der Datenquelle extrahierten Metadaten durch eigene beschreibende Metadaten (beispielsweise Beschreibungen und Tags) zu ergänzen, um die Datenquelle für andere Benutzer verständlicher zu machen.

Annotation und Crowdsourcing

Jeder hat eine Meinung. Und das ist auch gut so. Data Catalog berücksichtigt die Tatsache, dass unterschiedliche Benutzer Unternehmensdatenquellen aus verschiedenen Perspektiven betrachten und jede dieser Perspektiven nützlich sein kann. Nehmen Sie das folgende Szenario als Beispiel:

  • Der Systemadministrator kennt die Vereinbarung zum Servicelevel für die Server und Dienste, die die Datenquelle hosten.
  • Der Datenbankadministrator kennt den Sicherungszeitplan für jede Datenbank und die zulässigen ETL-Verarbeitungsfenster.
  • Der Systembesitzer weiß, wie Benutzer Zugriff auf die Datenquelle anfordern.
  • Der Data Steward weiß, wie die Ressourcen und Attribute in der Datenquelle dem Unternehmensdatenmodell zugeordnet sind.
  • Der Analyst weiß, wie die Daten im Kontext der von ihm unterstützten Geschäftsprozesse verwendet werden.

Da jede dieser Perspektiven wertvoll ist, verwendet Data Catalog einen Crowdsourcing-Ansatz für Metadaten. Auf diese Weise kann jede Perspektive berücksichtigt und ein lückenloses Bild der registrierten Datenquellen bereitgestellt werden. Im Data Catalog-Portal kann jeder Benutzer eigene Anmerkungen hinzufügen und bearbeiten und gleichzeitig die Anmerkungen anderer Benutzer anzeigen.

Verschiedene Anmerkungstypen

Data Catalog unterstützt folgende Anmerkungstypen:

Anmerkung Hinweise
Freundlicher Name Benutzerfreundliche Namen können auf der Datenressourcenebene angegeben werden, um das Verständnis der Datenressourcen zu erleichtern. Freundliche Namen sind besonders hilfreich, wenn der zugrunde liegende Objektname unverständlich, abgekürzt oder für Benutzer nicht aussagekräftig ist.
Beschreibung Beschreibungen können auf der Datenressourcen- und Attribut-/Spaltenebene angegeben werden. Beschreibungen sind kurze Textanmerkungen ohne vorgegebene Form, die beschreiben, was der Benutzer über die Datenressource weiß oder wie er sie verwendet.
Tags (Benutzertags) Tags können auf der Datenressourcen- und Attribut-/Spaltenebene angegeben werden. Benutzertags sind benutzerdefinierte Bezeichnungen, die zum Kategorisieren von Datenassets oder Attributen verwendet werden können.
Tags (Glossartags) Tags können auf der Datenressourcen- und Attribut-/Spaltenebene angegeben werden. Glossartags sind zentral definierte Glossarbegriffe, die zum Kategorisieren von Datenressourcen oder Attributen mithilfe einer allgemeinen Unternehmenstaxonomie verwendet werden können. Weitere Informationen finden Sie unter Einrichten des Business Glossars für gesteuertes Tagging
Experten Experten können auf der Datenressourcenebene angegeben werden. Experten sind Benutzer oder Gruppen, die über fundiertes Wissen über die Daten verfügen und als Ansprechpartner für Benutzer fungieren können, die die registrierten Datenquellen finden und Fragen haben, die durch die vorhandenen Anmerkungen nicht beantwortet werden.
Anfordern des Zugriffs Zugriffsanforderungsinformationen können auf der Ebene der Datenressourcen bereitgestellt werden. Diese Anmerkung ist für Benutzer vorgesehen, die eine Datenquelle finden, für die sie noch keine Zugriffsberechtigung besitzen. Benutzer können die E-Mail-Adresse des Benutzers oder der Gruppe, der bzw. die für die Erteilung der Zugriffsberechtigung zuständig ist, die URL des für den Zugriff erforderlichen Prozesses oder Tools oder den Prozess selbst als Text eingeben.
Dokumentation Eine Dokumentation kann auf der Datenobjektebene bereitgestellt werden. Bei einer Ressourcendokumentation handelt es sich um Rich-Text-Informationen, die Links und Bilder enthalten und somit Informationen vermitteln können, die sich nicht über Beschreibungen und Tags bereitstellen lassen.

Anmerkungen zu mehreren Assets hinzufügen

Benutzer können im Data Catalog-Portal mehrere Datenressourcen auswählen und allen ausgewählten Ressourcen in nur einem Arbeitsschritt eine Anmerkung hinzufügen. Da Anmerkungen für alle ausgewählten Datenressourcen gelten, ist es ganz einfach, einheitliche Beschreibungen, Tags und Experten für verwandte Datenressourcen bereitzustellen.

Hinweis

Tags und Experten können auch beim Registrieren von Datenressourcen mit dem Data Catalog-Tool zur Datenquellenregistrierung angegeben werden.

Bei Auswahl mehrerer Tabellen und Ansichten werden im Data Catalog-Portal nur Spalten angezeigt, die in allen ausgewählten Datenressourcen vorhanden sind. So können Benutzer Tags und Beschreibungen für alle Spalten hinzufügen, die für alle ausgewählten Datenressourcen den gleichen Namen aufweisen.

Anmerkungen und Entdeckung

Genau wie die Metadaten, die bei der Registrierung aus der Datenquelle extrahiert und dem Data Catalog-Suchindex hinzugefügt werden, werden auch die vom Benutzer angegebenen Metadaten indiziert. Das bedeutet, dass Anmerkungen den Benutzern nicht nur das Verständnis der entdeckten Daten erleichtern, sondern es ihnen auch ermöglichen, durch die Suche nach den für sie sinnvollen Begriffen die annotierten Datenressourcen einfacher zu finden.

Zusammenfassung

Durch die Registrierung einer Datenquelle in Data Catalog werden strukturelle und beschreibende Metadaten aus der Datenquelle in den Katalogdienst kopiert, sodass die darin enthaltenen Daten leichter auffindbar sind. Sobald eine Datenquelle registriert wurde, können Benutzer im Data Catalog-Portal Anmerkungen hinzufügen, um das Verständnis der Daten zu erleichtern und die Ermittlung zu vereinfachen.