Einleitung
Azure Language ist ein cloudbasierter NlP-Dienst (Natural Language Processing). Sie ermöglicht Benutzern das Verständnis und Analysieren von Text mit Features wie der Extraktion von Schlüsselbegriffen, der Entitätserkennung, der Erkennung von personenbezogenen Informationen (Personally Identifiable Information, PII) und mehr. Weitere Informationen finden Sie hier: Was ist Azure Language?.
Die azure_ai Erweiterung für Azure Database for PostgreSQL flexible Server integriert die Datenbank in die Azure-Sprachdienste. Sie bietet benutzerdefinierte Funktionen für den Zugriff auf die Sprach-APIs in SQL. Mit diesem Zugriff können Sie Erkenntnisse aus Text direkt aus der Datenbank extrahieren, ohne Code für die Verarbeitung natürlicher Sprachen in Clientanwendungen zu schreiben.
Beispielszenario
Erwägen Sie ein Unternehmen, das Urlaubsauflistungen bereitstellt. Das Marketingteam des Unternehmens möchte die Kundenpräferenzen besser verstehen, indem die wichtigsten Ausdrücke in den beliebtesten Auflistungen identifiziert und hervorgehoben werden, welche Unternehmen, Attraktionen und Orte hervorgehoben werden. Außerdem möchte das Informationssicherheitsteam des Unternehmens Einträge auf personenbezogene Informationen (PII) überprüfen, um Sicherheit und Datenschutz zu gewährleisten.
Lernziele
Um unsere drei Aufgaben auszuführen, verwenden Sie die azure_ai-Erweiterung, um eine Azure Database for PostgreSQL – Flexible Server in Azure Language zu integrieren. Zuerst extrahieren Sie die Schlüsselwörter aus den Eintragsbeschreibungen und speichern sie in der Datenbank, damit das Datenwissenschaftsteam analysieren kann, welche in beliebten Einträgen am häufigsten vorkommen. Anschließend extrahieren und speichern Sie benannte Entitäten für denselben Zweck. Schließlich kennzeichnen Sie alle PII-Einträge und speichern den geschwärzten Text.
Das Hauptziel besteht darin, zu verstehen, wie die azure_ai PostgreSQL-Erweiterung für den Zugriff auf diese Azure Language-Dienste verwendet wird: Schlüsselausdrucksextraktion, Entitätserkennung und PII-Erkennung. Sie erfahren, wie Sie auf diese APIs in SQL zugreifen und die Ergebnisdaten in Spalten speichern.
Setup: Aktivieren und Autorisieren azure_ai
Dieser Lernpfad verwendet die azure_ai Erweiterung. Es gibt einige Schritte zum Installieren und Konfigurieren. Sie müssen sie Ihrer Zulassungsliste hinzufügen, wie in der Verwendung von PostgreSQL-Erweiterungen beschrieben. Installieren Sie dann die Erweiterung, indem Sie diese SQL-Abfrage ausführen:
CREATE EXTENSION azure_ai;
Wenn Sie die Erweiterung entfernen möchten, verwenden Sie Folgendes:
DROP EXTENSION azure_ai;
Durch die Installation der Erweiterung werden die folgenden drei Schemas erstellt:
-
azure_ai: das Hauptschema zum Speichern von Konfigurationsdaten und -funktionen. -
azure_openai: Funktionen und zusammengesetzte Typen im Zusammenhang mit OpenAI. -
azure_cognitive: Funktionen und zusammengesetzte Typen im Zusammenhang mit Cognitive Services.
Unsere Aufgaben verwenden Azure Cognitive Services. Nachdem Sie die Erweiterung aktiviert und azure_ai haben, können Sie sie in Azure Cognitive Services integrieren, um auf die Schlüsselauszugsextraktion aus SQL zuzugreifen.
Wenn Sie noch keines haben, erstellen Sie eine Sprachressource im Azure-Portal. Sobald Sie über eine Sprachressource verfügen, wechseln Sie zu >, um Ihren Schlüssel und Endpunkt für Azure Cognitive Services abzurufen.
Autorisieren Sie als Nächstes die azure_ai-Erweiterung von Azure Database for PostgreSQL – Flexible Server, indem Sie diese SQL-Datei ausführen:
select azure_ai.set_setting('azure_cognitive.endpoint','https://<endpoint>.cognitiveservices.azure.com');
select azure_ai.set_setting('azure_cognitive.subscription_key', '<API Key>');
-- the region setting is only required for the translate function
select azure_ai.set_setting('azure_cognitive.region', '');
Weitere Informationen finden Sie in der Dokumentation zu Azure Cognitive Services.