Extrahieren von Schlüsselbegriffen
Die Schlüsselauszugsextraktion ist eine Funktion , die von Azure Language angeboten wird. Er identifiziert die wichtigsten Ausdrücke oder Hauptkonzepte im Text.
Es gibt mehrere Möglichkeiten, die Schlüsselauszugs-API aufzurufen. Hier verwenden Sie die azure_ai Erweiterung zum Extrahieren von Schlüsselausdrücken in SQL-Abfragen.
Voraussetzungen
Sie benötigen einen flexiblen Azure-Datenbankserver für PostgreSQL mit aktivierter azure_aiund konfigurierter Erweiterung. Sie müssen sie auch mit Azure Cognitive Services autorisieren , indem Sie den Schlüssel und Endpunkt einer Sprachressource festlegen.
Szenarien
Die Schlüsselphrasenextraktion wird bei verschiedenen Aufgaben angewendet.
- Zusammenfassung: Verwenden Sie wichtige Ausdrücke, um langwierige Dokumente auf Kernthemen zu reduzieren, z. B. das Identifizieren von Themen, die in Audiotranskripten oder Besprechungsnotizen behandelt werden.
- Inhaltskategorisierung: Verwenden Sie Schlüsselbegriffe, um Dokumente für die Suche und das Browsen indizieren. Wichtige Ausdrücke können auch verwendet werden, um Dokumente in Word-Clouds zu visualisieren.
- Dokumentclustering: Umfangreiche Sammlungen von Supporttickets, Produktrezensionen und andere unstrukturierte Eingaben können mithilfe von Schlüsselausdrücken gruppiert und analysiert werden.
Verwenden der Schlüsselauszugsextraktion SQL mit Azure Cognitive Services
Die azure_ai Erweiterung für Azure Database for PostgreSQL flexible Server bietet benutzerdefinierte Funktionen (UDFs) für den direkten Zugriff auf KI-Funktionen aus SQL. Auf die Schlüsselauszugs-API wird mit der azure_cognitive.extract_key_phrases Funktion zugegriffen:
azure_cognitive.extract_key_phrases(
text TEXT,
language TEXT,
timeout_ms INTEGER DEFAULT 3600000,
throw_on_error BOOLEAN DEFAULT TRUE,
disable_service_logs BOOLEAN DEFAULT FALSE
)
Die erforderlichen Parameter sind text, die Eingabe, und language, die Sprache, in der die text geschrieben wird. Beispielsweise en-us ist US-Englisch und fr französisch. Siehe Sprachunterstützung für die vollständige Liste der verfügbaren Sprachen.
Die Schlüsselsatzerkennung wird standardmäßig abgebrochen, wenn sie nicht innerhalb von 3.600.000 ms abgeschlossen ist, also 1 Stunde. Sie können diese Verzögerung anpassen, indem Sie timeout_ms ändern.
Wenn ein Fehler auftritt, besteht das Standardverhalten darin, eine Ausnahme auszuwerfen, was zu einem Transaktionsrollback führt. Sie können dieses Verhalten deaktivieren, indem Sie auf "false" festlegen throw_on_error .
Eine vollständige Parameterdokumentation finden Sie in der Dokumentation zur Azure Cognitive Services-Erweiterung .
Wenn Sie beispielsweise diese Abfrage aufrufen:
SELECT azure_cognitive.extract_key_phrases('The food was delicious and the staff were wonderful.', 'en-us');
Gibt dieses Ergebnis an:
extract_key_phrases
---------------------
{food,staff}
Sie können Tabellenspalten für den Eingabetext verwenden:
SELECT description, azure_cognitive.extract_key_phrases(description, 'en-us')
FROM listings LIMIT 1;
Dadurch wird Folgendes zurückgegeben (mit \x für die erweiterte Anzeige):
description | Welcome! If you stay here you will be living in a light filled two bedroom upper and ground level apartment (in a two apartment home). During your stay you will be welcome to share in our fresh eggs from the chickens and garden produce in season! Welcome! Come enjoy your time in Seattle at a lovely urban farmstead. There are two bedrooms each with a queen bed, full bath, living room and kitchen with wood floors throughout. During your stay you will be welcome to eat fresh eggs from the chickens and possibly fruit/veggies from the garden if you are in luck! We are family friendly and have a down to earth atmosphere. There is a large covered back porch and grill for hanging out especially in summer and a treehouse for up in the trees hammock time! Walking distance to Othello Light Rail Station for easy access to downtown. Also nearby is the fantastic Seward Park and the Kubota Gardens for outdoorsy loveliness. New last year is out beautiful Rainier Beach indoor swimming pool comp
extract_key_phrases | {"beautiful Rainier Beach indoor swimming pool","large covered back porch","Othello Light Rail Station","ground level apartment","lovely urban farmstead","fantastic Seward Park","two bedroom upper","two apartment home","two bedrooms","fresh eggs","queen bed","full bath","living room","wood floors","earth atmosphere","Walking distance","easy access","Kubota Gardens","outdoorsy loveliness","garden produce","hammock time",stay,chickens,season,Seattle,kitchen,fruit/veggies,luck,grill,summer,treehouse,trees,downtown,last}
Zusammenfassung
Die Schlüsselauszugsextraktion wählt die wichtigsten Konzepte aus dem Text aus. Das Azure Cognitive Services-Sprachmodell ist dafür verantwortlich, natürliche Sprache in Schlüsselwörter oder Phrasen umzuwandeln. Die azure_ai Erweiterung für Azure Database for PostgreSQL stellt die azure_cognitive.extract_key_phrases API für den Zugriff auf die Schlüsselausdrucksextraktion direkt in SQL-Abfragen bereit.