Freigeben über


Worum handelt es sich bei der benutzerdefinierten Textklassifizierung?

Benutzerdefinierte Textklassifizierung ist eine der benutzerdefinierten Features, die von Azure Language in Foundry Tools angeboten werden. Es handelt sich um einen cloudbasierten API-Dienst, der maschinelle Lernintelligenz anwendet, damit Sie benutzerdefinierte Modelle für Textklassifizierungsaufgaben erstellen können.

Mit der benutzerdefinierten Textklassifizierung können Benutzer benutzerdefinierte KI-Modelle erstellen, um Text in benutzerdefinierte Klassen zu klassifizieren, die vom Benutzer vordefinierte werden. Durch das Erstellen eines Projekts für die benutzerdefinierte Textklassifizierung können Entwickler Daten iterativ bezeichnen, trainieren und auswerten sowie die Modellleistung verbessern, bevor sie für die Nutzung verfügbar gemacht werden. Die Qualität der bezeichneten Daten wirkt sich erheblich auf die Modellleistung aus. Um das Erstellen und Anpassen Ihres Modells zu vereinfachen, bietet der Dienst eine einheitliche Plattform zum Erstellen, Verwalten und Bereitstellen von KI-Lösungen, auf die über die Microsoft Foundry zugegriffen werden kann. Sie können problemlos erste Schritte mit dem Dienst ausführen, indem Sie diese Schnellstartanleitung befolgen.

Benutzerdefinierte Textklassifizierung unterstützt zwei Arten von Projekten:

  • Klassifizierung mit einzelner Bezeichnung: Sie können jeder Datei In Ihrem Dataset eine einzelne Klasse zuweisen. Beispielsweise könnte ein Filmskript nur als "Romanze" oder "Komödie" klassifiziert werden.
  • Klassifizierung mit mehreren Bezeichnungen: Sie können jedem Dokument in Ihrem Dataset mehrere Klassen zuweisen. Beispielsweise könnte ein Filmskript als "Comedy" oder "Romanze" und "Comedy" klassifiziert werden.

Diese Dokumentation enthält die folgenden Arten von Artikeln:

  • Schnellstarts sind Anleitungen zu den ersten Schritten, die Sie durch das Senden von Anforderungen an den Dienst führen.
  • Die Artikel zu Konzepten enthalten Erläuterungen der Dienstfunktionen und -features.
  • Anleitungen enthalten Anweisungen zur spezifischeren oder individuelleren Verwendung des Diensts.

Beispiele für Nutzungsszenarien

Benutzerdefinierte Textklassifizierung kann in mehreren Szenarien in verschiedenen Branchen verwendet werden:

Automatische E-Mails oder Ticketselektierung

Supportzentren aller Art erhalten eine große Menge an E-Mails oder Tickets mit unstrukturiertem, freiem Text und Anhängen. Die rechtzeitige Überprüfung, Bestätigung und Weiterleitung an fachliche Ansprechpartner in internen Teams ist von entscheidender Bedeutung. Die E-Mail-Selektierung in diesem Umfang erfordert die Überprüfung und Weiterleitung an die richtigen Abteilungen, was Zeit und Ressourcen kostet. Mithilfe der benutzerdefinierte Textklassifizierung können eingehende Texte analysiert und ihre Inhalte kategorisiert werden, damit sie automatisch an die zuständige Abteilung weitergeleitet werden, um die erforderlichen Maßnahmen zu ergreifen.

Search dient als wichtige Grundlage für jede App, mit der Textinhalte für Benutzer angezeigt werden. Häufige Szenarien sind die Katalog- oder Dokumentsuche, die Suche nach Einzelhandelsprodukten oder das Knowledge Mining bei Data Science. Viele Unternehmen aus verschiedenen Branchen möchten eine umfangreiche Suchumgebung für private, heterogene Inhalte erstellen, die sowohl strukturierte als auch unstrukturierte Dokumente umfassen. Als Teil ihrer Pipeline können Entwickler die benutzerdefinierte Textklassifizierung verwenden, um Text in Klassen einzuteilen, die für ihre Branche relevant sind. Mithilfe der vorhergesagten Klassen kann die Indizierung der Datei für eine stärker angepasste Sucherfahrung angereichert werden.

Lebenszyklus der Projektentwicklung

Das Erstellen eines Projekts für die benutzerdefinierte Textklassifizierung umfasst in der Regel mehrere unterschiedliche Schritte.

Der Entwicklungslebenszyklus

Führen Sie die folgenden Schritte aus, um Ihr Modell optimal zu nutzen:

  1. Definieren des Schemas: Sie müssen Ihre Daten kennen und die Klassen identifizieren, zwischen denen Sie unterscheiden möchten, um Mehrdeutigkeit zu vermeiden.

  2. Bezeichnen von Daten: Die Qualität der Datenbezeichnung ist ein wichtiger Faktor beim Ermitteln der Modellleistung. Dokumente, die zur gleichen Klasse gehören, sollten immer die gleiche Klasse aufweisen. Wenn Sie über ein Dokument verfügen, das zwei Klassen zugeteilt werden kann, verwenden Sie Projekte für die Klassifizierung mit mehreren Bezeichnungen. Vermeiden Sie mehrdeutige Klassen, und stellen Sie sicher, dass Ihre Klassen eindeutig voneinander getrennt werden können, insbesondere bei Projekten zur Klassifizierung mit einzelnen Bezeichnungen.

  3. Trainieren des Modells: Ihr Modell beginnt mit dem Lernen auf der Grundlage der bezeichneten Daten.

  4. Anzeigen der Modellleistung: Zeigen Sie die Auswertungsdetails für Ihr Modell an, um zu ermitteln, wie gut es bei der Einführung für neue Daten funktioniert.

  5. Bereitstellen des Modells: Durch die Bereitstellung eines Modells wird dieses zur Verwendung über die Analyse-API zur Verfügung gestellt.

  6. Klassifizieren von Text: Verwenden Sie Ihr benutzerdefiniertes Modell für Aufgaben für die benutzerdefinierte Textklassifizierung.

Referenzdokumentation und Codebeispiele

Wenn Sie benutzerdefinierte Textklassifizierung verwenden, lesen Sie die folgende Referenzdokumentation und Beispiele für Azure Language in Foundry Tools:

Entwicklungsoption/Sprache Referenzdokumentation Beispiele
REST-APIs (Dokumenterstellung) REST-API-Dokumentation
REST-APIs (Runtime) REST-API-Dokumentation
C# (Runtime) C#-Dokumentation C#-Beispiele: Klassifizierung mit einzelnen BezeichnungenC#-Beispiele: Klassifizierung mit mehreren Bezeichnungen
Java-Laufzeitumgebung (Java Runtime) Java-Dokumentation Java-Beispiele: Klassifizierung mit einzelnen BezeichnungenJava-Beispiele: Klassifizierung mit mehreren Bezeichnungen
JavaScript (Laufzeitumgebung) JavaScript-Dokumentation JavaScript-Beispiele: Klassifizierung mit einzelnen BezeichnungenJavaScript-Beispiele: Klassifizierung mit mehreren Bezeichnungen
Python (Runtime) Python-Dokumentation Python-Beispiele: Klassifizierung mit einzelnen BezeichnungenPython-Beispiele: Klassifizierung mit mehreren Bezeichnungen

Verantwortungsbewusste künstliche Intelligenz

Zu einem KI-System gehört nicht nur die Technologie, sondern auch die Personen, die es verwenden, die davon betroffenen Personen und die Bereitstellungsumgebung. Weitere Informationen zur Verwendung und Bereitstellung von verantwortungsvoller KI in Ihren Systemen finden Sie im Transparenzhinweis für die benutzerdefinierte Textklassifizierung.

Nächste Schritte

  • Verwenden Sie diesen Schnellstartartikel, um mit der Verwendung der benutzerdefinierten Textklassifizierung zu beginnen.

  • Lesen Sie beim Durchlaufen des Lebenszyklus der Projektentwicklung das Glossar, um mehr über die Begriffe zu erfahren, die in der Dokumentation für dieses Feature verwendet werden.

  • Informationen zu Aspekten wie regionale Verfügbarkeit finden Sie in den Diensteinschränkungen.