Udostępnij przez


Co to jest niestandardowa klasyfikacja tekstu?

Niestandardowa klasyfikacja tekstu jest jedną z niestandardowych funkcji oferowanych przez usługę Azure Language in Foundry Tools. Jest to oparta na chmurze usługa interfejsu API, która stosuje analizę uczenia maszynowego, aby umożliwić tworzenie niestandardowych modeli pod kątem zadań klasyfikacji tekstu.

Niestandardowa klasyfikacja tekstu umożliwia użytkownikom tworzenie niestandardowych modeli sztucznej inteligencji w celu klasyfikowania tekstu w niestandardowych klasach wstępnie zdefiniowanych przez użytkownika. Tworząc niestandardowy projekt klasyfikacji tekstu, deweloperzy mogą iteracyjnie oznaczać dane, trenować, oceniać i poprawiać wydajność modelu przed udostępnieniem ich do użycia. Jakość oznaczonych danych znacznie wpływa na wydajność modelu. Aby uprościć tworzenie i dostosowywanie modelu, usługa oferuje ujednoliconą platformę do tworzenia, zarządzania i wdrażania rozwiązań sztucznej inteligencji, do których można uzyskać dostęp za pośrednictwem rozwiązania Microsoft Foundry. Możesz łatwo rozpocząć pracę z usługą, wykonując kroki opisane w tym przewodniku Szybki start.

Niestandardowa klasyfikacja tekstu obsługuje dwa typy projektów:

  • Klasyfikacja pojedynczej etykiety — można przypisać pojedynczą klasę dla każdego dokumentu w zestawie danych. Na przykład skrypt filmowy można sklasyfikować tylko jako "Romans" lub "Komedia".
  • Klasyfikacja wielu etykiet — można przypisać wiele klas dla każdego dokumentu w zestawie danych. Na przykład skrypt filmowy można sklasyfikować jako "Komedia" lub "Romans" i "Komedia".

Ta dokumentacja zawiera następujące typy artykułów:

  • Szybkie przewodniki startowe to instrukcje wprowadzające, które prowadzą cię przez proces wysyłania żądań do usługi.
  • Koncepcje zawierają wyjaśnienia funkcjonalności i cech usługi.
  • Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowy lub dostosowany sposób.

Przykładowe scenariusze użycia

Niestandardowa klasyfikacja tekstu może być używana w wielu scenariuszach w różnych branżach:

Automatyczne wiadomości e-mail lub priorytetyzacja zgłoszeń

Centra pomocy technicznej wszystkich typów otrzymują dużą liczbę wiadomości e-mail lub biletów zawierających nieustrukturyzowany, dowolny tekst i załączniki. Terminowe przeglądanie, potwierdzanie i kierowanie do ekspertów wewnętrznych zespołów ma kluczowe znaczenie. Klasyfikacja wiadomości e-mail w tej skali wymaga, aby osoby przeglądały wiadomości e-mail i kierowały je do odpowiednich działów, co zajmuje czas i zasoby. Niestandardowa klasyfikacja tekstu może służyć do analizowania tekstu przychodzącego oraz klasyfikowania i kategoryzowania zawartości, która ma być automatycznie kierowana do odpowiednich działów w celu wykonania dalszych działań.

Wyszukiwanie jest podstawą dowolnej aplikacji, która wyświetla zawartość tekstowa dla użytkowników. Typowe scenariusze obejmują wyszukiwanie katalogów lub dokumentów, wyszukiwanie produktów w sprzedaży detalicznej lub wyszukiwanie wiedzy na potrzeby nauki o danych. Wiele przedsiębiorstw w różnych branżach stara się stworzyć bogate środowisko wyszukiwania w prywatnej, heterogenicznej zawartości, która obejmuje zarówno dokumenty ustrukturyzowane, jak i nieustrukturyzowane. W ramach procesu deweloperzy mogą użyć niestandardowej klasyfikacji tekstu do kategoryzowania tekstu w kategorie, które są istotne dla ich branży. Przewidywane klasy mogą służyć do wzbogacania indeksowania pliku w celu uzyskania bardziej dostosowanego środowiska wyszukiwania.

Cykl projektowania projektu

Tworzenie niestandardowego projektu klasyfikacji tekstu zwykle obejmuje kilka różnych kroków.

Cykl życia programowania

Wykonaj następujące kroki, aby jak najlepiej wykorzystać model:

  1. Zdefiniuj schemat: Poznaj dane i zidentyfikuj klasy , które chcesz rozróżnić, aby uniknąć niejednoznaczności.

  2. Etykietowanie danych: Jakość etykietowania danych jest kluczowym czynnikiem w określaniu wydajności modelu. Dokumenty należące do tej samej klasy powinny zawsze mieć tę samą klasę, jeśli masz dokument, który może należeć do dwóch klas, używa projektów klasyfikacji wielu etykiet. Unikaj niejednoznaczności klas, upewnij się, że klasy są wyraźnie rozdzielne od siebie, szczególnie w przypadku projektów klasyfikacji z jedną etykietą.

  3. Trenowanie modelu: Model zaczyna uczyć się na podstawie danych oznaczonych etykietami.

  4. Wyświetlanie wydajności modelu: wyświetl szczegóły oceny modelu, aby określić, jak dobrze działa w przypadku wprowadzenia nowych danych.

  5. Wdrożenie modelu: Wdrożenie modelu udostępnia go do użycia za pomocą interfejsu API Analizy.

  6. Klasyfikowanie tekstu: użyj niestandardowego modelu do wykonywania niestandardowych zadań klasyfikacji tekstu.

Dokumentacja referencyjna i przykłady kodu

Jeśli używasz niestandardowej klasyfikacji tekstu, zapoznaj się z następującą dokumentacją referencyjną i przykładami dotyczącymi języka platformy Azure w narzędziach Foundry:

Opcja/język programowania Dokumentacja referencyjna Przykłady
API REST (autorstwo) Dokumentacja interfejsu API REST
Interfejsy API REST (środowisko uruchomieniowe) Dokumentacja interfejsu API REST
C# (środowisko uruchomieniowe) Dokumentacja języka C# Przykłady w języku C# — klasyfikacja pojedynczej etykietyPrzykłady w języku C# — klasyfikacja wielu etykiet
Java (środowisko uruchomieniowe) Dokumentacja języka Java Przykłady w Java - klasyfikacja pojedynczej etykietyPrzykłady w Java - klasyfikacja wielu etykiet
JavaScript (środowisko uruchomieniowe) Dokumentacja języka JavaScript Przykłady JavaScript — klasyfikacja pojedynczej etykietyPrzykłady JavaScript — klasyfikacja wielu etykiet
Python (środowisko uruchomieniowe) Dokumentacja języka Python Przykłady języka Python — klasyfikacja jednokrotnej etykietyPrzykłady języka Python — klasyfikacja wielokrotnej etykiety

Odpowiedzialne AI

System sztucznej inteligencji obejmuje nie tylko technologię, ale także osoby, które go używają, osoby, których to dotyczy, oraz środowisko wdrażania. Przeczytaj notatkę dotyczącą przejrzystości dla niestandardowej klasyfikacji tekstu, aby dowiedzieć się więcej na temat odpowiedzialnego używania i wdrażania sztucznej inteligencji w systemach.

Następne kroki