Klasyfikacja/segmentacja rozumienia treści

Usługa Content Understanding umożliwia klientom implementowanie klasyfikacji i dzielenia w ramach żądania operacji analizatora. Klasyfikację zawartości i wyodrębnianie zawartości można wykonać w ramach pojedynczego wywołania interfejsu API.

Globalna koncepcja analyzer obejmuje teraz zarówno pojęcie contentCategories jak i enableSegment do klasyfikacji i podziału danych wejściowych, które przetwarzasz w swojej aplikacji. Ta funkcja analizatora może wykonywać klasyfikację pliku wejściowego jako całości. Może również identyfikować wiele dokumentów lub wiele wystąpień pojedynczego dokumentu w pliku wejściowym.

Począwszy od wersji ogólnie dostępnej, klasyfikacja dokumentów i projektowanie segmentacji wideo są ujednolicone, co pozwala na spójne podejście do przetwarzania danych wejściowych niezależnie od jego modalności. W dokumentacji "klasyfikacja Content Understanding" odnosi się do operacji analizy, które są wymagane do klasyfikowania i dzielenia danych wejściowych (contentCategories i enableSegment).

Przypadki użycia biznesowego

Klasyfikacja usługi Content Understanding umożliwia przetwarzanie złożonych dokumentów i filmów wideo w różnych formatach i szablonach:

Faktury: kategoryzowanie faktur od wielu dostawców w celu przetworzenia każdej kategorii za pomocą innego analizatora usługi Content Understanding, jeśli jest to konieczne.
Dokumenty podatkowe: kategoryzuj wiele dokumentów podatkowych na różne rodzaje formularzy podatkowych, takich jak 1040 i 1099.
Umowy: kategoryzuj długie, nieustrukturyzowane kontrakty, aby usprawnić operacje w celu zrozumienia różnych typów umów i ich konkretnych skutków prawnych.
Wideo sportowe: Automatycznie podziel sceny, aby podzielić wideo na logiczne fragmenty, takie jak reklamy i rzeczywista zawartość sportowa.

Możliwości klasyfikacji/segmentacji

Analiza zawartości umożliwia analizowanie dokumentów z pojedynczym lub wieloma plikami w celu określenia, czy plik wejściowy można sklasyfikować w kategorii zgodnie z definicją. Obsługiwane są następujące scenariusze:

Scenariusze dokumentów:

Klasyfikuj tylko: klasyfikuje plik wejściowy jako całość. Na przykład pojedynczy plik zawierający jeden typ dokumentu, taki jak formularz wniosku o pożyczkę.
Klasyfikowanie i analizowanie: klasyfikuje i analizuje plik wejściowy, rozsyłając dane wejściowe do żądanego analizatora wyodrębniania.
Klasyfikuj i segmentuj: Klasyfikuje i segmentuje pojedynczy plik wejściowy, który może zawierać wiele typów lub instancji połączonych dokumentów. Na przykład pakiet wniosku o pożyczkę, który zawiera formularz wniosku o pożyczkę, pasek wynagrodzeń i wyciąg bankowy. Innym przykładem jest kolekcja zeskanowanych faktur w jednym pliku.
Klasyfikowanie, segmentowanie i analizowanie: po sklasyfikowaniu segmentów należy skierować każdy segment do żądanego analizatora wyodrębniania w celu dalszego wyodrębniania pól.
Klasyfikator hierarchiczny: Opcjonalna dodatkowa analiza w zależności od kategorii może również być analizą klasyfikatora.

Scenariusze wideo:

Tylko segmenty: Podziel wideo na segmenty na podstawie cech zawartości zdefiniowanych w description polu contentCategories. Na przykład podzielenie transmisji sportowej na segmenty gry, reklamy i komentarze.
Segmentowanie i analizowanie: Dzielenie wideo na segmenty i kierowanie poszczególnych segmentów do analizatora na potrzeby wyodrębniania pól.

Uwaga / Notatka

Minimalna jednostka klasyfikacji dokumentów to pojedyncza strona. Klasyfikacja wewnątrzstronicowa nie jest obsługiwana.

Tworzenie kategorii klasyfikacji

Klasyfikacja usługi Content Understanding nie wymaga zestawu danych szkoleniowych. W ramach operacji analizy można zdefiniować maksymalnie 200 nazw kategorii i opisów. Domyślnie cały plik jest traktowany jako pojedynczy obiekt zawartości, co oznacza, że plik zostanie skojarzony z jedną kategorią.

Od wersji GA musisz uwzględnić kategorię other w contentCategories, aby upewnić się, że zawartość może pozostać nieprzypisana do którejkolwiek z zdefiniowanych kategorii. other Jeśli kategoria nie jest dołączona, wszystkie pliki muszą zostać sklasyfikowane w jednej ze zdefiniowanych kategorii. Każda z nazw kategorii zdefiniowanych w obrębie contentCategories może również zawierać description aby podać więcej informacji o definiowanej kategorii.

Dzielenie pliku wejściowego

Jeśli w pliku znajduje się więcej niż jeden dokument, klasyfikator może zidentyfikować różne typy dokumentów, które znajdują się w pliku wejściowym z możliwością dzielenia. Odpowiedź klasyfikatora zawiera zakresy stron dla każdego z zidentyfikowanych typów dokumentów, które znajdują się w pliku. Ta odpowiedź może zawierać wiele wystąpień tego samego typu dokumentu.

Gdy uruchomisz operację analyze, zawiera ona teraz właściwość enableSegment, która zapewnia szczegółową kontrolę nad zachowaniem dzielenia. Można również określić numery stron, aby analizować tylko niektóre strony dokumentu wejściowego:

Aby traktować cały plik wejściowy jako wiele dokumentów połączonych razem dla klasyfikacji, ustaw wartość enableSegmenttrue. Gdy to zrobisz, usługa zwraca kategorie dla segmentów w pliku wejściowym automatycznie.
Aby traktować cały plik wejściowy jako pojedynczy dokument, ustaw wartość enableSegmentfalse.

Uwaga / Notatka

W przypadku filmów wideo obsługiwana jest tylko segmentacja. Musisz zdefiniować pojedynczy element contentCategories z enableSegment ustawionym na true. description Użyj pola, aby określić kryteria dzielenia wideo na segmenty.

Analiza opcjonalna

W przypadku kompletnego kompleksowego przepływu można połączyć kategorie klasyfikatora z istniejącymi analizatorami niestandardowymi i wstępnie utworzonymi analizatorami. Dla każdego obiektu zawartości sklasyfikowanych do kategorii z połączonymi analizatorami usługa automatycznie wywołuje analizę obiektu zawartości przy użyciu odpowiedniego analizatora.

Można na przykład użyć tego linku, aby utworzyć klasyfikatory identyfikujące i analizujące tylko faktury z pliku PDF zawierającego wiele typów formularzy w dokumencie. Ustaw analyzerId na jeden z naszych predefiniowanych analizatorów lub analizatorów niestandardowych, aby poprowadzić i wykonać ekstrakcję pól z klasyfikowanych dokumentów lub stron.

Można również pominąć ustawienie dowolnej analyzerId kategorii, ale nie wykonać żadnej analizy zawartości dla podzielonego na kategorie pliku lub segmentu.

Na górnej warstwie można również ustawić omitContent na wartość true, aby oryginalny obiekt zawartości był pomijany, a zamiast tego zwrócono tylko obiekty zawartości z innych analiz przeprowadzanych na sklasyfikowanym segmencie lub plikach.

Klasyfikator hierarchiczny

Nowo zaprojektowana operacja analizatora umożliwia hierarchiczne dzielenie i klasyfikację. Na przykład w ramach operacji podstawowego analizatora można ustawić analyzerID dla kategorii zawartości zdefiniowanych za pomocą analizatora niestandardowego, który wykonuje dodatkową klasyfikację lub dzielenie, w zależności od potrzeb. Definiowanie hierarchicznych analizatorów umożliwia realizację scenariuszy takich jak kategoryzowanie różnych rodzajów dokumentów, takich jak faktury, umowy i paragony. Identyfikator analyzerID dla każdej z tych kategorii może również odnosić się do operacji analizy z dodatkową klasyfikacją, pozwalając na podział na różne typy plików w ramach faktur, umów i paragonów.

Dane wejściowe dokumentu obsługują pięć poziomów zagnieżdżania, a dane wejściowe wideo obsługują dwa.

Limity klasyfikatora

Aby uzyskać informacje na temat obsługiwanych formatów dokumentów wejściowych i limitów klasyfikatora, zobacz Limity przydziału i limity usługi.

Najlepsze rozwiązania

Aby poprawić klasyfikację i podzielić jakość, użyj dobrej nazwy i opisu kategorii, aby model mógł zrozumieć kategorie z pewnym kontekstem. Aby uzyskać więcej informacji na temat nazw kategorii i opisów, zobacz Najlepsze rozwiązania.

Najważniejsze korzyści

Dokładność i niezawodność: Zapewnij dokładną klasyfikację dokumentów, aby zmniejszyć błędy i zwiększyć wydajność.
Skalowalność: skalowanie przetwarzania dokumentów w poziomie w celu spełnienia wymagań biznesowych.
Dostosowywalny: dostosuj klasyfikator dokumentów, aby dopasować określone przepływy pracy.

Obsługiwane języki i regiony

Aby uzyskać listę obsługiwanych języków i regionów, zobacz Obsługa języków i regionów.

Prywatność i zabezpieczenia danych

Deweloperzy korzystający z usługi Content Understanding powinni przejrzeć zasady firmy Microsoft dotyczące danych klientów. Aby uzyskać więcej informacji, zobacz Dane, ochrona i prywatność.

Spróbuj przetwarzać zawartość dokumentu w programie Content Understanding Studio
Dowiedz się, jak przetwarzać zawartość dokumentu przy użyciu szablonów analizatora.

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-12-19