Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ważne
Ta funkcja jest dostępna w wersji zapoznawczej. Publiczne wersje zapoznawcze zapewniają wczesny dostęp do funkcji, które są w aktywnym rozwoju. Funkcje, podejścia i procesy mogą ulec zmianie lub mieć ograniczone możliwości przed ogólną dostępnością. Aby uzyskać więcej informacji, zobacz Warunki dodatkowe korzystania z testowych wersji Microsoft Azure.
Usługa Content Understanding oferuje zaawansowane możliwości analizy dokumentów. Organizacje mogą używać tych funkcji do konwertowania zawartości bez struktury na dane umożliwiające podejmowanie działań i organizowanie. Analiza zawartości umożliwia korzystanie z analizatorów dostosowywalnych do wyodrębniania niezbędnych informacji, pól i relacji z różnorodnych dokumentów i formularzy.
Przypadki użycia biznesowego
Analizatory dokumentów mogą przetwarzać złożone dokumenty w różnych formatach i szablonach:
- Zarządzanie cyklem życia kontraktu: Wyodrębnij pola kluczy, klauzule i zobowiązania z różnych typów kontraktów.
- Pożyczki i wnioski hipoteczne: Automatyzowanie przetwarzania w celu umożliwienia szybszej obsługi przez banki, kredytodawców i podmioty rządowe.
- Usługi finansowe: Analizowanie złożonych dokumentów, takich jak raporty finansowe i raporty zarządzania zasobami.
- Zarządzanie wydatkami: Przeanalizuj paragony i faktury od różnych sprzedawców detalicznych, aby zweryfikować wydatki w różnych formatach i szablonach.
- Zestawy dokumentów i scenariusze bazy wiedzy: Wyodrębnij pola kluczy z zestawów dokumentów jako całości. Dodaj dane referencyjne, które obsługują zadania, takie jak walidacja i wzbogacanie, stosując wieloetapowe rozumowanie.
Najważniejsze korzyści
Usługa Content Understanding zapewnia zaawansowane funkcje analizy dokumentów, które są przeznaczone do rozwiązywania krytycznych scenariuszy korporacyjnych i biznesowych, takich jak RAG i automatyzacja procesów robotycznych. Najważniejsze korzyści to:
- Włączanie inteligentnego wyszukiwania: Przekształcanie dokumentów bez struktury w ustrukturyzowane, przeszukiwalne zasoby danych w celu zwiększenia możliwości odnajdywania informacji i ułatwień dostępu w całej organizacji.
- Gruntowne wyodrębnianie danych: Zachowaj wyraźną śledzność i lokalizację wyodrębnionych danych, aby ułatwić efektywne procesy przeglądu przez człowieka oraz zapewnić przejrzystość i zgodność.
- Automatyzacja sterowana ufnością: Użyj wbudowanego oceniania zaufania, aby inteligentnie zautomatyzować zadania przetwarzania dokumentów, aby ułatwić optymalizację alokacji zasobów, zmniejszenie kosztów operacyjnych i zwiększenie dokładności podejmowania decyzji.
- Elastyczne dostosowywanie: Łatwe dostosowywanie i dostosowywanie analizatorów dokumentów w celu dostosowania ich do określonych procesów biznesowych i przepływów pracy. Dostosowywanie umożliwia precyzyjne wyodrębnianie i klasyfikację dostosowaną do określonych wymagań organizacji.
- Zwiększona dokładność i niezawodność: Osiągnij precyzyjne wyodrębnianie i klasyfikację krytycznych danych biznesowych, aby zmniejszyć błędy i zwiększyć wydajność operacyjną w zautomatyzowanych przepływach pracy.
-
Agenci są gotowi: Przetwarzanie różnorodnych danych wejściowych i dostarczanie danych wyjściowych w standardowym formacie gotowym do przepływu pracy agenta. Dane wyjściowe mogą dać Twojej aplikacji zrozumienie intencji użytkownika na podstawie danych obsługiwanych przez
strongly-typedschemat, który ułatwia łatwe pozyskiwanie danych w formacie gotowym do użycia przez twój kod.
Możliwości analizatora dokumentów
Wyodrębnianie zawartości
Wyodrębnianie zawartości stanowi podstawę możliwości analizy dokumentów usługi Content Understanding. Ten proces przekształca dokumenty bez struktury w ustrukturyzowane, czytelne dla maszyny dane. Wyodrębnianie zawartości precyzyjnie wykrywa tekst drukowany i odręczny, zachowując strukturę dokumentu za pomocą zaawansowanej analizy struktury.
- Analiza zawartości
- Tekst: Przetwarza wielojęzyczną zawartość, w tym tekst drukowany maszynowo i odręczny z setek języków.
- Znaczniki wyboru: identyfikuje i wyodrębnia wskaźniki wyboru, takie jak pola wyboru, przyciski i podobne znaczniki.
- Wykrywanie kodów kreskowych: skanuje i dekoduje informacje z kilkunastu typów liniowych i dwuwymiarowych kodów kreskowych.
- Formuły matematyczne: przechwytuje i zachowuje złożone wyrażenia matematyczne w formacie LaTeX.
- Elementy obrazu: lokalizuje i wyodrębnia obrazy, rysunki, diagramy i wykresy wraz z powiązanymi podpisami i adnotacjami.
- Elementy hiperłącza: wykrywa hiperłącza osadzone w dokumencie.
- Elementy adnotacji: łączą zawartość z jej adnotacjami, takimi jak przekreślenie, podkreślenie, wyróżnienie.
- Elementy wykresu: Wykrywa i wyodrębnia elementy wykresu do uporządkowanych danych wyjściowych.
- Analiza struktury
- Akapity: wykrywa i kategoryzuje segmenty tekstu na podstawie kontekstu i roli dokumentu.
- Dane tabelaryczne: rozpoznaje i wyodrębnia struktury tabel, w tym złożone formaty obejmujące komórki i układy wielostronicowe.
- Sekcje hierarchiczne: mapuje organizację zawartości za pomocą nagłówków sekcji i zagnieżdżonych relacji zawartości.
- Generowanie wspomagane pobieraniem (RAG)
- Rozwiązania RAG: wyodrębnianie zawartości stanowi podstawę efektywnych systemów RAG poprzez przekształcenie nieprzetworzonych danych wielomodalnych na ustrukturyzowane formaty z możliwością wyszukiwania zoptymalizowane pod kątem pobierania. Aby dowiedzieć się więcej na temat tworzenia rozwiązań RAG, zobacz Retrieval-augmented generation.
Wyodrębnianie pól
Wyodrębnianie pól umożliwia wyodrębnianie, klasyfikowanie i generowanie danych strukturalnych z różnych dokumentów i formularzy dostosowanych do wymagań. Proces przekształcania zawartości nieustrukturyzowanej na zorganizowane, umożliwiające podejmowanie działań informacje upraszcza zarządzanie danymi, zwiększa możliwości wyszukiwania i obsługuje zautomatyzowane przepływy pracy.
Na przykład możesz bezproblemowo wyodrębnić szczegóły klienta, adresy rozliczeniowe i wyszczególnione opłaty z faktur. Można również zidentyfikować strony umowne, daty odnowienia i warunki płatności w umowach prawnych. Aby zmaksymalizować wydajność, można użyć wstępnie utworzonych szablonów analizatorów, takich jak szablony dostosowane do faktur. Analizatory bespoke można również zaprojektować od podstaw, aby zwiększyć precyzję dzięki etykietowaniu większej liczby przykładowych dokumentów.
Interfejs API zaufania i stabilizacji jest opcjonalną funkcją. Aby skonfigurować zestawienie pewności i podstawy dla wyodrębniania pól, ustaw estimateFieldSourceAndConfidence = true w konfiguracji analizatora lub estimateSourceAndConfidence = true dla konkretnego pola.
Metody wyodrębniania pól
Omówienie zawartości udostępnia uniwersalne metody wyodrębniania pól, które umożliwiają precyzyjne i dostosowane przetwarzanie zawartości dokumentu:
- Wyodrębnianie: wyodrębnianie określonych danych, takich jak daty transakcji z paragonów lub elementów wierszy z faktur, w celu uzyskania dokładnego i ukierunkowanego przechwytywania informacji.
- Klasyfikuj: kategoryzuj zawartość dokumentu na wstępnie zdefiniowane kategorie, takie jak klasyfikowanie tonacji w transkrypcjach połączeń klienta lub klasyfikowanie elementów paragonów hotelowych.
- Generowanie: tworzenie nowych szczegółowych informacji lub podsumowań z dokumentów, w tym podsumowań dokumentów i przeglądów rozdziałów w celu zwiększenia ułatwień dostępu do zawartości i zrozumienia.
Wymagania dotyczące danych wejściowych
Aby uzyskać więcej informacji na temat obsługiwanych formatów dokumentów wejściowych, zobacz Limity przydziału i limity usługi.
Obsługiwane języki i regiony
Aby uzyskać listę obsługiwanych języków i regionów, zobacz Obsługa języków i regionów.
Dane, prywatność i zabezpieczenia
Deweloperzy korzystający z usługi Content Understanding powinni przejrzeć zasady firmy Microsoft dotyczące danych klientów. Aby uzyskać więcej informacji, zobacz Dane, prywatność i zabezpieczenia.
Treści powiązane
- Spróbuj przetwarzać zawartość dokumentu przy użyciu programu Content Understanding Studio.
- Zapoznaj się z przewodnikiem Szybki start dotyczący usługi Content Understanding Studio.
- Dowiedz się, jak analizować zawartość dokumentu przy użyciu szablonów analizatora.
- Przejrzyj przykłady kodu z wyszukiwaniem dokumentów wizualnych.