Co to jest usługa Azure Document Intelligence?

Ukończone

Usługa Azure Document Intelligence jest jedną z wielu usług Foundry Tools, opartych na chmurze usług sztucznej inteligencji (AI) z interfejsami API REST i zestawami SDK bibliotek klienta, które mogą służyć do tworzenia analizy w aplikacjach.

Usługa Azure Document Intelligence korzysta z funkcji optycznego rozpoznawania znaków (OCR) i modeli uczenia głębokiego do wyodrębniania par tekstu, par klucz-wartość, znaczników wyboru i tabel z dokumentów.

zrzut ekranu przedstawiający sposób działania OCR.

Funkcja OCR przechwytuje strukturę dokumentów, tworząc pola ograniczenia wokół wykrytych obiektów na obrazie. Lokalizacje pól ograniczenia są rejestrowane jako współrzędne w odniesieniu do pozostałej części strony. Usługi Azure Document Intelligence zwracają dane pola ograniczenia i inne informacje w postaci ustrukturyzowanej z relacjami z oryginalnego pliku.

Zrzut ekranu przedstawiający przykład danych wyjściowych JSON.

Aby utworzyć od podstaw model wysokiej dokładności, ludzie muszą tworzyć modele uczenia głębokiego, używać dużej ilości zasobów obliczeniowych i mierzyć się z długimi godzinami trenowania modelu. Czynniki te mogą sprawić, że projekt będzie niewykonalny. Usługa Azure Document Intelligence udostępnia podstawowe modele, które zostały wytrenowane na tysiące przykładów formularzy. Podstawowe modele umożliwiają wyodrębnianie danych o wysokiej dokładności z formularzy bez trenowania modelu.

Składniki usługi Azure Document Intelligence

Usługa Azure Document Intelligence składa się z następujących usług:

  • modele analizy dokumentów: które przyjmują dane wejściowe plików JPEG, PNG, PDF i TIFF oraz zwracają plik JSON z lokalizacją tekstu w polach ograniczenia, zawartości tekstowej, tabelach, znacznikach zaznaczenia (nazywanych również polami wyboru lub przyciskami radiowymi) i strukturą dokumentu.

  • Wstępnie utworzone modele: które wykrywają i wyodrębniają informacje z obrazów dokumentów i zwracają wyodrębnione dane w danych wyjściowych ze strukturą JSON. Usługa Azure Document Intelligence obecnie obsługuje wstępnie utworzone modele dla kilku formularzy, w tym:

    • Formularze W-2
    • Faktury
    • Wpływy
    • Dokumenty identyfikatorów
    • Wizytówki
  • Modele niestandardowe: modele niestandardowe wyodrębniają dane z formularzy specyficznych dla Twojej firmy. Modele niestandardowe można wytrenować za pomocą programu Azure Document Intelligence Studio.

Uwaga

Niektóre funkcje analizy dokumentów platformy Azure są w wersji zapoznawczej od czasu utworzenia tej zawartości, a w związku z tym funkcje i szczegóły użycia mogą ulec zmianie. Aby uzyskać up-to-date, należy zapoznać się z oficjalną stroną.

Usługi programu Access

Dostęp do usług Azure Document Intelligence można uzyskać na kilka sposobów. Te opcje obejmują użycie następujących opcji:

  • Interfejs API REST
  • Zestawy SDK biblioteki klienta
  • Azure Document Intelligence Studio
  • Microsoft Foundry

Wskazówka

W tym ćwiczeniu modułu skupiono się na zestawach SDK języka Python i platformy .NET. Podstawowe usługi REST mogą być używane przez dowolny język.

Zapoznaj się z dokumentacją , aby zapoznać się z przewodnikami Szybki start dotyczącymi wszystkich dostępnych zestawów SDK i interfejsu API REST.