Rozpoczynanie pracy z usługą Azure Document Intelligence

Ukończone

Aby rozpocząć projekt z usługami Azure Document Intelligence, potrzebny jest zasób platformy Azure i wybór plików formularzy do wyodrębniania danych.

Subskrybowanie zasobu

Dostęp do usług Azure Document Intelligence Services można uzyskać za pośrednictwem:

  • Zasób narzędzi Foundry: klucz subskrypcji używany w wielu narzędziach Foundry

LUB

  • Zasób analizy dokumentów platformy Azure: klucz subskrypcji pojedynczej usługi (używany tylko z określoną usługą Azure AI Service)

Uwaga / Notatka

Utwórz zasób narzędzi Foundry, jeśli planujesz uzyskać dostęp do wielu narzędzi Foundry w ramach jednego punktu końcowego/klucza. W przypadku dostępu tylko do analizy dokumentów platformy Azure utwórz zasób usługi Azure Document Intelligence. Należy pamiętać, że jeśli zamierzasz używać uwierzytelniania Microsoft Entra, potrzebujesz pojedynczego zasobu usługowego.

Możesz subskrybować usługę w witrynie Azure Portal lub za pomocą interfejsu wiersza polecenia platformy Azure. Więcej informacji na temat poleceń interfejsu wiersza polecenia można znaleźć tutaj.

Informacje o wymaganiach wejściowych dotyczących plików analizy dokumentów platformy Azure

Usługa Azure Document Intelligence działa na dokumentach wejściowych, które spełniają następujące wymagania:

  • Format musi mieć format JPG, PNG, BMP, PDF (tekst lub skanowanie) lub TIFF.
  • Rozmiar pliku musi być mniejszy niż 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).
  • Obrazy muszą mieć wymiary od 50 x 50 pikseli do 10 000 x 10 000 pikseli.
  • Całkowity rozmiar zestawu danych treningowych musi wynosić 500 stron lub mniej.

Więcej wymagań dotyczących danych wejściowych można znaleźć w dokumentacji dla określonych modeli.

Wybierz, który składnik Azure Document Intelligence użyć

Po zebraniu plików zdecyduj, co należy osiągnąć.

Przypadek użycia Zalecane funkcje do użycia
Używanie funkcji OCR do przechwytywania analizy dokumentów Użyj modelu układu, modelu odczytu lub ogólnego modelu dokumentów.
Stwórz aplikację, która wyodrębnia dane z formularzy W-2, faktur, paragonów, dokumentów tożsamości, ubezpieczenia zdrowotnego, szczepień i wizytówek Użyj wstępnie utworzonego modelu. Te modele nie muszą być wytrenowane. Usługi Azure Document Intelligence analizują dokumenty i zwracają dane wyjściowe JSON.
Tworzenie aplikacji w celu wyodrębniania danych z formularzy specyficznych dla branży Tworzenie modelu niestandardowego. Ten model należy wytrenować na przykładowych dokumentach. Po wytrenowanym modelu niestandardowym można analizować nowe dokumenty i zwracać dane wyjściowe JSON.