Rozpoczynanie pracy z usługą Azure Document Intelligence
Aby rozpocząć projekt z usługami Azure Document Intelligence, potrzebny jest zasób platformy Azure i wybór plików formularzy do wyodrębniania danych.
Subskrybowanie zasobu
Dostęp do usług Azure Document Intelligence Services można uzyskać za pośrednictwem:
- Zasób narzędzi Foundry: klucz subskrypcji używany w wielu narzędziach Foundry
LUB
- Zasób analizy dokumentów platformy Azure: klucz subskrypcji pojedynczej usługi (używany tylko z określoną usługą Azure AI Service)
Uwaga / Notatka
Utwórz zasób narzędzi Foundry, jeśli planujesz uzyskać dostęp do wielu narzędzi Foundry w ramach jednego punktu końcowego/klucza. W przypadku dostępu tylko do analizy dokumentów platformy Azure utwórz zasób usługi Azure Document Intelligence. Należy pamiętać, że jeśli zamierzasz używać uwierzytelniania Microsoft Entra, potrzebujesz pojedynczego zasobu usługowego.
Możesz subskrybować usługę w witrynie Azure Portal lub za pomocą interfejsu wiersza polecenia platformy Azure. Więcej informacji na temat poleceń interfejsu wiersza polecenia można znaleźć tutaj.
Informacje o wymaganiach wejściowych dotyczących plików analizy dokumentów platformy Azure
Usługa Azure Document Intelligence działa na dokumentach wejściowych, które spełniają następujące wymagania:
- Format musi mieć format JPG, PNG, BMP, PDF (tekst lub skanowanie) lub TIFF.
- Rozmiar pliku musi być mniejszy niż 500 MB dla warstwy płatnej (S0) i 4 MB za bezpłatną (F0).
- Obrazy muszą mieć wymiary od 50 x 50 pikseli do 10 000 x 10 000 pikseli.
- Całkowity rozmiar zestawu danych treningowych musi wynosić 500 stron lub mniej.
Więcej wymagań dotyczących danych wejściowych można znaleźć w dokumentacji dla określonych modeli.
Wybierz, który składnik Azure Document Intelligence użyć
Po zebraniu plików zdecyduj, co należy osiągnąć.
| Przypadek użycia | Zalecane funkcje do użycia |
|---|---|
| Używanie funkcji OCR do przechwytywania analizy dokumentów | Użyj modelu układu, modelu odczytu lub ogólnego modelu dokumentów. |
| Stwórz aplikację, która wyodrębnia dane z formularzy W-2, faktur, paragonów, dokumentów tożsamości, ubezpieczenia zdrowotnego, szczepień i wizytówek | Użyj wstępnie utworzonego modelu. Te modele nie muszą być wytrenowane. Usługi Azure Document Intelligence analizują dokumenty i zwracają dane wyjściowe JSON. |
| Tworzenie aplikacji w celu wyodrębniania danych z formularzy specyficznych dla branży | Tworzenie modelu niestandardowego. Ten model należy wytrenować na przykładowych dokumentach. Po wytrenowanym modelu niestandardowym można analizować nowe dokumenty i zwracać dane wyjściowe JSON. |