Udostępnij przez


Wymagania i ograniczenia dotyczące wstępnie utworzonego przetwarzania dokumentów

W poniższych sekcjach opisano kluczowe czynniki, które należy wziąć pod uwagę podczas planowania użycia wstępnie utworzonego modelu przetwarzania dokumentów.

Ta usługa jest dostępna tylko dla witryn programu SharePoint — w tym lokacji centrum, witryn skojarzonych z lokacją centrum i lokacji głównej zbioru witryn. Podwitryny nie są obsługiwane.

Przetwarzanie kontraktu

Ikonę Opis
Symbol plików. Obsługiwane typy plików
Ten model obsługuje następujące typy plików: .bmp, .jpeg, .pdf, .png i .tiff.
Symbol konwersacji. Obsługiwane języki
Ten model obsługuje tylko kontrakty w języku angielskim.
Symbol akapitu. Zagadnienia dotyczące OCR
Ten model wykorzystuje technologię optycznego rozpoznawania znaków (OCR) do skanowania .pdf plików, plików obrazów i plików .tiff. Przetwarzanie OCR działa najlepiej w dokumentach spełniających następujące wymagania:
- Format pliku .jpg, .png lub .pdf (tekst lub skanowane). Pliki .pdf osadzone w tekście są lepsze, ponieważ nie będzie żadnych błędów w wyodrębnianiu znaków i lokalizacji.
— W przypadku plików .pdf i .tiff można przetworzyć maksymalnie 2000 stron.
— Rozmiar pliku musi być mniejszy niż 50 MB.
- W przypadku obrazów wymiary muszą mieć od 50 x 50 do 10 000 x 10 000 pikseli.
- W przypadku plików .pdf wymiary muszą mieć maksymalnie 11 x 17 cali, co odpowiada rozmiarom papieru legalnego lub A3 i mniejszemu rozmiarowi.
— Łączny rozmiar danych szkoleniowych wynosi 500 stron lub mniej.
Symbol kuli ziemskiej. Środowiska z wieloma lokalizacjami geograficznymi
Podczas konfigurowania usługi w środowisku z wieloma lokalizacjami geograficznymi platformy Microsoft 365 można skonfigurować ją tylko do używania typu modelu w centralnej lokalizacji. Jeśli chcesz użyć tego typu modelu w lokalizacji satelitarnej, skontaktuj się z pomocą techniczną firmy Microsoft.
Symbol obiektów. Biblioteki z wieloma modelami
Jeśli co najmniej dwa wytrenowane modele są stosowane do tej samej biblioteki, plik jest klasyfikowany przy użyciu modelu, który ma najwyższy średni wynik ufności. Wyodrębnione jednostki pochodzą tylko z zastosowanego modelu.

Przetwarzanie faktur

Ikonę Opis
Symbol plików. Obsługiwane typy plików
Ten model obsługuje następujące typy plików: .bmp, .jpeg, .pdf, .png i .tiff.
Symbol konwersacji. Obsługiwane języki
Ten model obsługuje faktury w języku angielskim, hiszpańskim, niemieckim, francuskim, włoskim, portugalskim i holenderskim.
Symbol akapitu. Zagadnienia dotyczące OCR
Ten model wykorzystuje technologię optycznego rozpoznawania znaków (OCR) do skanowania .pdf plików, plików obrazów i plików .tiff. Przetwarzanie OCR działa najlepiej w dokumentach spełniających następujące wymagania:
- Format pliku .jpg, .png lub .pdf (tekst lub skanowane). Pliki .pdf osadzone w tekście są lepsze, ponieważ nie będzie żadnych błędów w wyodrębnianiu znaków i lokalizacji.
— W przypadku plików .pdf i .tiff można przetworzyć maksymalnie 2000 stron.
— Rozmiar pliku musi być mniejszy niż 50 MB.
- W przypadku obrazów wymiary muszą mieć od 50 x 50 do 10 000 x 10 000 pikseli.
- W przypadku plików .pdf wymiary muszą mieć maksymalnie 11 x 17 cali, co odpowiada rozmiarom papieru legalnego lub A3 i mniejszemu rozmiarowi.
— Łączny rozmiar danych szkoleniowych wynosi 500 stron lub mniej.
Symbol kuli ziemskiej. Środowiska z wieloma lokalizacjami geograficznymi
Podczas konfigurowania usługi w środowisku z wieloma lokalizacjami geograficznymi platformy Microsoft 365 można skonfigurować ją tylko do używania typu modelu w centralnej lokalizacji. Jeśli chcesz użyć tego typu modelu w lokalizacji satelitarnej, skontaktuj się z pomocą techniczną firmy Microsoft.
Symbol obiektów. Biblioteki z wieloma modelami
Jeśli co najmniej dwa wytrenowane modele są stosowane do tej samej biblioteki, plik jest klasyfikowany przy użyciu modelu, który ma najwyższy średni wynik ufności. Wyodrębnione jednostki pochodzą tylko z zastosowanego modelu.

Przetwarzanie paragonu

Ikonę Opis
Symbol plików. Obsługiwane typy plików
Ten model obsługuje następujące typy plików: .bmp, .jpeg, .pdf, .png i .tiff.
Symbol konwersacji. Obsługiwane języki
Ten model obsługuje wpływy w języku angielskim, chorwackim, czeskim, duńskim, holenderskim, fińskim, niemieckim, węgierskim, włoskim, japońskim, łotewskim, litewskim, norweskim, portugalskim, hiszpańskim, szwedzkim i wietnamskim.
Symbol akapitu. Zagadnienia dotyczące OCR
Ten model wykorzystuje technologię optycznego rozpoznawania znaków (OCR) do skanowania .pdf plików, plików obrazów i plików .tiff. Przetwarzanie OCR działa najlepiej w dokumentach spełniających następujące wymagania:
- Format pliku .jpg, .png lub .pdf (tekst lub skanowane). Pliki .pdf osadzone w tekście są lepsze, ponieważ nie będzie żadnych błędów w wyodrębnianiu znaków i lokalizacji.
— W przypadku plików .pdf i .tiff można przetworzyć maksymalnie 2000 stron.
— Rozmiar pliku musi być mniejszy niż 50 MB.
- W przypadku obrazów wymiary muszą mieć od 50 x 50 do 10 000 x 10 000 pikseli.
- W przypadku plików .pdf wymiary muszą mieć maksymalnie 11 x 17 cali, co odpowiada rozmiarom papieru legalnego lub A3 i mniejszemu rozmiarowi.
— Łączny rozmiar danych szkoleniowych wynosi 500 stron lub mniej.
Symbol kuli ziemskiej. Środowiska z wieloma lokalizacjami geograficznymi
Podczas konfigurowania usługi w środowisku z wieloma lokalizacjami geograficznymi platformy Microsoft 365 można skonfigurować ją tylko do używania typu modelu w centralnej lokalizacji. Jeśli chcesz użyć tego typu modelu w lokalizacji satelitarnej, skontaktuj się z pomocą techniczną firmy Microsoft.
Symbol obiektów. Biblioteki z wieloma modelami
Jeśli co najmniej dwa wytrenowane modele są stosowane do tej samej biblioteki, plik jest klasyfikowany przy użyciu modelu, który ma najwyższy średni wynik ufności. Wyodrębnione jednostki pochodzą tylko z zastosowanego modelu.

Przetwarzanie informacji poufnych

Ikonę Opis
Symbol plików. Obsługiwane typy plików
Ten model obsługuje następujące typy plików: .csv, .doc, .docx, .eml, .heic, .heif, .htm, .html, .jpeg, .jpg, .md, .msg, .pdf, .png, .ppt, .pptx, .rtf, .tif, .tiff, .txt, .xls i .xlsx.
Symbol konwersacji. Obsługiwane języki
Ten model obsługuje następujące języki: zobacz obsługiwane języki.
Ten model obsługuje również języki zarówno tekstu odręcznego , jak i tekstu drukowanego.
Symbol akapitu. Zagadnienia dotyczące OCR
Ten model wykorzystuje technologię optycznego rozpoznawania znaków (OCR) do skanowania .pdf plików, plików obrazów i plików .tiff. Przetwarzanie OCR działa najlepiej w dokumentach spełniających następujące wymagania:
- Format pliku .jpg, .png lub .pdf (tekst lub skanowane). Pliki .pdf osadzone w tekście są lepsze, ponieważ nie będzie żadnych błędów w wyodrębnianiu znaków i lokalizacji.
— W przypadku plików .pdf i .tiff można przetworzyć maksymalnie 2000 stron.
— Rozmiar pliku musi być mniejszy niż 50 MB.
- W przypadku obrazów wymiary muszą mieć od 50 x 50 do 10 000 x 10 000 pikseli.
- W przypadku plików .pdf wymiary muszą mieć maksymalnie 11 x 17 cali, co odpowiada rozmiarom papieru legalnego lub A3 i mniejszemu rozmiarowi.
— Łączny rozmiar danych szkoleniowych wynosi 500 stron lub mniej.
Obsługuje języki zarówno tekstu odręcznego , jak i tekstu drukowanego.
Symbol kuli ziemskiej. Środowiska z wieloma lokalizacjami geograficznymi
Podczas konfigurowania usługi w środowisku z wieloma lokalizacjami geograficznymi platformy Microsoft 365 można skonfigurować ją tylko do używania typu modelu w centralnej lokalizacji. Jeśli chcesz użyć tego typu modelu w lokalizacji satelitarnej, skontaktuj się z pomocą techniczną firmy Microsoft.
Symbol obiektów. Biblioteki z wieloma modelami
Jeśli co najmniej dwa wytrenowane modele są stosowane do tej samej biblioteki, plik jest klasyfikowany przy użyciu modelu, który ma najwyższy średni wynik ufności. Wyodrębnione jednostki pochodzą tylko z zastosowanego modelu.

Proste przetwarzanie dokumentów

Ikonę Opis
Symbol plików. Obsługiwane typy plików
Ten model obsługuje następujące typy plików: .bmp, .jpeg, .pdf, .png i .tiff.
Symbol konwersacji. Obsługiwane języki
Ten model obsługuje dokumenty w ponad 100 językach.
Symbol akapitu. Zagadnienia dotyczące OCR
Ten model wykorzystuje technologię optycznego rozpoznawania znaków (OCR) do skanowania .pdf plików, plików obrazów i plików .tiff. Przetwarzanie OCR działa najlepiej w dokumentach spełniających następujące wymagania:
- Format pliku .jpg, .png lub .pdf (tekst lub skanowane). Pliki .pdf osadzone w tekście są lepsze, ponieważ nie będzie żadnych błędów w wyodrębnianiu znaków i lokalizacji.
— W przypadku plików .pdf i .tiff można przetworzyć maksymalnie 2000 stron.
— Rozmiar pliku musi być mniejszy niż 50 MB.
- W przypadku obrazów wymiary muszą mieć od 50 x 50 do 10 000 x 10 000 pikseli.
- W przypadku plików .pdf wymiary muszą mieć maksymalnie 11 x 17 cali, co odpowiada rozmiarom papieru legalnego lub A3 i mniejszemu rozmiarowi.
— Łączny rozmiar danych szkoleniowych wynosi 500 stron lub mniej.
Symbol kuli ziemskiej. Środowiska z wieloma lokalizacjami geograficznymi
Podczas konfigurowania usługi w środowisku z wieloma lokalizacjami geograficznymi platformy Microsoft 365 można skonfigurować ją tylko do używania typu modelu w centralnej lokalizacji. Jeśli chcesz użyć tego typu modelu w lokalizacji satelitarnej, skontaktuj się z pomocą techniczną firmy Microsoft.
Symbol obiektów. Biblioteki z wieloma modelami
Jeśli co najmniej dwa wytrenowane modele są stosowane do tej samej biblioteki, plik jest klasyfikowany przy użyciu modelu, który ma najwyższy średni wynik ufności. Wyodrębnione jednostki pochodzą tylko z zastosowanego modelu.