Nuta
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować się zalogować lub zmienić katalog.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ważne
- Publiczne wersje zapoznawcze narzędzi Azure Language in Foundry Tools zapewniają wczesny dostęp do funkcji, które są aktywnie opracowywane.
- Funkcje, podejścia i procesy mogą ulec zmianie przed ogólną dostępnością na podstawie opinii użytkowników.
Język to oparta na chmurze usługa, która stosuje funkcje przetwarzania języka naturalnego (NLP) do danych opartych na tekście. Funkcja obsługi dokumentów natywnych umożliwia asynchroniczne wysyłanie żądań interfejsu API przy użyciu treści żądania HTTP POST w celu wysyłania danych i ciągu zapytania żądania HTTP GET w celu pobrania wyników stanu. Przetworzone dokumenty znajdują się w kontenerze docelowym usługi Azure Blob Storage.
Dokument natywny odnosi się do formatu pliku używanego do tworzenia oryginalnego dokumentu, takiego jak Microsoft Word (docx) lub przenośny plik dokumentu (pdf). Obsługa dokumentów natywnych eliminuje konieczność wstępnego przetwarzania tekstu przed użyciem funkcji zasobów języka. Obecnie obsługa dokumentów natywnych jest dostępna dla następujących funkcji:
Dane osobowe (PII) Funkcja wykrywania danych osobowych może identyfikować, kategoryzować i redagować poufne informacje w tekście bez struktury. Interfejs
PiiEntityRecognitionAPI obsługuje natywne przetwarzanie dokumentów.Podsumowanie dokumentu. Podsumowanie dokumentów używa przetwarzania języka naturalnego do generowania streszczeń ekstraktywnego (ekstrakcja istotnych zdań) lub abstrakcyjnego (ekstrakcja kontekstowych słów) z dokumentów. Zarówno
AbstractiveSummarizationAPI, jak iExtractiveSummarizationAPI obsługują natywne przetwarzanie dokumentów.
Obsługiwane formaty dokumentów
Aplikacje używają natywnych formatów plików do tworzenia, zapisywania lub otwierania dokumentów natywnych. Obecnie funkcje PII oraz podsumowania dokumentów obsługują następujące natywne formaty dokumentów:
| Typ pliku | Rozszerzenie pliku | Description |
|---|---|---|
| Tekst | .txt |
Niesformatowany dokument tekstowy. |
| Adobe PDF | .pdf |
Przenośny plik dokumentu sformatowany. |
| Microsoft Word | .docx |
Plik dokumentu programu Microsoft Word. |
Wskazówki dotyczące danych wejściowych
Obsługiwane formaty plików
| Typ | wsparcie i ograniczenia |
|---|---|
| Pliki PDF | W pełni zeskanowane pliki PDF nie są obsługiwane. |
| Tekst na obrazach | Obrazy cyfrowe z osadzonym tekstem nie są obsługiwane. |
| Tabele cyfrowe | Tabele w zeskanowanych dokumentach nie są obsługiwane. |
Rozmiar dokumentu
| Attribute | Limit danych wejściowych |
|---|---|
| Łączna liczba dokumentów na żądanie | ≤ 20 |
| Łączny rozmiar zawartości na żądanie | ≤ 10 MB |
Nagłówki i parametry żądania
| parametr | Description |
|---|---|
-X POST <endpoint> |
Określa punkt końcowy zasobu języka na potrzeby uzyskiwania dostępu do interfejsu API. |
--header Content-Type: application/json |
Typ zawartości do wysyłania danych JSON. |
--header "Ocp-Apim-Subscription-Key:<key> |
Określa klucz zasobu języka platformy Azure na potrzeby uzyskiwania dostępu do interfejsu API. |
-data |
Plik JSON zawierający dane, które chcesz przekazać z żądaniem. |