Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Ce contenu s’applique à la version :
v3.1 (GA) | Dernière version :
v4.0 (GA) | Versions précédentes :
v3.0
v2.1
Ce contenu s’applique à :
v2.1 | Dernière version :
v4.0 (GA)
Azure Document Intelligence dans Foundry Tools prend en charge différents modèles que vous pouvez utiliser pour ajouter un traitement intelligent des documents à vos applications et flux. Vous pouvez utiliser un modèle spécifique au domaine prédéfini ou entraîner un modèle personnalisé adapté à vos besoins métier et cas d’usage spécifiques. Vous pouvez utiliser Document Intelligence avec l’API REST ou Python, C#, Java et les bibliothèques clientes JavaScript.
Remarque
Les projets de traitement de documents qui impliquent des données financières, des données de santé protégées, des données personnelles ou des données hautement sensibles nécessitent une attention particulière. Veillez à respecter toutes les exigences nationales, régionales et sectorielles.
Vue d’ensemble des modèles
Le tableau suivant présente les modèles en disponibilité générale (GA) disponibles pour chaque API stable.
| Type de modèle | Modèle | 2024-11-30 (GA) | 31-07-2023 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| Modèles d’analyse de documents | Lire | ✔️ | ✔️ | ✔️ | Non disponible |
| Modèles d’analyse de documents | Disposition | ✔️ | ✔️ | ✔️ | ✔️ |
| Modèles d’analyse de documents | Document général** | Prise en charge dans Modèle de Disposition |
✔️ | ✔️ | Non disponible |
| Modèles prédéfinis | Vérification bancaire | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Relevé de compte | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | payStub | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Contrat | ✔️ | ✔️ | Non disponible | Non disponible |
| Modèles prédéfinis | Carte d’assurance maladie | ✔️ | ✔️ | ✔️ | Non disponible |
| Modèles prédéfinis | Document d’identité | ✔️ | ✔️ | ✔️ | ✔️ |
| Modèles prédéfinis | Facture | ✔️ | ✔️ | ✔️ | ✔️ |
| Modèles prédéfinis | Réception | ✔️ | ✔️ | ✔️ | ✔️ |
| Modèles prédéfinis | Taxe unifiée américaine* | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Us 1040 tax* | ✔️ | ✔️ | Non disponible | Non disponible |
| Modèles prédéfinis | Us 1095 tax* | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Taxe américaine 1098* | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Taxe américaine 1099* | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Taxe américaine W2 | ✔️ | ✔️ | ✔️ | Non disponible |
| Modèles prédéfinis | Taxe américaine W4 | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Hypothèque américaine 1003 URLA | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Hypothèque américaine 1004 URAR | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Prêt hypothécaire américain 1005 | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Résumé de l’hypothèque américaine 1008 | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Divulgation de clôture d’hypothèque aux États-Unis | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Certificat de mariage | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Carte de crédit | ✔️ | Non disponible | Non disponible | Non disponible |
| Modèles prédéfinis | Carte de visite | déconseillé | ✔️ | ✔️ | ✔️ |
| Modèle de classification personnalisé | Classifieur personnalisé | ✔️ | ✔️ | Non disponible | Non disponible |
| Modèle d’extraction personnalisé | Modèle neuronal personnalisé | ✔️ | ✔️ | ✔️ | Non disponible |
| Modèle d’extraction personnalisé | Modèle personnalisé | ✔️ | ✔️ | ✔️ | ✔️ |
| Modèle d’extraction personnalisé | Composé sur mesure | ✔️ | ✔️ | ✔️ | ✔️ |
| Tous les modèles | Fonctionnalités du module complémentaire | ✔️ | ✔️ | Non disponible | Non disponible |
* Contient des sous-modèles. Consultez les informations spécifiques au modèle pour connaître les variantes et sous-types pris en charge.
** Toutes les fonctionnalités du modèle de document général sont disponibles dans le modèle de disposition. Le modèle général nest plus pris en charge.
Latence
La latence est le délai nécessaire à un serveur d’API pour gérer et traiter une requête entrante et remettre la réponse sortante au client. La durée d’analyse d’un document dépend de la taille (par exemple le nombre de pages) et du contenu associé sur chaque page. Document Intelligence est un service asynchrone multilocataire où la latence pour les documents similaires est comparable, mais pas toujours identique. La variabilité occasionnelle de la latence et des performances est inhérente à tout service sans état basé sur un microservice qui traite des images et des documents volumineux à grande échelle. Bien que nous puissions mettre à l’échelle en permanence le matériel, les fonctionnalités et les capacités de mise à l’échelle, il est toujours possible que vous rencontriez des problèmes de latence au moment de l’exécution.
Fonctionnalité de module complémentaire
Les fonctionnalités de module complémentaire suivantes sont disponibles pour Document Intelligence. Pour tous les modèles, à l’exception du modèle de carte de visite, Document Intelligence prend désormais en charge les fonctionnalités d’extension pour permettre une analyse plus sophistiquée. Vous pouvez activer et désactiver ces fonctionnalités optionnelles en fonction du scénario d'extraction du document. Les fonctionnalités de module complémentaire suivantes sont disponibles pour la version d’API 2023-07-31 (GA) et ultérieure :
ocrHighResolutionformulasstyleFontbarcodeslanguageskeyValuePairs-
queryFields(non disponible avec les modèles fiscaux américains) -
searchablePDF(disponible uniquement pour le modèle de lecture)
| Fonctionnalité de module complémentaire | Module complémentaire/gratuit | 2024-11-30 (GA) | 31-07-2023 (GA) | 2022-08-31 (GA) | v2.1 (GA) |
|---|---|---|---|---|---|
| Extraction des propriétés de la police | Composant additionnel | ✔️ | ✔️ | Non disponible | Non disponible |
| Extraction de formules | Composant additionnel | ✔️ | ✔️ | Non disponible | Non disponible |
| Extraction haute résolution | Composant additionnel | ✔️ | ✔️ | Non disponible | Non disponible |
| Extraction de codes-barres | Gratuit | ✔️ | ✔️ | Non disponible | Non disponible |
| Détection de la langue | Gratuit | ✔️ | ✔️ | Non disponible | Non disponible |
| Paires clé-valeur. | Gratuit | ✔️ | Non disponible | Non disponible | Non disponible |
| Champs de requête | Module complémentaire* | ✔️ | Non disponible | Non disponible | Non disponible |
| PDF pouvant être recherché | Module complémentaire* | ✔️ | Non disponible | Non disponible | Non disponible |
Fonctionnalités d'Analyse du modèle
| ID de modèle | Extraction de contenu | Champs de requête | Paragraphes | Rôles de paragraphe | Marques de sélection | Tables | Paires clé-valeur. | Languages | Codes-barres | Analyse de documents | Formules* | Police de style* | Haute résolution* | PDF pouvant être recherché |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
prebuilt-read |
✓ | ✓ | O | O | O | O | O | O | ||||||
prebuilt-layout |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | O | O | O | O | ||
prebuilt-contract |
✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | ||||
prebuilt-healthInsuranceCard.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-idDocument |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-invoice |
✓ | ✓ | ✓ | ✓ | O | O | O | ✓ | O | O | O | |||
prebuilt-receipt |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-marriageCertificate.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-creditCard |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-check.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-payStub.us |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-bankStatement |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-mortgage.us.1003 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1004 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1005 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.1008 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-mortgage.us.closingDisclosure |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w2 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.w4 |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1040 (divers) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1095A |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1095C |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
prebuilt-tax.us.1098 |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098E |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1098T |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099 (divers) |
✓ | ✓ | ✓ | O | O | ✓ | O | O | O | |||||
prebuilt-tax.us.1099SSA |
✓ | ✓ | O | O | ✓ | O | O | O | ||||||
{ customModelName } |
✓ | ✓ | ✓ | ✓ | ✓ | ✓ | O | O | ✓ | O | O | O |
✓ - Activé
O - Facultatif
* - Les fonctionnalités Premium entraînent des coûts supplémentaires
Les champs de requête sont facturés différemment des autres fonctionnalités du module complémentaire. Pour plus d’informations, voir la tarification.
Coordonnées de rectangle englobant et de polygone
Une zone englobante (polygon dans la version 3.0 et versions ultérieures) est un rectangle abstrait qui entoure les éléments de texte d’un document. Un cadre englobant est utilisé comme point de référence pour la détection d’objets :
- Le cadre englobant spécifie la position à l’aide d’un plan de coordonnées x et y présenté dans un tableau de quatre paires numériques. Chaque paire représente un coin de la zone dans l’ordre suivant : supérieur gauche, supérieur droit, inférieur droit, inférieur gauche.
- Les coordonnées d’image sont présentées en pixels. Pour un fichier PDF, les coordonnées sont présentées en pouces.
Support multilingue
Les modèles universels dans Document Intelligence basés sur l’apprentissage profond prennent en charge de nombreux langages. Les modèles peuvent extraire du texte multilingue à partir de vos images et documents, y compris des lignes de texte avec des langues mixtes. La prise en charge des langues varie selon les fonctionnalités du service Intelligence documentaire. Pour obtenir une liste complète, consultez les articles suivants :
- Prise en charge linguistique : modèles d’analyse de documents
- Prise en charge du langage : modèles prédéfinis
- Prise en charge du langage : modèles personnalisés
Disponibilité régionale
Document Intelligence est en disponibilité générale dans un grand nombre des plus de 60 régions d’infrastructure globale Azure.
Pour vous aider à choisir la région qui vous convient le mieux et vos clients, consultez les zones géographiques Azure.
Détails du modèle
Cette section décrit la sortie que vous pouvez attendre de chaque modèle. Vous pouvez étendre la sortie de la plupart des modèles avec des fonctionnalités de module complémentaire.
Lire OCR
L’API Read utilise la reconnaissance optique de caractères (OCR) pour analyser et extraire des lignes et des mots, leurs emplacements, leurs langues détectées et le style d’écriture manuscrite, s’ils sont détectés.
Cet exemple de document a été traité à l’aide de Document Intelligence Studio.
Analyse de disposition
Le modèle d’analyse de disposition analyse et extrait du texte, des tableaux, des marques de sélection et d’autres éléments de structure tels que les titres, les en-têtes de section, les en-têtes de page et les pieds de page.
Cet exemple de document a été traité à l’aide de Document Intelligence Studio.
Carte d’assurance maladie
Le modèle de carte d’assurance maladie combine de puissantes fonctionnalités OCR avec des modèles d’apprentissage profond pour analyser et extraire des informations clés des cartes d’assurance maladie américaines.
Cet exemple de carte d’assurance maladie américaine a été traité à l’aide de Document Intelligence Studio.
Documents fiscaux américains
Les modèles de documents fiscaux américains analysent et extraient les champs clés et les éléments de ligne d’un groupe sélectionné de documents fiscaux. L’API prend en charge l’analyse des documents fiscaux américains en langue anglaise et de différents formats et différentes qualités, y compris les images capturées par téléphone, les documents numérisés et les fichiers PDF numériques. Les modèles suivants sont pris en charge :
| Modèle | Description | ID de modèle |
|---|---|---|
| Taxe américaine W-2 | Extraire les détails de la rémunération imposable. | prebuilt-tax.us.w2 |
| Taxe américaine W-4 | Extraire les détails de la rémunération imposable. | prebuilt-tax.us.w4 |
| Taxe américaine 1040 | Extraire les détails des intérêts hypothécaires. |
prebuilt-tax.us.1040 (variantes) |
| Taxe américaine 1095 | Extrayez les détails de l’assurance maladie. |
prebuilt-tax.us.1095 (variantes) |
| Taxe américaine 1098 | Extraire les détails des intérêts hypothécaires. |
prebuilt-tax.us.1098 (variantes) |
| Taxe américaine 1099 | Extrayez les revenus provenant d’autres sources que l’employeur. |
prebuilt-tax.us.1099 (variantes) |
Cet exemple de document W-2 a été traité à l’aide de Document Intelligence Studio.
Documents hypothécaires américains
Les modèles de documents hypothécaires américains analysent et extraient les champs clés qui incluent l’emprunteur, le prêt et les informations sur les biens d’un groupe sélectionné de documents hypothécaires. L’API prend en charge l’analyse des documents hypothécaires américains en langue anglaise et de différents formats et différentes qualités, y compris les images capturées par téléphone, les documents numérisés et les fichiers PDF numériques. Les modèles suivants sont actuellement pris en charge.
| Modèle | Description | ID de modèle |
|---|---|---|
| Contrat de licence End-User 1003 | Extrayez les détails relatifs au prêt, à l’emprunteur et à la propriété. | prebuilt-mortgage.us.1003 |
| 1004 Rapport uniforme d’évaluation résidentielle (URAR) | Extrayez les détails relatifs au prêt, à l’emprunteur et à la propriété. | prebuilt-mortgage.us.1004 |
| 1005 Vérification de l’emploi | Extrayez les détails relatifs au prêt, à l’emprunteur et à la propriété. | prebuilt-mortgage.us.1005 |
| Document de synthèse 1008 | Extrayez les détails relatifs à l’emprunteur, au vendeur, à la propriété, à l’hypothèque et à la souscription. | prebuilt-mortgage.us.1008 |
| Divulgation de clôture | Extrayez les détails relatifs à la clôture, aux coûts de transaction et au prêt. | prebuilt-mortgage.us.closingDisclosure |
Cet exemple de document de divulgation de fermeture a été traité à l’aide de Document Intelligence Studio.
Contrat
Le modèle de contrat analyse et extrait les champs clés et les éléments de ligne contractuels, y compris les parties, les juridictions, l’ID de contrat et le titre. Le modèle prend actuellement en charge les contrats de document en anglais.
Cet exemple de contrat a été traité à l’aide de Document Intelligence Studio.
Chèque bancaire américain
Le modèle de contrat analyse et extrait les champs clés des chèques bancaires américains, y compris les détails de la vérification, les détails du compte, le montant et les mémo.
Cet exemple de chèque bancaire a été traité à l’aide de Document Intelligence Studio.
Relevé bancaire américain
Le modèle de relevé bancaire analyse et extrait les champs clés et les lignes des relevés bancaires américains pour le numéro de compte, les détails bancaires, les détails des relevés et les détails des transactions.
Cet exemple de relevé bancaire a été traité à l’aide de Document Intelligence Studio.
payStub
Le modèle paystub (bulletin de paie) analyse et extrait les champs clés et les lignes des documents et des fichiers contenant les informations relatives à la paie.
Cet exemple de fiche de paie a été traité à l'aide de Document Intelligence Studio.
Facture
Le modèle de facture automatise le traitement des factures afin d'extraire le nom du client, l'adresse de facturation, la date d'échéance, le montant dû, les lignes de commande et d'autres données clés.
Cet exemple de facture a été traité à l’aide de Document Intelligence Studio.
Réception
Utilisez le modèle de reçu pour numériser les reçus de vente afin d'obtenir le nom du commerçant, les dates, les articles, les quantités et les totaux à partir de reçus imprimés et manuscrits. La version v3.0 prend également en charge le traitement des reçus d’hôtel monopage.
Cet exemple de reçu a été traité à l’aide de Document Intelligence Studio.
Document d’identité
Utilisez le modèle de document d'identité (ID) pour traiter les permis de conduire américains (des 50 États et du district de Columbia) et les pages biographiques des passeports internationaux (à l'exception des visas et autres documents de voyage) afin d'extraire les champs clés.
Cet exemple de licence de pilote américain a été traité à l’aide de Document Intelligence Studio.
Certificat de mariage
Utilisez le modèle de certificat de mariage pour traiter les certificats de mariage américains pour extraire les champs clés, notamment les individus, la date et l’emplacement.
Cet exemple de certificat de mariage américain a été traité à l’aide de Document Intelligence Studio.
Carte de crédit
Utilisez le modèle de carte de crédit pour traiter les cartes de crédit et de débit pour extraire les champs clés.
Cet exemple de carte de crédit a été traité à l’aide de Document Intelligence Studio.
Modèles personnalisés
Les modèles personnalisés sont largement classés en deux types. Modèles de classification personnalisés qui prennent en charge la classification d’un « type de document » et de modèles d’extraction personnalisés qui peuvent extraire un schéma défini à partir d’un type de document spécifique.
Les modèles de documents personnalisés analysent et extraient les données de formulaires et de documents spécifiques à votre entreprise. Ils reconnaissent les champs de formulaire dans votre contenu distinct et extraient des paires clé-valeur et des données de table. Vous n’avez besoin que d’un seul exemple de type de formulaire pour commencer.
Le modèle personnalisé de la version v3.0 et ultérieures prend en charge la détection des signatures dans les modèles personnalisés (formulaire) et les tables multipage dans les modèles et les modèles neuronaux. La détection de signature recherche la présence d’une signature, et non l’identité de la personne qui signe le document. Si le modèle retourne non signé pour la détection de signature, cela signifie qu’il n’a pas trouvé de signature dans le champ défini.
Cet exemple de modèle personnalisé a été traité à l’aide de Document Intelligence Studio.
Extraction personnalisée
Le modèle d’extraction personnalisé est fourni en deux types : modèle personnalisé et neuronal personnalisé. Pour créer un modèle d’extraction personnalisé, étiquetez un jeu de données de documents avec les valeurs que vous souhaitez extraire et effectuer l’apprentissage du modèle sur le jeu de données étiqueté. Vous n’avez besoin que de cinq exemples du même type de formulaire ou de document pour commencer.
Cet exemple d’extraction personnalisée a été traité à l’aide de Document Intelligence Studio.
Classifieur personnalisé
Avec le modèle de classification personnalisé, vous pouvez identifier le type de document avant d’appeler le modèle d’extraction. Le modèle de classification est disponible à partir de l’API 2023-07-31 (GA). L’apprentissage d’un modèle de classification personnalisé nécessite au moins deux classes distinctes et un minimum de cinq exemples par classe.
Modèles composés
Pour créer un modèle composé, vous associez une collection de modèles personnalisés à un modèle unique créé à partir de vos types de formulaire. Vous pouvez affecter plusieurs modèles personnalisés à un modèle composé appelé avec un ID de modèle unique. Il est possible d’attribuer jusqu’à 200 modèles personnalisés entraînés à un même modèle composé.
Cet exemple de modèle composé se trouve dans Document Intelligence Studio.
Critères des entrées
Les formats de fichier suivants sont pris en charge.
| Modèle | Image : JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office : Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lire | ✔ | ✔ | ✔ |
| Disposition | ✔ | ✔ | ✔ |
| Document général | ✔ | ✔ | |
| Prédéfini | ✔ | ✔ | |
| Extraction personnalisée | ✔ | ✔ | |
| Classification personnalisée | ✔ | ✔ | ✔ |
- Photos et analyses : pour obtenir de meilleurs résultats, fournissez une photo claire ou une analyse de haute qualité par document.
- PDF et TIFF : pour les fichiers PDF et les TIFF, jusqu’à 2 000 pages peuvent être traitées. (Avec un abonnement de niveau gratuit, seules les deux premières pages sont traitées.)
- Taille du fichier : la taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
- Dimensions de l’image : les dimensions doivent être comprises entre 50 x 50 pixels et 10 000 x 10 000 pixels.
- Verrous de mot de passe : si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant la soumission.
- Hauteur du texte : la hauteur minimale du texte à extraire est de 12 pixels pour une image de 1 024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce.
- Entraînement de modèle personnalisé : le nombre maximal de pages pour les données d’apprentissage est de 500 pour le modèle personnalisé et de 50 000 pour le modèle neuronal personnalisé.
- Entraînement du modèle d’extraction personnalisé : la taille totale des données d’entraînement est de 50 Mo pour le modèle et de 1 Go pour le modèle neuronal.
- Entraînement du modèle de classification personnalisé : la taille totale des données d’apprentissage est de 1 Go avec un maximum de 10 000 pages. Pour 2024-11-30 (GA), la taille totale des données d’apprentissage est de 2 Go avec un maximum de 10 000 pages.
- Types de fichiers Office (DOCX, XLSX, PPTX) : la limite maximale de longueur de chaîne est de 8 millions de caractères.
Remarque
L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. La limitation dérive de l’outil et non du service Document Intelligence.
Migration de version
Découvrez comment utiliser Document Intelligence v3.0 dans vos applications en suivant les étapes décrites dans le guide de migration de Document Intelligence v3.1.
| Modèle | Description |
|---|---|
| Analyse de documents | |
| Disposition | Extrait des informations sur le texte et la disposition à partir de documents. |
| Prédéfini | |
| Facture | Extrayez les informations clés des factures en langue anglaise et en espagnol. |
| Réception | Extrayez les informations clés des reçus en langue anglaise. |
| Document d’identité | Extrayez les informations clés des permis de conduire américains et des passeports internationaux. |
| Carte de visite | Extrayez les informations clés des cartes de visite en langue anglaise. |
| Custom | |
| Personnalisée | Extrait des données de formulaires et de documents spécifiques à votre entreprise. Les modèles personnalisés sont entraînés pour vos données et cas d’usage spécifiques. |
| Composé | Composez une collection de modèles personnalisés et attribuez-les à un modèle unique généré à partir de vos types de formulaires. |
Disposition
L’API de disposition analyse et extrait du texte, des tableaux, des en-têtes, des marques de sélection et des informations de structure à partir de documents.
Cet exemple de document a été traité à l’aide de l’outil Exemple d’étiquetage.
Facture
Le modèle de facture analyse et extrait les informations clés des factures. L’API analyse les factures dans différents formats et extrait les informations clés, telles que le nom du client, l’adresse de facturation, la date d’échéance et le montant dû.
Cet exemple de facture a été traité à l’aide de l’outil Exemple d’étiquetage.
Réception
Le modèle de reçu analyse et extrait les informations clés des reçus de vente imprimés et manuscrits.
Cet exemple de reçu a été traité à l’aide de l’outil Exemple d’étiquetage.
Document d’identité
Le modèle de document d’ID analyse et extrait les informations clés des documents suivants :
- Permis de conduire américains (tous les 50 états et district de Columbia)
- Pages biographiques des passeports internationaux (à l’exclusion des visas et autres documents de voyage). L’API analyse et extrait les documents d’identité.
Cet exemple de licence de pilote américain a été traité à l’aide de l’outil d’étiquetage d’exemple.
Carte de visite
Le modèle de carte de visite analyse et extrait des informations clés à partir d’images de carte de visite.
Cet exemple de carte de visite a été traité à l’aide de l’outil Exemple d’étiquetage.
Custom
Les modèles personnalisés analysent et extraient les données de formulaires et de documents spécifiques à votre entreprise. L’API est un programme d’apprentissage automatique formé pour reconnaître les champs de formulaire au sein de votre contenu distinct et extraire des paires clé/valeur et des données de table. Vous n’avez besoin que de cinq exemples du même type de formulaire pour commencer. Vous pouvez entraîner votre modèle personnalisé avec ou sans jeux de données étiquetés.
Cet exemple de modèle personnalisé a été traité à l’aide de l’outil Exemple d’étiquetage.
Modèle personnalisé composé
Pour créer un modèle composé, vous associez une collection de modèles personnalisés à un modèle unique créé à partir de vos types de formulaire. Vous pouvez affecter plusieurs modèles personnalisés à un modèle composé appelé avec un ID de modèle unique. Il est possible d’attribuer jusqu’à 100 modèles personnalisés entraînés à un même modèle composé.
Ce volet de modèle composé a été traité à l’aide de l’outil Exemple d’étiquetage.
Extraction de données de modèle
| Modèle | Extraction de texte | Détection de la langue | Marques de sélection | Tables | Paragraphes | Rôles de paragraphe | Paires clé-valeur. | Fields |
|---|---|---|---|---|---|---|---|---|
| Disposition | ✓ | ✓ | ✓ | ✓ | ✓ | |||
| Facture | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
| Réception | ✓ | ✓ | ✓ | |||||
| Document d’identité | ✓ | ✓ | ✓ | |||||
| Carte de visite | ✓ | ✓ | ✓ | |||||
| Formulaire personnalisé | ✓ | ✓ | ✓ | ✓ | ✓ |
Critères des entrées
Les formats de fichier suivants sont pris en charge.
| Modèle | Image : JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office : Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lire | ✔ | ✔ | ✔ |
| Disposition | ✔ | ✔ | ✔ |
| Document général | ✔ | ✔ | |
| Prédéfini | ✔ | ✔ | |
| Extraction personnalisée | ✔ | ✔ | |
| Classification personnalisée | ✔ | ✔ | ✔ |
- Photos et analyses : pour obtenir de meilleurs résultats, fournissez une photo claire ou une analyse de haute qualité par document.
- PDF et TIFF : pour les fichiers PDF et les TIFF, jusqu’à 2 000 pages peuvent être traitées. (Avec un abonnement de niveau gratuit, seules les deux premières pages sont traitées.)
- Taille du fichier : la taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
- Dimensions de l’image : les dimensions doivent être comprises entre 50 x 50 pixels et 10 000 x 10 000 pixels.
- Verrous de mot de passe : si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant la soumission.
- Hauteur du texte : la hauteur minimale du texte à extraire est de 12 pixels pour une image de 1 024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce.
- Entraînement de modèle personnalisé : le nombre maximal de pages pour les données d’apprentissage est de 500 pour le modèle personnalisé et de 50 000 pour le modèle neuronal personnalisé.
- Entraînement du modèle d’extraction personnalisé : la taille totale des données d’entraînement est de 50 Mo pour le modèle et de 1 Go pour le modèle neuronal.
- Entraînement du modèle de classification personnalisé : la taille totale des données d’apprentissage est de 1 Go avec un maximum de 10 000 pages. Pour 2024-11-30 (GA), la taille totale des données d’apprentissage est de 2 Go avec un maximum de 10 000 pages.
- Types de fichiers Office (DOCX, XLSX, PPTX) : la limite maximale de longueur de chaîne est de 8 millions de caractères.
Remarque
L’outil d’étiquetage des exemples ne prend pas en charge le format de fichier BMP. La limitation dérive de l’outil et non de Document Intelligence.
Migration de version
Vous pouvez apprendre à utiliser Document Intelligence v3.0 dans vos applications en suivant les étapes décrites dans le guide de migration de Document Intelligence v3.1
Contenu connexe
- Traitez vos propres formulaires et documents avec Document Intelligence Studio.
- Terminez un guide de démarrage rapide de Document Intelligence, puis créez une application de traitement de documents dans le langage de développement de votre choix.
- Traitez vos propres formulaires et documents avec l'outil d'étiquetage d'exemples de Document Intelligence.
- Terminez un guide de démarrage rapide de Document Intelligence, puis créez une application de traitement de documents dans le langage de développement de votre choix.