Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Ce contenu s’applique à :
v4.0 (GA) | Versions précédentes :
v3.1 (GA) :::moniker-end
Ce contenu s’applique à :
v3.1 (GA) | Dernière version :
v4.0 (GA)
Le modèle de contrats Intelligence documentaire utilise de puissantes fonctionnalités de reconnaissance optique de caractères (OCR) pour analyser et extraire des champs clés et des éléments de ligne à partir d’un groupe d’entités importantes de contrats sélectionné. Les contrats peuvent être de formats et de qualités divers, notamment des images capturées par téléphone, des documents numérisés et des fichiers PDF. L’API analyse le texte du document ; extrait les informations clés telles que les parties, les juridictions, l’ID de contrat et le titre ; et retourne une représentation de données JSON structurée. Le modèle prend actuellement en charge les formats de document en anglais.
Traitement automatisé des contrats
Le traitement automatisé des contrats est le processus d’extraction de champs clés des contrats à partir des documents. Historiquement, le processus d’analyse de contrats était réalisé manuellement et prenait donc beaucoup de temps. L’extraction précise des données clés à partir de contrats est généralement la première et l’une des étapes les plus critiques du processus d’automatisation des contrats.
Options de développement
Intelligence documentaire v4.0 : 2024-11-30 (GA) prend en charge les outils, applications et bibliothèques suivants :
| Fonctionnalité | Ressources | ID de modèle |
|---|---|---|
| Modèle de contrat | • Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript |
prebuilt-contract |
Document Intelligence v3.1 prend en charge les outils, applications et bibliothèques suivants :
| Fonctionnalité | Ressources | ID de modèle |
|---|---|---|
| Modèle de contrat | • Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript |
prebuilt-contract |
Document Intelligence v3.0 prend en charge les outils, applications et bibliothèques suivants :
| Fonctionnalité | Ressources | ID de modèle |
|---|---|---|
| Modèle de contrat | • Document Intelligence Studio • API REST • Kit de développement logiciel (SDK) C# • Kit de développement logiciel (SDK) Python • Kit de développement logiciel (SDK) Java • Kit de développement logiciel (SDK) JavaScript |
prebuilt-contract |
Critères des entrées
Les formats de fichier suivants sont pris en charge.
| Modèle | Image : JPEG/JPG, PNG, BMP, TIFF, HEIF |
Office : Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML |
|
|---|---|---|---|
| Lire | ✔ | ✔ | ✔ |
| Layout | ✔ | ✔ | ✔ |
| Document général | ✔ | ✔ | |
| Prédéfinie | ✔ | ✔ | |
| Extraction personnalisée | ✔ | ✔ | |
| Classification personnalisée | ✔ | ✔ | ✔ |
- Photos et analyses : pour obtenir de meilleurs résultats, fournissez une photo claire ou une analyse de haute qualité par document.
- PDF et TIFFs : pour les fichiers PDF et les TIFF, jusqu’à 2 000 pages peuvent être traitées. (Avec un abonnement de niveau gratuit, seules les deux premières pages sont traitées.)
- Taille du fichier : la taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
- Dimensions de l’image : les dimensions doivent être comprises entre 50 pixels x 50 pixels et 10 000 pixels x 10 000 pixels.
- Verrous de mot de passe : si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant la soumission.
- Hauteur du texte : la hauteur minimale du texte à extraire est de 12 pixels pour une image de 1 024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce.
- Entraînement de modèle personnalisé : le nombre maximal de pages pour les données d’apprentissage est de 500 pour le modèle de modèle personnalisé et de 50 000 pour le modèle neuronal personnalisé.
- Entraînement du modèle d’extraction personnalisé : la taille totale des données d’entraînement est de 50 Mo pour le modèle de modèle et de 1 Go pour le modèle neuronal.
- Entraînement du modèle de classification personnalisé : la taille totale des données d’apprentissage est de 1 Go avec un maximum de 10 000 pages. Pour 2024-11-30 (GA), la taille totale des données d’apprentissage est de 2 Go avec un maximum de 10 000 pages.
- Types de fichiers Office (DOCX, XLSX, PPTX) : la limite maximale de longueur de chaîne est de 8 millions de caractères.
Essayer l’extraction de données de document de contrat
Découvrez comment les données, y compris les informations sur les clients, les détails du fournisseur et les articles, sont extraites des contrats. Vous avez besoin des ressources suivantes :
Un abonnement Azure. Vous pouvez en créer un gratuitement.
Instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (
F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.
Document Intelligence Studio
Dans la page d’accueil Document Intelligence Studio, sélectionnez documents fiscaux.
Vous pouvez analyser l’exemple de documents fiscaux ou charger vos propres fichiers.
Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :
Langues et régions prises en charge
Pour obtenir la liste complète des langues prises en charge, consultez notre page Prise en charge des langues – modèles prédéfinis.
Extraction de champ
Pour connaître les champs d’extraction de documents pris en charge, consultez la page Schéma du modèle de contrat dans notre référentiel d’exemples GitHub.
Les paires clé-valeur et les éléments de ligne de contrat extraits se trouvent dans la section
documentResultsde la sortie JSON.
Étapes suivantes
Essayez de traiter vos propres formulaires et documents avec Document Intelligence Studio.
Effectuez un démarrage rapide Intelligence Documentaire et commencez à créer une application de traitement de documents dans le langage de développement de votre choix.