Partager via


Modèles de documents hypothécaires Intelligence documentaire

Ce contenu s’applique à : cochev4.0 (GA)

Les modèles hypothécaires Intelligence documentaire utilisent de puissantes capacités de reconnaissance optique de caractères (OCR) pour analyser et extraire les champs clés des documents hypothécaires. Les documents hypothécaires peuvent être de divers formats et qualité. L’API analyse les documents hypothécaires et retourne une représentation sous forme de données JSON structurées. Les modèles ne prennent actuellement en charge que les documents en langue anglaise. Avec la dernière version V4.0, vous pouvez désormais extraire des signatures à partir d’applications hypothécaires et de formulaires.

Types de documents pris en charge :

  • Demande de prêt immobilier (formulaire 1003)
  • Rapport uniforme d’expertise immobilière (Formulaire 1004)
  • Vérification du formulaire d’emploi (Formulaire 1005)
  • Dossier de prêt immobilier (formulaire 1008)
  • Formulaire d’échéancier de prêt

Options de développement

Intelligence documentaire v4.0 (2024-11-30-GA) prend en charge les outils, applications et bibliothèques suivants :

Fonctionnalité Ressources ID de modèle
Modèle hypothécaire Document Intelligence Studio
API REST
Kit de développement logiciel (SDK) C#
Kit de développement logiciel (SDK) Python
Kit de développement logiciel (SDK) Java
Kit de développement logiciel (SDK) JavaScript
• prebuilt-mortgage.us.1003
• prebuilt-mortgage.us.1004
• prebuilt-mortgage.us.1005
• prebuilt-mortgage.us.1008
• prebuilt-mortgage.us.closingDisclosure

Critères des entrées

Les formats de fichier suivants sont pris en charge.

Modèle PDF Image :
JPEG/JPG, PNG, BMP, TIFF, HEIF
Office :
Word (DOCX), Excel (XLSX), PowerPoint (PPTX), HTML
Lire
Disposition
Document général
Prédéfini
Extraction personnalisée
Classification personnalisée
  • Photos et analyses : pour obtenir de meilleurs résultats, fournissez une photo claire ou une analyse de haute qualité par document.
  • PDF et TIFF : pour les fichiers PDF et les TIFF, jusqu’à 2 000 pages peuvent être traitées. (Avec un abonnement de niveau gratuit, seules les deux premières pages sont traitées.)
  • Taille du fichier : la taille de fichier pour l’analyse des documents est de 500 Mo pour le niveau payant (S0) et de 4 Mo pour le niveau gratuit (F0).
  • Dimensions de l’image : les dimensions doivent être comprises entre 50 x 50 pixels et 10 000 x 10 000 pixels.
  • Verrous de mot de passe : si vos fichiers PDF sont verrouillés par mot de passe, vous devez supprimer le verrou avant la soumission.
  • Hauteur du texte : la hauteur minimale du texte à extraire est de 12 pixels pour une image de 1 024 x 768 pixels. Cette dimension correspond à environ 8 points de texte à 150 points par pouce.
  • Entraînement de modèle personnalisé : le nombre maximal de pages pour les données d’apprentissage est de 500 pour le modèle personnalisé et de 50 000 pour le modèle neuronal personnalisé.
  • Entraînement du modèle d’extraction personnalisé : la taille totale des données d’entraînement est de 50 Mo pour le modèle et de 1 Go pour le modèle neuronal.
  • Entraînement du modèle de classification personnalisé : la taille totale des données d’apprentissage est de 1 Go avec un maximum de 10 000 pages. Pour 2024-11-30 (GA), la taille totale des données d’apprentissage est de 2 Go avec un maximum de 10 000 pages.
  • Types de fichiers Office (DOCX, XLSX, PPTX) : la limite maximale de longueur de chaîne est de 8 millions de caractères.

Essayer l’extraction des données de documents hypothécaires

Pour voir comment l’extraction de données fonctionne pour le service des documents hypothécaires, vous avez besoin des ressources suivantes :

  • Un abonnement Azure. Vous pouvez en créer un gratuitement.

  • Une instance Intelligence documentaire dans le Portail Azure. Vous pouvez utiliser le niveau tarifaire gratuit (F0) pour tester le service. Une fois votre ressource déployée, sélectionnez Accéder à la ressource pour accéder à la clé et au point de terminaison.

Capture d’écran de l’emplacement des clés et des points de terminaison dans le Portail Azure.

Document Intelligence Studio

  1. Dans la page d’accueil d’Intelligence documentaire Studio, sélectionnez Hypothèque.

  2. Vous pouvez analyser l’exemple de documents hypothécaires ou charger vos propres fichiers.

  3. Sélectionnez le bouton Exécuter l’analyse et, si nécessaire, configurez les Options d’analyse :

    Capture d’écran des boutons Exécuter l’analyse et Options d’analyse dans Document Intelligence Studio.

Langues et régions prises en charge

Pour obtenir la liste complète des langues prises en charge, consultez notre page Prise en charge des langues : Modèles prédéfinis.

Extraction de champ

Pour connaître les champs d’extraction de documents pris en charge, consulter les pages schéma du modèle de document hypothécaire de notre référentiel d’exemples GitHub.

Étapes suivantes