Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Cet article contient des questions fréquentes sur le modèle de traitement des documents dans AI Builder. Si vous ne trouvez pas votre question ici, consultez Vue d’ensemble du modèle IA de traitement de documents ou soumettez votre question à la Communauté Power Automate pour AI Builder.
Fonctionnalité
Que puis-je faire avec le traitement de documents ?
Avec le traitement des documents, vous pouvez créer un modèle IA personnalisé pour extraire des informations de divers types de documents.
- L’option Documents à modèle fixe est idéale si les éléments de vos documents se trouvent à des endroits similaires. C’est généralement le cas des factures, des bons de commande, des bons de livraison et des formulaires fiscaux.
- L’option Documents généraux est idéale pour tout type de documents, y compris ceux pris en charge par la première option mais aussi les contrats, les cahiers de charges, les lettres et autres. Cette option peut être plus puissante pour extraire des données, mais nécessite un temps de formation plus long.
Pour en savoir plus, consultez Vue d’ensemble du modèle de traitement de documents.
Quels types de documents le traitement de documents peut-il gérer ?
Les types de fichiers pris en charge sont PDF, JPG et PNG.
Quelles données puis-je extraire des documents à l’aide du traitement de documents ?
Le traitement des documents peut extraire des champs, des tables et des cases à cocher des documents.
Pour en savoir plus, consultez Définir les informations à extraire.
Puis-je extraire du texte manuscrit à partir de documents ?
Oui. Le traitement de documents peut extraire du texte imprimé et manuscrit de vos documents.
De combien d’échantillons ai-je besoin pour entraîner un modèle de traitement de documents ?
Pour des documents de haute qualité utilisant la même mise en page, cinq exemples de documents devraient suffire. Pour les documents de mauvaise qualité (par exemple, des documents mal numérisés), d’autres exemples de documents peuvent être nécessaires. Pour améliorer les résultats, utilisez 15 à 20 exemples de documents.
Pratiques recommandées
Pour les documents de modèle
- Une (1) mise en page par collection.
- La mise en page doit être identique au sein d’une même collection.
- Un minimum de cinq (5) et un maximum de 20 documents par collection (ne pas dépasser cette limite).
Pour les documents généraux
Créez un modèle unique pour toutes les variantes d’un type de document, y compris les documents structurés et non structurés.
Étiquetez les champs en fonction de leurs valeurs pour une meilleure précision d’extraction.
Par exemple, utilisez « supplier_id » pour un ID de fournisseur. Les noms de champs doivent correspondre à la langue du document.
Un minimum de cinq (5) et un maximum de 20 documents par collection (ne pas dépasser cette limite).
Mon modèle est actuellement publié en v3.1 (GA), et je prévois de le réentraîner en utilisant v4.0 (GA). Est-il nécessaire de réétiqueter tous mes documents ?
À moins que vous n’ajoutiez de nouveaux champs, cases à cocher, tables, signatures pour l’extraction des données ou de nouveaux documents à la collection, vous n’avez pas besoin de réétiqueter tous les documents.
Avant de publier votre modèle, il est recommandé de tester rapidement votre modèle à l’aide d’un ou de plusieurs exemples pour vérifier et vérifier que tous vos champs souhaités sont correctement extraits.
Puis-je passer d’un type de document à un autre ?
Oui, lors de la modification de votre modèle, vous pouvez basculer entre un type de document de modèle fixe et un type de document général. Toutefois, ce changement n’est pas pris en charge pour les factures.
Un seul modèle de traitement de formulaire peut-il extraire des informations de documents ayant des mises en page ou des modèles différents ?
Oui. En utilisant la fonctionnalité de collections, vous entraînez un modèle de traitement de formulaire unique pour gérer des documents ayant des mises en page différentes.
Pour en savoir plus, consultez Regrouper les documents par collections.
Peut former une poignée de traitement plusieurs document dans le même document ?
Chaque formulaire doit être dans un fichier séparé. Par exemple, si vous avez un document PDF contenant plusieurs factures, créez un fichier séparé pour chaque facture avant de l’envoyer au modèle de traitement de documents.
Vous pouvez également spécifier les pages que le modèle de traitement de documents doit gérer. De cette façon, vous pouvez profiter de la fonctionnalité du modèle pour boucler page par page et traiter un formulaire à la fois.
Pour en savoir plus, consultez Plage de pages.
J’ai formé un modèle de traitement de documents, mais je n’obtiens pas de bons résultats en ce qui concerne les données extraites. Comment puis-je améliorer le modèle ?
Si votre modèle renvoie des résultats médiocres après l’avoir entraîné, modifiez le modèle et fournissez plus d’échantillons pour l’entraînement. Plus vous fournissez d’échantillons, plus le modèle d’IA apprend à extraire des données de vos documents.
Pour en savoir plus, consultez Améliorer les performances de votre modèle de traitement de documents.
Limites
Quel est le nombre maximum de documents que je peux traiter ?
Vous pouvez traiter jusqu’à 360 documents par environnement, toutes les 60 secondes.
Pourquoi certains caractères sont-ils reconnus de manière incorrecte ?
- Il peut arriver que certains caractères soient confondus : 0 (chiffre) et O (lettre), 1 (chiffre) et l (lettre), 4 (chiffre) et A (lettre), etc.
- Il peut arriver que certains caractères au-dessus ou proches d’autres caractères soient reconnus de manière incorrecte : O (lettre) sur une ligne verticale devient un 0 (chiffre), 5 (chiffre) sur une ligne devient un $ (signe du dollar américain), l_ (lettre minuscule, trait de soulignement) devient un L (lettre majuscule), etc.
- Il peut arriver que certains caractères dans des documents de mauvaise qualité soient reconnus de manière incorrecte, voire pas du tout.
Dans les cas précédents, rien ne peut être fait dans AI Builder pour améliorer la reconnaissance. Nous recommandons d’améliorer la qualité et la mise en page du document source pour résoudre des problèmes similaires.
Nonte
Microsoft améliore constamment la technologie de reconnaissance optique de caractères (OCR) pour détecter les caractères, de sorte que de tels problèmes se produisent moins souvent.
Puis-je créer un modèle avec plusieurs collections ?
Vous pouvez créer jusqu’à 200 collections par modèle. Cependant, la formation des modèles Documents généraux contenant des dizaines de collections peut prendre plusieurs heures et, dans de rares cas, expirer. Si votre modèle comporte un nombre élevé de collections, vous devrez attendre jusqu’à 24 heures pour terminer la formation du modèle.
Puis-je créer un modèle dans une solution ?
Actuellement, il n’est pas possible de créer un modèle dans une solution.
Puis-je utiliser des contrats et des lettres dans mon modèle de traitement de document ?
Oui, les documents non structurés tels que les contrats et les lettres sont pris en charge par le traitement des documents, à l’aide de l’option Documents généraux.
Comparaisons
Quelles sont les différences entre le traitement des documents, le traitement des factures, le traitement des reçus, le Lecteur de documents d’identité, le Lecteur de carte de visite et la reconnaissance de texte ?
Selon votre situation, vous devrez peut-être utiliser un modèle particulier ou une combinaison de ceux-ci.
Utilisez la reconnaissance de texte lorsque vous souhaitez extraire tout le texte présent dans une image ou un PDF. Vous pouvez ensuite, par exemple, rechercher un mot-clé dans le texte extrait ou créer des règles fixes pour extraire certains éléments.
Si vous souhaitez extraire des informations de factures, reçus, passeports, permis de conduire ou cartes de visite, commencez par le modèle prédéfini correspondant :
- Traitement de factures
- Traitement de reçus
- Lecteur de documents d’identité (passeports et permis de conduire)
- Lecteur de carte de visite
Vous pouvez utiliser ces modèles prédéfinis immédiatement, sans avoir à créer un nouveau modèle. Ces modèles peuvent extraire des informations communes trouvées sur leur type de document correspondant.
Pour tout autre type de document, vous pouvez créer un modèle de traitement de document personnalisé pour extraire les champs et les tables dont vous avez besoin. Cela s’applique également si vous avez besoin d’informations supplémentaires non fournies par le modèle prédéfini.
Pour en savoir plus, consultez Modèle de traitement de documents personnalisé.
Quelle est la différence entre le traitement de documents AI Builder et Azure Form Recognizer ?
Le traitement de documents AI Builder est basé sur Azure Form Recognizer. Cela fournit aux deux produits les dernières avancées de Microsoft AI.
AI Builder fait partie de Microsoft Power Platform. Cela permet à quiconque d’ajouter de l’IA dans les applications et l’automatisation avec une interface facile à utiliser. Vous n’avez pas besoin d’être un développeur ou un scientifique Données.
Reconnaissance de formulaire Azure est destiné aux développeurs professionnels. Ils peuvent utiliser des API REST simples pour ajouter des capacités d’IA à leurs solutions de code personnalisées.
Options de coût
Combien coûte le traitement de documents AI Builder ?
Vous pouvez commencer à essayer gratuitement le traitement de documents en lançant un essai. Après l’avoir évalué, vous devez acheter des crédits AI Builder pour utiliser le traitement de documents. Chaque page que vous traitez avec le traitement de documents consomme des crédits AI Builder, même si la page ne contient pas de données à extraire. Les crédits AI Builder peuvent être achetés via le module complémentaire AI Builder.
Pour en savoir plus, consultez Licences AI Builder.