Partager via


Aquaforest PDF

Le connecteur PDF Aquaforest contient un groupe d’actions qui effectuent différentes opérations PDF telles que le fractionnement, l’extraction de texte, l’extraction de codes-barres et les opérations OCR pour Office 365 et Power Automate.

Ce connecteur est disponible dans les produits et régions suivants :

Service classe Régions
Copilot Studio Premium Toutes les régions Power Automate , à l’exception des éléments suivants :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Applications logiques Norme Toutes les régions Logic Apps , à l’exception des suivantes :
     - Régions Azure Government
     - Régions Azure Chine
     - Us Department of Defense (DoD)
Power Apps Premium Toutes les régions Power Apps , à l’exception des suivantes :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Power Automate Premium Toutes les régions Power Automate , à l’exception des éléments suivants :
     - Us Government (GCC)
     - Us Government (GCC High)
     - China Cloud géré par 21Vianet
     - Us Department of Defense (DoD)
Contact
Nom Prise en charge d’Aquaforest
URL https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Messagerie électronique support@aquaforest.com
Métadonnées du connecteur
Éditeur Aquaforest Limited
Site internet https://www.aquaforest.com/en/aquaforest-connector.asp
Politique de confidentialité https://www.aquaforest.com/en/privacy policy.pdf
Catégories Contenu et fichiers ; Données

Le connecteur PDF Aquaforest contient un groupe d’actions qui effectuent différentes opérations PDF telles que le fractionnement, l’extraction de texte, l’extraction de codes-barres et les opérations OCR pour Office 365 et Flow.

Prerequisites

Tout d’abord, vous devez créer un compte d’API PDF Aquaforest. Ce compte est utilisé pour gérer les actions PDF Aquaforest et l’API PDF Aquaforest. Utilisez votre adresse e-mail active, car l’abonnement sera lié à cette adresse. Si vous disposez déjà d’un compte, connectez-vous ici.

Comment obtenir des informations d’identification

  1. Connectez-vous au portail des développeurs, accédez à la page Produits et sélectionnez le produit auquel vous souhaitez vous abonner.

  2. Cliquez sur le bouton S’abonner

  3. Cliquez sur le bouton Confirmer pour confirmer votre demande d’abonnement

  4. Vous pouvez accéder à vos clés API dans votre page Profil

Création d’une connexion

Le connecteur prend en charge les types d’authentification suivants :

Par défaut Paramètres de création de connexion. Toutes les régions Non partageable

Faire défaut

Applicable : Toutes les régions

Paramètres de création de connexion.

Cette connexion n’est pas partageable. Si l’application power est partagée avec un autre utilisateur, un autre utilisateur est invité à créer une connexion explicitement.

Nom Type Descriptif Obligatoire
Clé d’API securestring Clé API pour cette API Vrai

Limitations

Nom Appels Période de renouvellement
Appels d’API par connexion 100 60 secondes

Actions

Extraire des pages PDF par code-barres

Extrayez des fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Extraire des pages PDF par texte

Extrayez les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Fractionner pdf par code-barres

Fractionne les fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Fractionner pdf par correspondance de texte

Fractionne les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Fractionner pdf par page

Fractionne les fichiers PDF en fonction des options de fractionnement définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation.

Obtenir des données au format PDF

Cette action extrait les données importantes des fichiers PDF sous la forme de paires Clé/Valeur.

Obtenir du texte au format PDF

Obtenez du texte à partir de fichiers PDF en fonction de l’emplacement du texte et des expressions régulières. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Obtenir la valeur du code-barres

Obtenir le code-barres à partir du PDF. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Obtenir les propriétés PDF

Obtient les informations relatives à un fichier PDF

OCR PDF ou images

Générez un FICHIER PDF pouvant faire l’objet d’une recherche à partir d’une image PDF ou d’images numérisées. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Extraire des pages PDF par code-barres

Extrayez des fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom Clé Obligatoire Type Description
Contenu du fichier
fileContent True byte

Contenu du fichier source

Modèle de nom de fichier
fileNameTemplate True string

Modèle pour le fichier de sortie si le code-barres est trouvé

Aucun modèle de fichier
noTextFileName True string

Modèle pour le fichier de sortie si aucun code-barres n’est trouvé

Nom du fichier
sourceFileName True string

Nom du fichier source

Type
barcodeFormats array of string

Spécifier les types de codes-barres que vous souhaitez identifier

Emplacement
location True string

Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Motif
regex string

Si une expression régulière est fournie ici, nous allons correspondre à n’importe quel code-barres extrait et retourner la correspondance.

Retours

Extraire des pages PDF par texte

Extrayez les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom Clé Obligatoire Type Description
Contenu du fichier
fileContent True byte

Contenu du fichier source

Modèle de nom de fichier
fileNameTemplate True string

Modèle pour le fichier de sortie si les correspondances de texte sont trouvées

Aucun modèle de fichier
noTextFileName True string

Modèle pour le fichier de sortie si aucune correspondance de texte n’est trouvée

Nom du fichier
sourceFileName True string

Nom du fichier source

Valeur
expression array of string

Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus.

Emplacement
location True string

Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Sélectionnez
position string

Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins

Motif
regex string

Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance.

Retours

Fractionner pdf par code-barres

Fractionne les fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Paramètres

Nom Clé Obligatoire Type Description
Contenu du fichier
fileContent True byte

Contenu du fichier source

Modèle de nom de fichier
fileNameTemplate True string

Modèle pour le fichier de sortie si le code-barres est trouvé

Pages sans correspondance
noMatch string

Selon l’option fractionnée que vous choisissez ci-dessus, certaines pages n’ont aucune valeur de code-barres. Choisissez ce qu’il faut faire dans ces pages.

Aucun modèle de correspondance de code-barres
noTextFileName True string

Modèle pour le fichier de sortie si aucun code-barres n’est trouvé

Nom du fichier
sourceFileName True string

Nom du fichier source

Options de fichier de sortie
splitOption string

Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins

Type
barcodeFormats array of string

Spécifier les types de codes-barres que vous souhaitez identifier

Emplacement
location True string

Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Motif
regex string

Si une expression régulière est fournie ici, nous allons correspondre à n’importe quel code-barres extrait et retourner la correspondance.

Retours

Fractionner pdf par correspondance de texte

Fractionne les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Paramètres

Nom Clé Obligatoire Type Description
Contenu du fichier
fileContent True byte

Contenu du fichier source

Modèle de nom de fichier
fileNameTemplate True string

Modèle pour le fichier de sortie si les correspondances de texte sont trouvées

Pages sans correspondance
noMatch string

Selon l’option fractionnée que vous choisissez ci-dessus, certaines pages n’ont aucune valeur de texte extraite. Choisissez ce qu’il faut faire dans ces pages.

Aucun modèle de fichier
noTextFileName True string

Modèle pour le fichier de sortie si aucune correspondance de texte n’est trouvée

Nom du fichier
sourceFileName True string

Nom du fichier source

Options de fichier de sortie
splitOption string

Choisissez l’emplacement de la page avec le code-barres dans les fichiers de sortie de l’opération de fractionnement.

Valeur
expression array of string

Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus.

Emplacement
location True string

Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Sélectionnez
position string

Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins

Motif
regex string

Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance.

Retours

Fractionner pdf par page

Fractionne les fichiers PDF en fonction des options de fractionnement définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation.

Paramètres

Nom Clé Obligatoire Type Description
Contenu du fichier
fileContent True byte

Contenu du fichier source.

Nom du fichier de sortie
fileNameTemplate True string

Modèle de fichier cible qui peut inclure %UNIQUEn (nombre unique commençant à 1, zéro rembourré sur n chiffres) et %FILENAME (nom de fichier d’origine sans l’extension).

Nom du fichier
sourceFileName True string

Nom du fichier source.

Type de fractionnement
splitOption True string

Choisissez l’opération de fractionnement à utiliser pour chaque fichier.

Plage de pages
pageRange string

Ensemble de plages de pages séparées par des virgules qui définissent les pages de l’original à extraire.

Répéter toutes les
repeatEvery integer

Appliquez la plage de pages à chaque ensemble de pages Plages de pages dans le document. Par exemple, si 2 à 4 est spécifié pour les plages de pages et que 4 sont spécifiés comme plage répétée, la plage est réapppliquée toutes les 4 pages.

Conserver les signets
retainBookmarks boolean

Les fichiers générés incluent des signets à partir du fichier d’origine.

Conserver les métadonnées
retainMetadata boolean

Les fichiers générés incluent des métadonnées (telles que l’auteur et le titre) à partir du fichier d’origine.

Retours

Obtenir des données au format PDF

Cette action extrait les données importantes des fichiers PDF sous la forme de paires Clé/Valeur.

Paramètres

Nom Clé Obligatoire Type Description
Nom
settingName True string

Entrez le nom du paramètre ici

Valeur
settingValue True string

Entrez la valeur du paramètre ici.

Score de confiance
confidenceScore number

Définissez un score de confiance plus élevé pour filtrer les valeurs avec une confiance inférieure. Vous pouvez définir n’importe quelle valeur comprise entre 0 et 1. Nous vous recommandons de commencer à partir de la version 0.5

Date Conversion
dateAsISO string

Sélectionnez le format à renvoyer comme valeur de date

Clés attendues
expectedKeys string

Fournissez un nom de clé par ligne pour rendre les valeurs disponibles pour les actions ultérieures sans analyser JSON.

Contenu du fichier
fileContent True byte

Contenu du fichier source

Limite de page
pageLimit integer

Nombre maximal de pages à traiter

Plage de pages
pageRange string

Représentation sous forme de chaîne des numéros de page que vous souhaitez traiter. Par exemple, 1,3-4

Symbole monétaire de bande
stripCurrencySymbol boolean

Définissez cette valeur sur true si vous souhaitez que les symboles et les chaînes soient supprimés avant de retourner des valeurs monétaires

Synonyme de correspondance
synonym boolean

Définissez cette valeur sur true si vous souhaitez que nous renvoyions toutes les clés synonymes de la clé attendue.

Dictionnaire de synonymes
synonymDictionary string

Vous pouvez fournir un tableau JSON d’objets « entry », où chaque objet contient une liste de synonymes dans un tableau. Par exemple, si vous souhaitez que « Facture Non » et « Numéro de facture » (sans respect de la casse) soient interprétés comme la même clé, utilisez le code JSON suivant : [{'entry' : [ 'Invoice No', 'invoice number' ]}]

Découper les symboles
trimSymbols boolean

Définissez cette valeur sur true si vous souhaitez que nous supprimions tous les symboles de début et de fin des clés trouvées avant de les mettre en correspondance avec une clé attendue.

Retours

Les sorties de cette opération sont dynamiques.

Obtenir du texte au format PDF

Obtenez du texte à partir de fichiers PDF en fonction de l’emplacement du texte et des expressions régulières. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom Clé Obligatoire Type Description
Contenu du fichier
fileContent True byte

Contenu du fichier source

Aucun modèle de correspondance de texte
noTextTemplate True string

Modèle pour le texte à renvoyer si une correspondance est introuvable

Séparateur de page
pageSeparator string

Fournissez un séparateur de page pour vous permettre de savoir où se trouvent les sauts de page.

Feuilles
pagerange string

Fournissez une plage de pages à partir de laquelle vous souhaitez extraire du texte, il peut s’agir d’un numéro de page unique (1), de numéros de page multiples séparés par des virgules (1,2,3), d’une plage de pages (1 à 4) ou d’un mélange de tous (1,2,4-7).

Nom du fichier
sourceFileName True string

Nom du fichier source

Modèle de résultat de texte
textResultTemplate True string

Modèle pour le texte à renvoyer si une correspondance est trouvée

Valeur
expression array of string

Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus.

Emplacement
location True string

Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Page (déconseillée)
pagenumber integer

Cette propriété est déconseillée, nous vous conseillons d’utiliser la propriété Pages. La propriété Pages s’applique à toutes les zones et vous permet de sélectionner les pages que vous souhaitez traiter.

Sélectionnez
position string

Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins

Motif
regex string

Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance.

Retours

Obtenir la valeur du code-barres

Obtenir le code-barres à partir du PDF. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom Clé Obligatoire Type Description
Modèle de résultat du code-barres
barcodeResultTemplate True string

Modèle pour le résultat du texte de sortie si un code-barres est trouvé

Contenu du fichier
fileContent True byte

Contenu du fichier source

Aucun modèle de code-barres
noBarcodeTemplate True string

Modèle pour le résultat du texte de sortie si aucun code-barres n’est trouvé

Séparateur de page
pageSeparator string

Fournissez un séparateur de page pour vous permettre de savoir où se trouvent les sauts de page.

Feuilles
pagerange string

Fournissez une plage de pages à partir de laquelle vous souhaitez extraire du texte, il peut s’agir d’un numéro de page unique (1), de numéros de page multiples séparés par des virgules (1,2,3), d’une plage de pages (1 à 4) ou d’un mélange de tous (1,2,4-7).

Nom du fichier
sourceFileName True string

Nom du fichier source

Type
barcodeFormats array of string

Spécifier les types de codes-barres que vous souhaitez identifier

Emplacement
location True string

Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

Page (déconseillée)
pagenumber integer

Cette propriété est déconseillée, nous vous conseillons d’utiliser la propriété Pages. La propriété Pages s’applique à toutes les zones et vous permet de sélectionner les pages que vous souhaitez traiter.

Motif
regex string

Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance.

Retours

Obtenir les propriétés PDF

Obtient les informations relatives à un fichier PDF

Paramètres

Nom Clé Obligatoire Type Description
Contenu du fichier
fileContent True byte

Contenu du fichier source

Limite de page
pageLimit integer

Nombre maximal de pages à traiter, il est utilisé uniquement pour vérifier si les pages contiennent du texte masqué ou si le fichier PDF peut faire l’objet d’une recherche

Retours

OCR PDF ou images

Générez un FICHIER PDF pouvant faire l’objet d’une recherche à partir d’une image PDF ou d’images numérisées. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom Clé Obligatoire Type Description
AquaforestImageTimeout
aquaforestImageTimeout integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Auteur
author string

Définissez un auteur personnalisé dans les propriétés de document PDF de sortie.

Rotation automatique
autorotate boolean

Rotation automatique de l’image : cela garantit que tout le texte est orienté normalement

Binarize
binarize integer

Cette valeur ne doit généralement être utilisée que dans le cadre d’instructions du support technique. Il peut contrôler la façon dont les images de couleur sont traitées et forcent la binarisation avec un seuil particulier. Une valeur de 200 a été montrée pour donner généralement de bons résultats dans les tests, mais cela devrait être confirmé avec des documents clients « typiques ». En affectant cette valeur à -1 une autre méthode est utilisée pour séparer le texte de toutes les images ou couleurs d’arrière-plan. Cela peut donner des résultats OCR améliorés pour certains documents tels que les journaux et les pages de magazines.

Limite de pixels noirs
blackPixelLimit float

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Seuil de page vide
blankPageThreshold integer

Utilisez cette option pour définir le nombre minimal de « Sur pixels » qui doivent être présents dans l’image pour qu’une page ne soit pas considérée comme vide. Une valeur de -1 désactive la détection de page vide.

Taille de la boîte
boxSize integer

Cette option est idéale pour les formulaires où parfois des zones autour du texte peuvent entraîner l’identification d’une zone en tant que graphiques. Cette option supprime les zones de la copie temporaire de l’image utilisée par le moteur OCR. Elle ne supprime pas les zones de l’image finale. Techniquement, cette option supprime les éléments connectés avec une zone minimale (en pixels et défini par cette propriété). Cette option est actuellement appliquée uniquement pour les images bi-tonales.

ConvertToTiff
convertToTiff boolean

Chaque page du document PDF est ratérisée dans une image TIFF.

CreateProcess
createProcess boolean

Définissez cette valeur sur true si vous souhaitez lancer le processus via pinvoke.

Date de création
creationDate string

Définissez une date de création personnalisée dans les propriétés du document PDF de sortie. La chaîne de date doit être au format 'aaaa-MM-jj HH :mm :ss'.

Deskew
deskew boolean

Deskew (redresser) l’image.

Déspeckle
despeckle integer

Cela supprime tous les éléments déconnectés de l’image dont la hauteur ou la largeur est inférieure à la figure spécifiée. La valeur maximale est 9 et la valeur par défaut est 0.

DictionaryLookup
dictionaryLookup integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Dotmatrix
dotmatrix boolean

Définissez cette valeur sur true pour améliorer la reconnaissance des polices de matrice de points. La valeur par défaut est False. Si la valeur est true pour les polices non matricielles, la reconnaissance peut être médiocre.

Activer la sortie de débogage
enableDebugOutput boolean

Active la sortie de débogage.

Compresser pdf (MRC)
enableMrc boolean

Cela permet la compression raster mixte qui peut réduire considérablement la taille de sortie des fichiers PDF comprenant des analyses de couleurs. Notez que cette option convient uniquement lorsque la source n’est pas un fichier PDF ou utilise ConvertToTiff.

Sortie PDF/A
enablePDFAOutput boolean

Indique si la sortie doit être au format PDF/A.

Mode d’erreur
errorMode integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Contenu du fichier source
fileContent True byte

Contenu du fichier en OCR

Nom de fichier source avec extension
fileNameWithExtension True string

Nom du fichier source avec extension ou simplement l’extension (avec une période de début '.')

Retourner détecter
flipDetect integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Qualité des nuances de gris
grayscaleQuality integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Heuristique
heuristics integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Jbig2EncFlags
jbig2EncFlags string

Il s’agit des indicateurs qui seront transmis à l’application utilisée pour générer des versions JBIG2 d’images utilisées dans la génération PDF (en supposant que cette compression est activée). Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique.

Language
language enum

La sélection de l’une des options ci-dessous définit la langue à utiliser pour le traitement OCR. La langue par défaut est l'anglais.

LibTiffSavePageAsBmp
libTiffSavePageAsBmp boolean

Parfois, s’il existe une image qui est 1bpp et a la compression LZW, le prétraitement peut provoquer l’invertir de l’image (noir à blanc et blanc à noir). Définissez cette valeur sur true pour éviter cela.

Maximum deskew
maxDeskew float

Angle maximal par lequel une page sera mise à jour. Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique (support@aquaforest.com).

Confiance minimale du bureau
minDeskewConfidence float

Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique (support@aquaforest.com).

Date de modification
modifiedDate string

Définissez une date de modification personnalisée dans les propriétés du document PDF de sortie. La chaîne de date doit être au format 'aaaa-MM-jj HH :mm :ss'.

Morphe
morph string

Options morphologiques qui seront appliquées à l’image binarisée avant OCR. Si la valeur est vide, aucune n’est appliquée. Les options courantes incluent celles répertoriées ci-dessous, mais pour plus d’options, veuillez contacter support@aquaforest.com.

MrcBackgroundFactor
mrcBackgroundFactor integer

Taille d’échantillonnage pour la partie d’arrière-plan de l’image. Plus le nombre est élevé, plus la taille des blocs d’image est élevée pour la moyenne, ce qui entraînera une réduction de la taille, mais aussi de la qualité. La valeur par défaut est 3

MrcForegroundFactor
mrcForegroundFactor integer

Taille d’échantillonnage pour la partie de premier plan de l’image. Plus le nombre est élevé, plus la taille des blocs d’image est élevée pour la moyenne, ce qui entraînera une réduction de la taille, mais aussi de la qualité. La valeur par défaut est 3

MrcQuality
mrcQuality integer

Paramètre de qualité JPEG (valeur de pourcentage 1 à 100) à utiliser pour enregistrer l’arrière-plan et les images de premier plan. La valeur par défaut est 75

MrcTimeout
mrcTimeout integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

NoPictures
noPictures boolean

Par défaut, si une zone du document est identifiée comme une zone graphique, aucun traitement OCR n’est exécuté sur cette zone. Toutefois, certains documents peuvent inclure des zones ou des zones identifiées comme des zones « graphique » ou « image », mais qui contiennent effectivement du texte utile. La définition de NoPictures sur True l’entraîne à ignorer les zones identifiées en tant qu’images tout en la définissant sur False force l’OCR des zones identifiées comme des images.

OcrProcessSetupTimeout
ocrProcessSetupTimeout integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

OcrTimeout
ocrTimeout integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Mot de passe
password string

Mot de passe pour ouvrir le fichier PDF source

PdfToImageBpp
pdfToImageBpp enum

Bits par pixel à utiliser pour la page PDF ratérisée lors de l’utilisation du moteur 1. Cela s’applique uniquement aux documents traités à l’aide de ConvertToTiff. La valeur par défaut de cette propriété est extraite de la page PDF.

PdfToImageCompression
pdfToImageCompression enum

Compression à définir sur les images extraites ou ratérisées de chaque page du fichier PDF source. Ces images sont ensuite OCRed pour créer le PDF pouvant faire l’objet d’une recherche. La valeur par défaut de cette propriété est extraite de chaque page du fichier PDF source.

PdfToImageDpi
pdfToImageDpi enum

Ppp à définir sur les images ratérisées à partir de chaque page du fichier PDF source. Ces images sont ensuite OCRed pour créer le PDF pouvant faire l’objet d’une recherche. La valeur par défaut de cette propriété est extraite de chaque page du fichier PDF source.

PdfToImageForceVectorCheck
pdfToImageForceVectorCheck boolean

Ce paramètre est utile lorsque vous traitez des documents qui contiennent des objets vectoriels (par exemple, des dessins CAO). Par défaut, les pages qui contiennent uniquement des objets vectoriels sont ratérisées. Les pages qui n’ont pas d’images, mais contiennent des objets vectoriels ainsi que du texte électronique sont ignorées de la rastérisation. Toutefois, il peut parfois y avoir une page qui contient des objets vectoriels (dessins CAO), mais son titre peut être en texte électronique. Pour forcer la rastérisation des pages comme celles-ci, définissez cette propriété sur true.

PdfToImageIncludeText
pdfToImageIncludeText boolean

Lorsqu’il est défini sur False, cela empêche la conversion de texte réel (par exemple, générée électroniquement par opposition au texte qui fait partie d’une image numérisée) d’être restituée dans les images de page extraites du PDF. Cela est dû au fait que le texte est déjà pouvant faire l’objet d’une recherche et ne nécessite généralement pas d’OCR. La valeur peut être définie sur True toutefois si l’OCR est requis sur ce texte réel.

PdfToImageMaxRes
pdfToImageMaxRes integer

Résolution maximale des images ratérisées. Si la résolution récupérée à partir de la page PDF est supérieure à cette valeur, elle est définie sur cette valeur. La valeur par défaut de cette propriété est 600.

PdfToImageMinRes
pdfToImageMinRes integer

Résolution minimale des images ratérisées. Si la résolution récupérée à partir de la page PDF est inférieure à cette valeur, elle est définie sur cette valeur. La valeur par défaut de cette propriété est 200.

PDF/A Version
pdfaVersion enum

Version PDF/A.

PipeClientConnectionTimeout
pipeClientConnectionTimeout integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

RemoveBlankPage
removeBlankPage boolean

Supprimez les pages vides lorsque BlankPageThreshold est supérieur à -1 et ConvertToTiff a la valeur true.

RemoveLines
removeLines boolean

Supprimez les lignes des images fpr pour une meilleure reconnaissance.

RestartEngineEvery
restartEngineEvery integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Conserver les signets
retainBookmarks boolean

Conserve tous les signets du fichier source dans la sortie lors de l’utilisation de ConvertToTiff.

Conserver la date de création
retainCreationDate boolean

Conserve la date de création du fichier source dans les propriétés du document PDF de sortie.

Conserver les métadonnées
retainMetadata boolean

Conserve les métadonnées du fichier source dans la sortie lors de l’utilisation de ConvertToTiff.

Conserver la date de modification
retainModifiedDate boolean

Conserve la date de modification du fichier source dans les propriétés du document PDF de sortie.

Conserver les préférences de visionneuse
retainViewerPreferences boolean

Conserve les préférences de visionneuse PDF, le mode page et la mise en page à partir du fichier source dans la sortie lors de l’utilisation de ConvertToTiff.

SavePredespeckle
savePredespeckle boolean

Cela utilise l’image d’origine (c’est-à-dire avant d’appliquer le prétraitement) dans le fichier PDF de sortie.

Tables
tables boolean

Cette option lorsqu’elle est définie sur true, tente d’ocr dans les cellules du tableau.

TextLayerFilterHeight
textLayerFilterHeight integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

TextLayerFilterHeightInverted
textLayerFilterHeightInverted integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

TextLayerFilterPercentage
textLayerFilterPercentage float

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

TextLayerFilterPercentageInverted
textLayerFilterPercentageInverted float

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

TextLayerFilterRatio
textLayerFilterRatio float

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

TextLayerFilterRatioInverted
textLayerFilterRatioInverted float

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

TextLayerFilterWidth
textLayerFilterWidth integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

TextLayerFilterWidthInverted
textLayerFilterWidthInverted integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

TextLayerMaxBoxes
textLayerMaxBoxes integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Mode tidy-up
tidyUpMode integer

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Valider PDF/A
validatePDFA boolean

Indique si le document PDF/A doit être validé après la conversion

Seuil de correspondance word
wordMatchThreshold float

Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Retours

Données de réponse pour l’opération OCR

Corps
ocr_response

Définitions

ApiExtractPost200ApplicationJsonResponse

Nom Chemin d’accès Type Description
Erreur
ErrorMessage string

Si la valeur Is Successful est false, nous retournerons un message d’erreur

Réussite
IsSuccessful boolean

Cela retourne true si au moins une page a été extraite

Informations de licence
LicenceInfo string

Informations sur votre clé d’abonnement API

Extraire des fichiers de sortie
SplittedFile array of object

Tableau de fichiers extraits

(Contenu du fichier)
SplittedFile.SplitFileContent byte

Chaîne de base 64 représentant le contenu du fichier

(Nom de fichier)
SplittedFile.SplitFileName string

Chaîne contenant le nom de fichier généré

(Numéro de page)
SplittedFile.pageNumber string

Plage de pages contenant le numéro de page où l’extraction s’est produite

ApiGetTextValueJsonResponse

Nom Chemin d’accès Type Description
Message d'erreur
ErrorMessage string

Si la valeur Is Successful est false, nous retournerons un message d’erreur

Réussite
IsSuccessful boolean

Si le texte a été mis en correspondance avec succès

Informations de licence
LicenceInfo string

Informations sur votre clé d’abonnement API

Résultat du texte
TextResult string

Chaîne générée à partir de l’application du texte extrait au modèle de résultat de texte fourni. Notez que si le nombre de pages est supérieur à un, il concatène toutes les pages à l’aide du séparateur de page.

Results
TextResults array of object

Tableau contenant une liste de pages et les valeurs de texte extraites

(Numéro de page)
TextResults.pageNumber string

Page où le texte a été trouvé

(Texte de la page)
TextResults.valueExtracted string

Chaîne générée à partir de l’application du texte extrait au modèle de résultat de texte fourni.

(Valeurs de zone)
TextResults.zoneValues array of string

Tableau contenant le texte extrait de chaque zone.

ApiRenameByBarcodePost200ApplicationJsonResponse

Nom Chemin d’accès Type Description
Code-barres
BarcodeResult string

Chaîne générée à partir de l’application du texte extrait au modèle de résultat du code-barres fourni. Notez que si le nombre de pages est supérieur à un, il concatène toutes les pages à l’aide du séparateur de page.

Results
BarcodeResults array of object

Tableau contenant une liste de pages et les valeurs de code-barres extraites

(Numéro de page)
BarcodeResults.pageNumber string

Page où le code-barres a été trouvé

(Code-barres de page)
BarcodeResults.valueExtracted string

Chaîne générée à partir de l’application de la valeur de code-barres extraite au modèle de résultat de code-barres fourni.

(Valeurs de zone)
BarcodeResults.zoneValues array of string

Tableau contenant le code-barres extrait de chaque zone.

Message d'erreur
ErrorMessage string

Si la valeur Is Successful est false, nous retournerons un message d’erreur

Réussite
IsSuccessful boolean

Si un code-barres a été détecté

Informations de licence
LicenceInfo string

Informations sur votre clé d’abonnement API

ApiSplitPost200ApplicationJsonResponse

Nom Chemin d’accès Type Description
Message d'erreur
ErrorMessage string

Si la valeur Is Successful est false, nous retournerons un message d’erreur

Réussite
IsSuccessful boolean

Cela retourne true si au moins une page fractionnée a été mise en correspondance.

Informations de licence
LicenceInfo string

Informations sur votre clé d’abonnement API

Fractionner les fichiers de sortie
SplittedFile array of object

Tableau contenant chacun des fichiers fractionnés avec des détails tels que le nom de fichier généré et le numéro de page.

(Contenu du fichier)
SplittedFile.SplitFileContent byte

Chaîne de base 64 représentant le contenu du fichier

(Nom de fichier)
SplittedFile.SplitFileName string

Chaîne contenant le nom de fichier généré

(Plage de pages)
SplittedFile.pageNumber string

Plage de pages contenant les numéros de page de l’opération de fractionnement

GetPDFInfoResponse

Nom Chemin d’accès Type Description
Autoriser l’assembly
AllowAssembly boolean

Autoriser la rotation, l’insertion ou la suppression de pages.

Autoriser l’impression détériorée
AllowDegradedPrinting boolean

Autorisez l’impression de faible qualité.

Autoriser l’extraction du contenu
AllowExtractContents boolean

Autoriser l’extraction de texte et de graphiques.

Autoriser l’extraction pour l’accessibilité
AllowExtractForAccessibility boolean

Autoriser l’extraction de texte et de graphiques en prise en charge de l’accessibilité.

Autoriser le remplissage du formulaire
AllowFillInForm boolean

Autoriser le remplissage des champs de formulaire.

Autoriser la modification des annotations
AllowModifyAnnotations boolean

Autoriser la modification des annotations.

Autoriser la modification du contenu
AllowModifyContents boolean

Autoriser la modification du contenu.

Autoriser l’impression
AllowPrinting boolean

Autorisez l’impression de haute qualité.

Auteur
Author string

Qui a créé le document.

Date de création
CreationDate string

Il s’agit de la date et de l’heure de création du fichier PDF.

Créateur
Creator string

Application ou bibliothèque d’origine.

Message d'erreur
ErrorMessage string

Si la valeur Is Successful est false, nous retournerons un message d’erreur

Taille du fichier (octets)
FileSize number

Taille du fichier en octets

Contient du texte masqué
HasHiddenText boolean

Cela retourne true si le fichier PDF a une couche OCR.

Est chiffré
IsEncrypted boolean

Cela retourne true si ce document est chiffré ou non.

Peut faire l’objet d’une recherche
IsSearchable boolean

Cette propriété retourne true si le fichier PDF peut faire l’objet d’une recherche.

Réussite
IsSuccessful boolean

Retourne true si l’action a réussi.

Mots clés
Keywords string

Les mots clés peuvent être séparés par des virgules.

Informations de licence
LicenceInfo string

Résumé json du quota de votre abonnement.

Date de modification
ModifiedDate string

Cette propriété représente la date et l’heure de la dernière modification du fichier PDF

Nombre de pages
NumberofPages integer

Nombre de pages dans le fichier PDF.

PDF Version
PDFversion number

La version de la spécification PDF sur le document a été générée.

Producer
Producer string

Produit qui a créé le fichier PDF. Dans les premiers jours de pdf, les utilisateurs utiliseraient une application Creator comme Microsoft Word pour écrire un document, l’imprimer dans un fichier PostScript, puis le producteur serait Acrobat Distill, l’application qui a converti le fichier PostScript en pdf. Aujourd’hui Créateur et Producteur sont souvent identiques ou un champ est laissé vide.

Sujet
Subject string

À propos du document.

Titre
Title string

Titre du document.

Attrapé
Trapped string

Cette propriété est une valeur booléenne qui indique si le document a été piégé. Le piège est un processus de pré-presse qui introduit des zones de couleur dans les séparations de couleurs afin d’obscurcir les erreurs potentielles d’enregistrement.

Métadonnées XMP
XmpMetadata string

La plateforme de métadonnées extensible (XMP) est une norme ISO, créée à l’origine par Adobe Systems Inc., pour la création, le traitement et l’échange de métadonnées standardisées et personnalisées pour les documents numériques et les jeux de données.

ocr_response

Données de réponse pour l’opération OCR

Nom Chemin d’accès Type Description
Message d'erreur
ErrorMessage string

Si la valeur Is Successful est false, nous retournerons un message d’erreur

Réussite
IsSuccessful boolean

Retourne true si l’OCR a réussi.

Informations de licence
LicenceInfo string

Informations sur votre clé d’abonnement API

Contenu du fichier journal
LogFileContent byte

Contenu du journal de l’opération

Contenu du fichier traité
OutputFileContent byte

Fichier généré par le convertisseur PDF Aquaforest.