Aquaforest PDF
Le connecteur PDF Aquaforest contient un groupe d’actions qui effectuent différentes opérations PDF telles que le fractionnement, l’extraction de texte, l’extraction de codes-barres et les opérations OCR pour Office 365 et Power Automate.
Ce connecteur est disponible dans les produits et régions suivants :
| Service | classe | Régions |
|---|---|---|
| Copilot Studio | Premium | Toutes les régions Power Automate , à l’exception des éléments suivants : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD) |
| Applications logiques | Norme | Toutes les régions Logic Apps , à l’exception des suivantes : - Régions Azure Government - Régions Azure Chine - Us Department of Defense (DoD) |
| Power Apps | Premium | Toutes les régions Power Apps , à l’exception des suivantes : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD) |
| Power Automate | Premium | Toutes les régions Power Automate , à l’exception des éléments suivants : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD) |
| Contact | |
|---|---|
| Nom | Prise en charge d’Aquaforest |
| URL | https://www.aquaforest.com/en/aquaforest-flow-doc.asp |
| Messagerie électronique | support@aquaforest.com |
| Métadonnées du connecteur | |
|---|---|
| Éditeur | Aquaforest Limited |
| Site internet | https://www.aquaforest.com/en/aquaforest-connector.asp |
| Politique de confidentialité | https://www.aquaforest.com/en/privacy policy.pdf |
| Catégories | Contenu et fichiers ; Données |
Le connecteur PDF Aquaforest contient un groupe d’actions qui effectuent différentes opérations PDF telles que le fractionnement, l’extraction de texte, l’extraction de codes-barres et les opérations OCR pour Office 365 et Flow.
Prerequisites
Tout d’abord, vous devez créer un compte d’API PDF Aquaforest. Ce compte est utilisé pour gérer les actions PDF Aquaforest et l’API PDF Aquaforest. Utilisez votre adresse e-mail active, car l’abonnement sera lié à cette adresse. Si vous disposez déjà d’un compte, connectez-vous ici.
Comment obtenir des informations d’identification
Connectez-vous au portail des développeurs, accédez à la page Produits et sélectionnez le produit auquel vous souhaitez vous abonner.

Cliquez sur le bouton S’abonner

Cliquez sur le bouton Confirmer pour confirmer votre demande d’abonnement

Vous pouvez accéder à vos clés API dans votre page Profil

Création d’une connexion
Le connecteur prend en charge les types d’authentification suivants :
| Par défaut | Paramètres de création de connexion. | Toutes les régions | Non partageable |
Faire défaut
Applicable : Toutes les régions
Paramètres de création de connexion.
Cette connexion n’est pas partageable. Si l’application power est partagée avec un autre utilisateur, un autre utilisateur est invité à créer une connexion explicitement.
| Nom | Type | Descriptif | Obligatoire |
|---|---|---|---|
| Clé d’API | securestring | Clé API pour cette API | Vrai |
Limitations
| Nom | Appels | Période de renouvellement |
|---|---|---|
| Appels d’API par connexion | 100 | 60 secondes |
Actions
| Extraire des pages PDF par code-barres |
Extrayez des fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] . |
| Extraire des pages PDF par texte |
Extrayez les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] . |
| Fractionner pdf par code-barres |
Fractionne les fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html]. |
| Fractionner pdf par correspondance de texte |
Fractionne les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html]. |
| Fractionner pdf par page |
Fractionne les fichiers PDF en fonction des options de fractionnement définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. |
| Obtenir des données au format PDF |
Cette action extrait les données importantes des fichiers PDF sous la forme de paires Clé/Valeur. |
| Obtenir du texte au format PDF |
Obtenez du texte à partir de fichiers PDF en fonction de l’emplacement du texte et des expressions régulières. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] . |
| Obtenir la valeur du code-barres |
Obtenir le code-barres à partir du PDF. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] . |
| Obtenir les propriétés PDF |
Obtient les informations relatives à un fichier PDF |
| OCR PDF ou images |
Générez un FICHIER PDF pouvant faire l’objet d’une recherche à partir d’une image PDF ou d’images numérisées. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] . |
Extraire des pages PDF par code-barres
Extrayez des fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source |
|
Modèle de nom de fichier
|
fileNameTemplate | True | string |
Modèle pour le fichier de sortie si le code-barres est trouvé |
|
Aucun modèle de fichier
|
noTextFileName | True | string |
Modèle pour le fichier de sortie si aucun code-barres n’est trouvé |
|
Nom du fichier
|
sourceFileName | True | string |
Nom du fichier source |
|
Type
|
barcodeFormats | array of string |
Spécifier les types de codes-barres que vous souhaitez identifier |
|
|
Emplacement
|
location | True | string |
Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Motif
|
regex | string |
Si une expression régulière est fournie ici, nous allons correspondre à n’importe quel code-barres extrait et retourner la correspondance. |
Retours
Extraire des pages PDF par texte
Extrayez les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source |
|
Modèle de nom de fichier
|
fileNameTemplate | True | string |
Modèle pour le fichier de sortie si les correspondances de texte sont trouvées |
|
Aucun modèle de fichier
|
noTextFileName | True | string |
Modèle pour le fichier de sortie si aucune correspondance de texte n’est trouvée |
|
Nom du fichier
|
sourceFileName | True | string |
Nom du fichier source |
|
Valeur
|
expression | array of string |
Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus. |
|
|
Emplacement
|
location | True | string |
Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Sélectionnez
|
position | string |
Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins |
|
|
Motif
|
regex | string |
Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance. |
Retours
Fractionner pdf par code-barres
Fractionne les fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source |
|
Modèle de nom de fichier
|
fileNameTemplate | True | string |
Modèle pour le fichier de sortie si le code-barres est trouvé |
|
Pages sans correspondance
|
noMatch | string |
Selon l’option fractionnée que vous choisissez ci-dessus, certaines pages n’ont aucune valeur de code-barres. Choisissez ce qu’il faut faire dans ces pages. |
|
|
Aucun modèle de correspondance de code-barres
|
noTextFileName | True | string |
Modèle pour le fichier de sortie si aucun code-barres n’est trouvé |
|
Nom du fichier
|
sourceFileName | True | string |
Nom du fichier source |
|
Options de fichier de sortie
|
splitOption | string |
Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins |
|
|
Type
|
barcodeFormats | array of string |
Spécifier les types de codes-barres que vous souhaitez identifier |
|
|
Emplacement
|
location | True | string |
Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Motif
|
regex | string |
Si une expression régulière est fournie ici, nous allons correspondre à n’importe quel code-barres extrait et retourner la correspondance. |
Retours
Fractionner pdf par correspondance de texte
Fractionne les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source |
|
Modèle de nom de fichier
|
fileNameTemplate | True | string |
Modèle pour le fichier de sortie si les correspondances de texte sont trouvées |
|
Pages sans correspondance
|
noMatch | string |
Selon l’option fractionnée que vous choisissez ci-dessus, certaines pages n’ont aucune valeur de texte extraite. Choisissez ce qu’il faut faire dans ces pages. |
|
|
Aucun modèle de fichier
|
noTextFileName | True | string |
Modèle pour le fichier de sortie si aucune correspondance de texte n’est trouvée |
|
Nom du fichier
|
sourceFileName | True | string |
Nom du fichier source |
|
Options de fichier de sortie
|
splitOption | string |
Choisissez l’emplacement de la page avec le code-barres dans les fichiers de sortie de l’opération de fractionnement. |
|
|
Valeur
|
expression | array of string |
Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus. |
|
|
Emplacement
|
location | True | string |
Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Sélectionnez
|
position | string |
Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins |
|
|
Motif
|
regex | string |
Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance. |
Retours
Fractionner pdf par page
Fractionne les fichiers PDF en fonction des options de fractionnement définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation.
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source. |
|
Nom du fichier de sortie
|
fileNameTemplate | True | string |
Modèle de fichier cible qui peut inclure %UNIQUEn (nombre unique commençant à 1, zéro rembourré sur n chiffres) et %FILENAME (nom de fichier d’origine sans l’extension). |
|
Nom du fichier
|
sourceFileName | True | string |
Nom du fichier source. |
|
Type de fractionnement
|
splitOption | True | string |
Choisissez l’opération de fractionnement à utiliser pour chaque fichier. |
|
Plage de pages
|
pageRange | string |
Ensemble de plages de pages séparées par des virgules qui définissent les pages de l’original à extraire. |
|
|
Répéter toutes les
|
repeatEvery | integer |
Appliquez la plage de pages à chaque ensemble de pages Plages de pages dans le document. Par exemple, si 2 à 4 est spécifié pour les plages de pages et que 4 sont spécifiés comme plage répétée, la plage est réapppliquée toutes les 4 pages. |
|
|
Conserver les signets
|
retainBookmarks | boolean |
Les fichiers générés incluent des signets à partir du fichier d’origine. |
|
|
Conserver les métadonnées
|
retainMetadata | boolean |
Les fichiers générés incluent des métadonnées (telles que l’auteur et le titre) à partir du fichier d’origine. |
Retours
Obtenir des données au format PDF
Cette action extrait les données importantes des fichiers PDF sous la forme de paires Clé/Valeur.
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Nom
|
settingName | True | string |
Entrez le nom du paramètre ici |
|
Valeur
|
settingValue | True | string |
Entrez la valeur du paramètre ici. |
|
Score de confiance
|
confidenceScore | number |
Définissez un score de confiance plus élevé pour filtrer les valeurs avec une confiance inférieure. Vous pouvez définir n’importe quelle valeur comprise entre 0 et 1. Nous vous recommandons de commencer à partir de la version 0.5 |
|
|
Date Conversion
|
dateAsISO | string |
Sélectionnez le format à renvoyer comme valeur de date |
|
|
Clés attendues
|
expectedKeys | string |
Fournissez un nom de clé par ligne pour rendre les valeurs disponibles pour les actions ultérieures sans analyser JSON. |
|
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source |
|
Limite de page
|
pageLimit | integer |
Nombre maximal de pages à traiter |
|
|
Plage de pages
|
pageRange | string |
Représentation sous forme de chaîne des numéros de page que vous souhaitez traiter. Par exemple, 1,3-4 |
|
|
Symbole monétaire de bande
|
stripCurrencySymbol | boolean |
Définissez cette valeur sur true si vous souhaitez que les symboles et les chaînes soient supprimés avant de retourner des valeurs monétaires |
|
|
Synonyme de correspondance
|
synonym | boolean |
Définissez cette valeur sur true si vous souhaitez que nous renvoyions toutes les clés synonymes de la clé attendue. |
|
|
Dictionnaire de synonymes
|
synonymDictionary | string |
Vous pouvez fournir un tableau JSON d’objets « entry », où chaque objet contient une liste de synonymes dans un tableau. Par exemple, si vous souhaitez que « Facture Non » et « Numéro de facture » (sans respect de la casse) soient interprétés comme la même clé, utilisez le code JSON suivant : [{'entry' : [ 'Invoice No', 'invoice number' ]}] |
|
|
Découper les symboles
|
trimSymbols | boolean |
Définissez cette valeur sur true si vous souhaitez que nous supprimions tous les symboles de début et de fin des clés trouvées avant de les mettre en correspondance avec une clé attendue. |
Retours
Obtenir du texte au format PDF
Obtenez du texte à partir de fichiers PDF en fonction de l’emplacement du texte et des expressions régulières. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source |
|
Aucun modèle de correspondance de texte
|
noTextTemplate | True | string |
Modèle pour le texte à renvoyer si une correspondance est introuvable |
|
Séparateur de page
|
pageSeparator | string |
Fournissez un séparateur de page pour vous permettre de savoir où se trouvent les sauts de page. |
|
|
Feuilles
|
pagerange | string |
Fournissez une plage de pages à partir de laquelle vous souhaitez extraire du texte, il peut s’agir d’un numéro de page unique (1), de numéros de page multiples séparés par des virgules (1,2,3), d’une plage de pages (1 à 4) ou d’un mélange de tous (1,2,4-7). |
|
|
Nom du fichier
|
sourceFileName | True | string |
Nom du fichier source |
|
Modèle de résultat de texte
|
textResultTemplate | True | string |
Modèle pour le texte à renvoyer si une correspondance est trouvée |
|
Valeur
|
expression | array of string |
Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus. |
|
|
Emplacement
|
location | True | string |
Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Page (déconseillée)
|
pagenumber | integer |
Cette propriété est déconseillée, nous vous conseillons d’utiliser la propriété Pages. La propriété Pages s’applique à toutes les zones et vous permet de sélectionner les pages que vous souhaitez traiter. |
|
|
Sélectionnez
|
position | string |
Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins |
|
|
Motif
|
regex | string |
Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance. |
Retours
Obtenir la valeur du code-barres
Obtenir le code-barres à partir du PDF. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Modèle de résultat du code-barres
|
barcodeResultTemplate | True | string |
Modèle pour le résultat du texte de sortie si un code-barres est trouvé |
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source |
|
Aucun modèle de code-barres
|
noBarcodeTemplate | True | string |
Modèle pour le résultat du texte de sortie si aucun code-barres n’est trouvé |
|
Séparateur de page
|
pageSeparator | string |
Fournissez un séparateur de page pour vous permettre de savoir où se trouvent les sauts de page. |
|
|
Feuilles
|
pagerange | string |
Fournissez une plage de pages à partir de laquelle vous souhaitez extraire du texte, il peut s’agir d’un numéro de page unique (1), de numéros de page multiples séparés par des virgules (1,2,3), d’une plage de pages (1 à 4) ou d’un mélange de tous (1,2,4-7). |
|
|
Nom du fichier
|
sourceFileName | True | string |
Nom du fichier source |
|
Type
|
barcodeFormats | array of string |
Spécifier les types de codes-barres que vous souhaitez identifier |
|
|
Emplacement
|
location | True | string |
Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html] |
|
Page (déconseillée)
|
pagenumber | integer |
Cette propriété est déconseillée, nous vous conseillons d’utiliser la propriété Pages. La propriété Pages s’applique à toutes les zones et vous permet de sélectionner les pages que vous souhaitez traiter. |
|
|
Motif
|
regex | string |
Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance. |
Retours
Obtenir les propriétés PDF
Obtient les informations relatives à un fichier PDF
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
Contenu du fichier
|
fileContent | True | byte |
Contenu du fichier source |
|
Limite de page
|
pageLimit | integer |
Nombre maximal de pages à traiter, il est utilisé uniquement pour vérifier si les pages contiennent du texte masqué ou si le fichier PDF peut faire l’objet d’une recherche |
Retours
- Corps
- GetPDFInfoResponse
OCR PDF ou images
Générez un FICHIER PDF pouvant faire l’objet d’une recherche à partir d’une image PDF ou d’images numérisées. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Paramètres
| Nom | Clé | Obligatoire | Type | Description |
|---|---|---|---|---|
|
AquaforestImageTimeout
|
aquaforestImageTimeout | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Auteur
|
author | string |
Définissez un auteur personnalisé dans les propriétés de document PDF de sortie. |
|
|
Rotation automatique
|
autorotate | boolean |
Rotation automatique de l’image : cela garantit que tout le texte est orienté normalement |
|
|
Binarize
|
binarize | integer |
Cette valeur ne doit généralement être utilisée que dans le cadre d’instructions du support technique. Il peut contrôler la façon dont les images de couleur sont traitées et forcent la binarisation avec un seuil particulier. Une valeur de 200 a été montrée pour donner généralement de bons résultats dans les tests, mais cela devrait être confirmé avec des documents clients « typiques ». En affectant cette valeur à -1 une autre méthode est utilisée pour séparer le texte de toutes les images ou couleurs d’arrière-plan. Cela peut donner des résultats OCR améliorés pour certains documents tels que les journaux et les pages de magazines. |
|
|
Limite de pixels noirs
|
blackPixelLimit | float |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Seuil de page vide
|
blankPageThreshold | integer |
Utilisez cette option pour définir le nombre minimal de « Sur pixels » qui doivent être présents dans l’image pour qu’une page ne soit pas considérée comme vide. Une valeur de -1 désactive la détection de page vide. |
|
|
Taille de la boîte
|
boxSize | integer |
Cette option est idéale pour les formulaires où parfois des zones autour du texte peuvent entraîner l’identification d’une zone en tant que graphiques. Cette option supprime les zones de la copie temporaire de l’image utilisée par le moteur OCR. Elle ne supprime pas les zones de l’image finale. Techniquement, cette option supprime les éléments connectés avec une zone minimale (en pixels et défini par cette propriété). Cette option est actuellement appliquée uniquement pour les images bi-tonales. |
|
|
ConvertToTiff
|
convertToTiff | boolean |
Chaque page du document PDF est ratérisée dans une image TIFF. |
|
|
CreateProcess
|
createProcess | boolean |
Définissez cette valeur sur true si vous souhaitez lancer le processus via pinvoke. |
|
|
Date de création
|
creationDate | string |
Définissez une date de création personnalisée dans les propriétés du document PDF de sortie. La chaîne de date doit être au format 'aaaa-MM-jj HH :mm :ss'. |
|
|
Deskew
|
deskew | boolean |
Deskew (redresser) l’image. |
|
|
Déspeckle
|
despeckle | integer |
Cela supprime tous les éléments déconnectés de l’image dont la hauteur ou la largeur est inférieure à la figure spécifiée. La valeur maximale est 9 et la valeur par défaut est 0. |
|
|
DictionaryLookup
|
dictionaryLookup | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Dotmatrix
|
dotmatrix | boolean |
Définissez cette valeur sur true pour améliorer la reconnaissance des polices de matrice de points. La valeur par défaut est False. Si la valeur est true pour les polices non matricielles, la reconnaissance peut être médiocre. |
|
|
Activer la sortie de débogage
|
enableDebugOutput | boolean |
Active la sortie de débogage. |
|
|
Compresser pdf (MRC)
|
enableMrc | boolean |
Cela permet la compression raster mixte qui peut réduire considérablement la taille de sortie des fichiers PDF comprenant des analyses de couleurs. Notez que cette option convient uniquement lorsque la source n’est pas un fichier PDF ou utilise ConvertToTiff. |
|
|
Sortie PDF/A
|
enablePDFAOutput | boolean |
Indique si la sortie doit être au format PDF/A. |
|
|
Mode d’erreur
|
errorMode | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Contenu du fichier source
|
fileContent | True | byte |
Contenu du fichier en OCR |
|
Nom de fichier source avec extension
|
fileNameWithExtension | True | string |
Nom du fichier source avec extension ou simplement l’extension (avec une période de début '.') |
|
Retourner détecter
|
flipDetect | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Qualité des nuances de gris
|
grayscaleQuality | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Heuristique
|
heuristics | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Jbig2EncFlags
|
jbig2EncFlags | string |
Il s’agit des indicateurs qui seront transmis à l’application utilisée pour générer des versions JBIG2 d’images utilisées dans la génération PDF (en supposant que cette compression est activée). Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique. |
|
|
Language
|
language | enum |
La sélection de l’une des options ci-dessous définit la langue à utiliser pour le traitement OCR. La langue par défaut est l'anglais. |
|
|
LibTiffSavePageAsBmp
|
libTiffSavePageAsBmp | boolean |
Parfois, s’il existe une image qui est 1bpp et a la compression LZW, le prétraitement peut provoquer l’invertir de l’image (noir à blanc et blanc à noir). Définissez cette valeur sur true pour éviter cela. |
|
|
Maximum deskew
|
maxDeskew | float |
Angle maximal par lequel une page sera mise à jour. Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique (support@aquaforest.com). |
|
|
Confiance minimale du bureau
|
minDeskewConfidence | float |
Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique (support@aquaforest.com). |
|
|
Date de modification
|
modifiedDate | string |
Définissez une date de modification personnalisée dans les propriétés du document PDF de sortie. La chaîne de date doit être au format 'aaaa-MM-jj HH :mm :ss'. |
|
|
Morphe
|
morph | string |
Options morphologiques qui seront appliquées à l’image binarisée avant OCR. Si la valeur est vide, aucune n’est appliquée. Les options courantes incluent celles répertoriées ci-dessous, mais pour plus d’options, veuillez contacter support@aquaforest.com. |
|
|
MrcBackgroundFactor
|
mrcBackgroundFactor | integer |
Taille d’échantillonnage pour la partie d’arrière-plan de l’image. Plus le nombre est élevé, plus la taille des blocs d’image est élevée pour la moyenne, ce qui entraînera une réduction de la taille, mais aussi de la qualité. La valeur par défaut est 3 |
|
|
MrcForegroundFactor
|
mrcForegroundFactor | integer |
Taille d’échantillonnage pour la partie de premier plan de l’image. Plus le nombre est élevé, plus la taille des blocs d’image est élevée pour la moyenne, ce qui entraînera une réduction de la taille, mais aussi de la qualité. La valeur par défaut est 3 |
|
|
MrcQuality
|
mrcQuality | integer |
Paramètre de qualité JPEG (valeur de pourcentage 1 à 100) à utiliser pour enregistrer l’arrière-plan et les images de premier plan. La valeur par défaut est 75 |
|
|
MrcTimeout
|
mrcTimeout | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
NoPictures
|
noPictures | boolean |
Par défaut, si une zone du document est identifiée comme une zone graphique, aucun traitement OCR n’est exécuté sur cette zone. Toutefois, certains documents peuvent inclure des zones ou des zones identifiées comme des zones « graphique » ou « image », mais qui contiennent effectivement du texte utile. La définition de NoPictures sur True l’entraîne à ignorer les zones identifiées en tant qu’images tout en la définissant sur False force l’OCR des zones identifiées comme des images. |
|
|
OcrProcessSetupTimeout
|
ocrProcessSetupTimeout | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
OcrTimeout
|
ocrTimeout | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Mot de passe
|
password | string |
Mot de passe pour ouvrir le fichier PDF source |
|
|
PdfToImageBpp
|
pdfToImageBpp | enum |
Bits par pixel à utiliser pour la page PDF ratérisée lors de l’utilisation du moteur 1. Cela s’applique uniquement aux documents traités à l’aide de ConvertToTiff. La valeur par défaut de cette propriété est extraite de la page PDF. |
|
|
PdfToImageCompression
|
pdfToImageCompression | enum |
Compression à définir sur les images extraites ou ratérisées de chaque page du fichier PDF source. Ces images sont ensuite OCRed pour créer le PDF pouvant faire l’objet d’une recherche. La valeur par défaut de cette propriété est extraite de chaque page du fichier PDF source. |
|
|
PdfToImageDpi
|
pdfToImageDpi | enum |
Ppp à définir sur les images ratérisées à partir de chaque page du fichier PDF source. Ces images sont ensuite OCRed pour créer le PDF pouvant faire l’objet d’une recherche. La valeur par défaut de cette propriété est extraite de chaque page du fichier PDF source. |
|
|
PdfToImageForceVectorCheck
|
pdfToImageForceVectorCheck | boolean |
Ce paramètre est utile lorsque vous traitez des documents qui contiennent des objets vectoriels (par exemple, des dessins CAO). Par défaut, les pages qui contiennent uniquement des objets vectoriels sont ratérisées. Les pages qui n’ont pas d’images, mais contiennent des objets vectoriels ainsi que du texte électronique sont ignorées de la rastérisation. Toutefois, il peut parfois y avoir une page qui contient des objets vectoriels (dessins CAO), mais son titre peut être en texte électronique. Pour forcer la rastérisation des pages comme celles-ci, définissez cette propriété sur true. |
|
|
PdfToImageIncludeText
|
pdfToImageIncludeText | boolean |
Lorsqu’il est défini sur False, cela empêche la conversion de texte réel (par exemple, générée électroniquement par opposition au texte qui fait partie d’une image numérisée) d’être restituée dans les images de page extraites du PDF. Cela est dû au fait que le texte est déjà pouvant faire l’objet d’une recherche et ne nécessite généralement pas d’OCR. La valeur peut être définie sur True toutefois si l’OCR est requis sur ce texte réel. |
|
|
PdfToImageMaxRes
|
pdfToImageMaxRes | integer |
Résolution maximale des images ratérisées. Si la résolution récupérée à partir de la page PDF est supérieure à cette valeur, elle est définie sur cette valeur. La valeur par défaut de cette propriété est 600. |
|
|
PdfToImageMinRes
|
pdfToImageMinRes | integer |
Résolution minimale des images ratérisées. Si la résolution récupérée à partir de la page PDF est inférieure à cette valeur, elle est définie sur cette valeur. La valeur par défaut de cette propriété est 200. |
|
|
PDF/A Version
|
pdfaVersion | enum |
Version PDF/A. |
|
|
PipeClientConnectionTimeout
|
pipeClientConnectionTimeout | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
RemoveBlankPage
|
removeBlankPage | boolean |
Supprimez les pages vides lorsque BlankPageThreshold est supérieur à -1 et ConvertToTiff a la valeur true. |
|
|
RemoveLines
|
removeLines | boolean |
Supprimez les lignes des images fpr pour une meilleure reconnaissance. |
|
|
RestartEngineEvery
|
restartEngineEvery | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Conserver les signets
|
retainBookmarks | boolean |
Conserve tous les signets du fichier source dans la sortie lors de l’utilisation de ConvertToTiff. |
|
|
Conserver la date de création
|
retainCreationDate | boolean |
Conserve la date de création du fichier source dans les propriétés du document PDF de sortie. |
|
|
Conserver les métadonnées
|
retainMetadata | boolean |
Conserve les métadonnées du fichier source dans la sortie lors de l’utilisation de ConvertToTiff. |
|
|
Conserver la date de modification
|
retainModifiedDate | boolean |
Conserve la date de modification du fichier source dans les propriétés du document PDF de sortie. |
|
|
Conserver les préférences de visionneuse
|
retainViewerPreferences | boolean |
Conserve les préférences de visionneuse PDF, le mode page et la mise en page à partir du fichier source dans la sortie lors de l’utilisation de ConvertToTiff. |
|
|
SavePredespeckle
|
savePredespeckle | boolean |
Cela utilise l’image d’origine (c’est-à-dire avant d’appliquer le prétraitement) dans le fichier PDF de sortie. |
|
|
Tables
|
tables | boolean |
Cette option lorsqu’elle est définie sur true, tente d’ocr dans les cellules du tableau. |
|
|
TextLayerFilterHeight
|
textLayerFilterHeight | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
TextLayerFilterHeightInverted
|
textLayerFilterHeightInverted | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
TextLayerFilterPercentage
|
textLayerFilterPercentage | float |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
TextLayerFilterPercentageInverted
|
textLayerFilterPercentageInverted | float |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
TextLayerFilterRatio
|
textLayerFilterRatio | float |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
TextLayerFilterRatioInverted
|
textLayerFilterRatioInverted | float |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
TextLayerFilterWidth
|
textLayerFilterWidth | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
TextLayerFilterWidthInverted
|
textLayerFilterWidthInverted | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
TextLayerMaxBoxes
|
textLayerMaxBoxes | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Mode tidy-up
|
tidyUpMode | integer |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
|
|
Valider PDF/A
|
validatePDFA | boolean |
Indique si le document PDF/A doit être validé après la conversion |
|
|
Seuil de correspondance word
|
wordMatchThreshold | float |
Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété. |
Retours
Données de réponse pour l’opération OCR
- Corps
- ocr_response
Définitions
ApiExtractPost200ApplicationJsonResponse
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
Erreur
|
ErrorMessage | string |
Si la valeur Is Successful est false, nous retournerons un message d’erreur |
|
Réussite
|
IsSuccessful | boolean |
Cela retourne true si au moins une page a été extraite |
|
Informations de licence
|
LicenceInfo | string |
Informations sur votre clé d’abonnement API |
|
Extraire des fichiers de sortie
|
SplittedFile | array of object |
Tableau de fichiers extraits |
|
(Contenu du fichier)
|
SplittedFile.SplitFileContent | byte |
Chaîne de base 64 représentant le contenu du fichier |
|
(Nom de fichier)
|
SplittedFile.SplitFileName | string |
Chaîne contenant le nom de fichier généré |
|
(Numéro de page)
|
SplittedFile.pageNumber | string |
Plage de pages contenant le numéro de page où l’extraction s’est produite |
ApiGetTextValueJsonResponse
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
Message d'erreur
|
ErrorMessage | string |
Si la valeur Is Successful est false, nous retournerons un message d’erreur |
|
Réussite
|
IsSuccessful | boolean |
Si le texte a été mis en correspondance avec succès |
|
Informations de licence
|
LicenceInfo | string |
Informations sur votre clé d’abonnement API |
|
Résultat du texte
|
TextResult | string |
Chaîne générée à partir de l’application du texte extrait au modèle de résultat de texte fourni. Notez que si le nombre de pages est supérieur à un, il concatène toutes les pages à l’aide du séparateur de page. |
|
Results
|
TextResults | array of object |
Tableau contenant une liste de pages et les valeurs de texte extraites |
|
(Numéro de page)
|
TextResults.pageNumber | string |
Page où le texte a été trouvé |
|
(Texte de la page)
|
TextResults.valueExtracted | string |
Chaîne générée à partir de l’application du texte extrait au modèle de résultat de texte fourni. |
|
(Valeurs de zone)
|
TextResults.zoneValues | array of string |
Tableau contenant le texte extrait de chaque zone. |
ApiRenameByBarcodePost200ApplicationJsonResponse
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
Code-barres
|
BarcodeResult | string |
Chaîne générée à partir de l’application du texte extrait au modèle de résultat du code-barres fourni. Notez que si le nombre de pages est supérieur à un, il concatène toutes les pages à l’aide du séparateur de page. |
|
Results
|
BarcodeResults | array of object |
Tableau contenant une liste de pages et les valeurs de code-barres extraites |
|
(Numéro de page)
|
BarcodeResults.pageNumber | string |
Page où le code-barres a été trouvé |
|
(Code-barres de page)
|
BarcodeResults.valueExtracted | string |
Chaîne générée à partir de l’application de la valeur de code-barres extraite au modèle de résultat de code-barres fourni. |
|
(Valeurs de zone)
|
BarcodeResults.zoneValues | array of string |
Tableau contenant le code-barres extrait de chaque zone. |
|
Message d'erreur
|
ErrorMessage | string |
Si la valeur Is Successful est false, nous retournerons un message d’erreur |
|
Réussite
|
IsSuccessful | boolean |
Si un code-barres a été détecté |
|
Informations de licence
|
LicenceInfo | string |
Informations sur votre clé d’abonnement API |
ApiSplitPost200ApplicationJsonResponse
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
Message d'erreur
|
ErrorMessage | string |
Si la valeur Is Successful est false, nous retournerons un message d’erreur |
|
Réussite
|
IsSuccessful | boolean |
Cela retourne true si au moins une page fractionnée a été mise en correspondance. |
|
Informations de licence
|
LicenceInfo | string |
Informations sur votre clé d’abonnement API |
|
Fractionner les fichiers de sortie
|
SplittedFile | array of object |
Tableau contenant chacun des fichiers fractionnés avec des détails tels que le nom de fichier généré et le numéro de page. |
|
(Contenu du fichier)
|
SplittedFile.SplitFileContent | byte |
Chaîne de base 64 représentant le contenu du fichier |
|
(Nom de fichier)
|
SplittedFile.SplitFileName | string |
Chaîne contenant le nom de fichier généré |
|
(Plage de pages)
|
SplittedFile.pageNumber | string |
Plage de pages contenant les numéros de page de l’opération de fractionnement |
GetPDFInfoResponse
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
Autoriser l’assembly
|
AllowAssembly | boolean |
Autoriser la rotation, l’insertion ou la suppression de pages. |
|
Autoriser l’impression détériorée
|
AllowDegradedPrinting | boolean |
Autorisez l’impression de faible qualité. |
|
Autoriser l’extraction du contenu
|
AllowExtractContents | boolean |
Autoriser l’extraction de texte et de graphiques. |
|
Autoriser l’extraction pour l’accessibilité
|
AllowExtractForAccessibility | boolean |
Autoriser l’extraction de texte et de graphiques en prise en charge de l’accessibilité. |
|
Autoriser le remplissage du formulaire
|
AllowFillInForm | boolean |
Autoriser le remplissage des champs de formulaire. |
|
Autoriser la modification des annotations
|
AllowModifyAnnotations | boolean |
Autoriser la modification des annotations. |
|
Autoriser la modification du contenu
|
AllowModifyContents | boolean |
Autoriser la modification du contenu. |
|
Autoriser l’impression
|
AllowPrinting | boolean |
Autorisez l’impression de haute qualité. |
|
Auteur
|
Author | string |
Qui a créé le document. |
|
Date de création
|
CreationDate | string |
Il s’agit de la date et de l’heure de création du fichier PDF. |
|
Créateur
|
Creator | string |
Application ou bibliothèque d’origine. |
|
Message d'erreur
|
ErrorMessage | string |
Si la valeur Is Successful est false, nous retournerons un message d’erreur |
|
Taille du fichier (octets)
|
FileSize | number |
Taille du fichier en octets |
|
Contient du texte masqué
|
HasHiddenText | boolean |
Cela retourne true si le fichier PDF a une couche OCR. |
|
Est chiffré
|
IsEncrypted | boolean |
Cela retourne true si ce document est chiffré ou non. |
|
Peut faire l’objet d’une recherche
|
IsSearchable | boolean |
Cette propriété retourne true si le fichier PDF peut faire l’objet d’une recherche. |
|
Réussite
|
IsSuccessful | boolean |
Retourne true si l’action a réussi. |
|
Mots clés
|
Keywords | string |
Les mots clés peuvent être séparés par des virgules. |
|
Informations de licence
|
LicenceInfo | string |
Résumé json du quota de votre abonnement. |
|
Date de modification
|
ModifiedDate | string |
Cette propriété représente la date et l’heure de la dernière modification du fichier PDF |
|
Nombre de pages
|
NumberofPages | integer |
Nombre de pages dans le fichier PDF. |
|
PDF Version
|
PDFversion | number |
La version de la spécification PDF sur le document a été générée. |
|
Producer
|
Producer | string |
Produit qui a créé le fichier PDF. Dans les premiers jours de pdf, les utilisateurs utiliseraient une application Creator comme Microsoft Word pour écrire un document, l’imprimer dans un fichier PostScript, puis le producteur serait Acrobat Distill, l’application qui a converti le fichier PostScript en pdf. Aujourd’hui Créateur et Producteur sont souvent identiques ou un champ est laissé vide. |
|
Sujet
|
Subject | string |
À propos du document. |
|
Titre
|
Title | string |
Titre du document. |
|
Attrapé
|
Trapped | string |
Cette propriété est une valeur booléenne qui indique si le document a été piégé. Le piège est un processus de pré-presse qui introduit des zones de couleur dans les séparations de couleurs afin d’obscurcir les erreurs potentielles d’enregistrement. |
|
Métadonnées XMP
|
XmpMetadata | string |
La plateforme de métadonnées extensible (XMP) est une norme ISO, créée à l’origine par Adobe Systems Inc., pour la création, le traitement et l’échange de métadonnées standardisées et personnalisées pour les documents numériques et les jeux de données. |
ocr_response
Données de réponse pour l’opération OCR
| Nom | Chemin d’accès | Type | Description |
|---|---|---|---|
|
Message d'erreur
|
ErrorMessage | string |
Si la valeur Is Successful est false, nous retournerons un message d’erreur |
|
Réussite
|
IsSuccessful | boolean |
Retourne true si l’OCR a réussi. |
|
Informations de licence
|
LicenceInfo | string |
Informations sur votre clé d’abonnement API |
|
Contenu du fichier journal
|
LogFileContent | byte |
Contenu du journal de l’opération |
|
Contenu du fichier traité
|
OutputFileContent | byte |
Fichier généré par le convertisseur PDF Aquaforest. |