Aquaforest PDF

Le connecteur PDF Aquaforest contient un groupe d’actions qui effectuent différentes opérations PDF telles que le fractionnement, l’extraction de texte, l’extraction de codes-barres et les opérations OCR pour Office 365 et Power Automate.

Ce connecteur est disponible dans les produits et régions suivants :

Service	classe	Régions
Copilot Studio	Premium	Toutes les régions Power Automate , à l’exception des éléments suivants : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD)
Applications logiques	Norme	Toutes les régions Logic Apps , à l’exception des suivantes : - Régions Azure Government - Régions Azure Chine - Us Department of Defense (DoD)
Power Apps	Premium	Toutes les régions Power Apps , à l’exception des suivantes : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD)
Power Automate	Premium	Toutes les régions Power Automate , à l’exception des éléments suivants : - Us Government (GCC) - Us Government (GCC High) - China Cloud géré par 21Vianet - Us Department of Defense (DoD)

Contact
Nom	Prise en charge d’Aquaforest
URL	https://www.aquaforest.com/en/aquaforest-flow-doc.asp
Messagerie électronique	support@aquaforest.com

Métadonnées du connecteur
Éditeur	Aquaforest Limited
Site internet	https://www.aquaforest.com/en/aquaforest-connector.asp
Politique de confidentialité	https://www.aquaforest.com/en/privacy policy.pdf
Catégories	Contenu et fichiers ; Données

Prerequisites

Tout d’abord, vous devez créer un compte d’API PDF Aquaforest. Ce compte est utilisé pour gérer les actions PDF Aquaforest et l’API PDF Aquaforest. Utilisez votre adresse e-mail active, car l’abonnement sera lié à cette adresse. Si vous disposez déjà d’un compte, connectez-vous ici.

Comment obtenir des informations d’identification

Connectez-vous au portail des développeurs, accédez à la page Produits et sélectionnez le produit auquel vous souhaitez vous abonner.
Cliquez sur le bouton S’abonner
Cliquez sur le bouton Confirmer pour confirmer votre demande d’abonnement
Vous pouvez accéder à vos clés API dans votre page Profil

Création d’une connexion

Le connecteur prend en charge les types d’authentification suivants :


Par défaut	Paramètres de création de connexion.	Toutes les régions	Non partageable

Faire défaut

Applicable : Toutes les régions

Paramètres de création de connexion.

Cette connexion n’est pas partageable. Si l’application power est partagée avec un autre utilisateur, un autre utilisateur est invité à créer une connexion explicitement.

Nom	Type	Descriptif	Obligatoire
Clé d’API	securestring	Clé API pour cette API	Vrai

Limitations

Nom	Appels	Période de renouvellement
Appels d’API par connexion	100	60 secondes

Actions

Extraire des pages PDF par code-barres	Extrayez des fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Extraire des pages PDF par texte	Extrayez les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Fractionner pdf par code-barres	Fractionne les fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].
Fractionner pdf par correspondance de texte	Fractionne les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].
Fractionner pdf par page	Fractionne les fichiers PDF en fonction des options de fractionnement définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation.
Obtenir des données au format PDF	Cette action extrait les données importantes des fichiers PDF sous la forme de paires Clé/Valeur.
Obtenir du texte au format PDF	Obtenez du texte à partir de fichiers PDF en fonction de l’emplacement du texte et des expressions régulières. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Obtenir la valeur du code-barres	Obtenir le code-barres à partir du PDF. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .
Obtenir les propriétés PDF	Obtient les informations relatives à un fichier PDF
OCR PDF ou images	Générez un FICHIER PDF pouvant faire l’objet d’une recherche à partir d’une image PDF ou d’images numérisées. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Extraire des pages PDF par code-barres

ID d’opération :: Extract-by-barcode

Extrayez des fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom	Clé	Obligatoire	Type	Description
Contenu du fichier	fileContent	True	byte	Contenu du fichier source
Modèle de nom de fichier	fileNameTemplate	True	string	Modèle pour le fichier de sortie si le code-barres est trouvé
Aucun modèle de fichier	noTextFileName	True	string	Modèle pour le fichier de sortie si aucun code-barres n’est trouvé
Nom du fichier	sourceFileName	True	string	Nom du fichier source
Type	barcodeFormats		array of string	Spécifier les types de codes-barres que vous souhaitez identifier
Emplacement	location	True	string	Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
Motif	regex		string	Si une expression régulière est fournie ici, nous allons correspondre à n’importe quel code-barres extrait et retourner la correspondance.

Retours

Corps: ApiExtractPost200ApplicationJsonResponse

Extraire des pages PDF par texte

ID d’opération :: Extract-by-text

Extrayez les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom	Clé	Obligatoire	Type	Description
Contenu du fichier	fileContent	True	byte	Contenu du fichier source
Modèle de nom de fichier	fileNameTemplate	True	string	Modèle pour le fichier de sortie si les correspondances de texte sont trouvées
Aucun modèle de fichier	noTextFileName	True	string	Modèle pour le fichier de sortie si aucune correspondance de texte n’est trouvée
Nom du fichier	sourceFileName	True	string	Nom du fichier source
Valeur	expression		array of string	Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus.
Emplacement	location	True	string	Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
Sélectionnez	position		string	Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins
Motif	regex		string	Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance.

Retours

Corps: ApiExtractPost200ApplicationJsonResponse

Fractionner pdf par code-barres

ID d’opération :: Split-by-barcode

Fractionne les fichiers PDF en fonction des correspondances de codes-barres définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Paramètres

Nom	Clé	Obligatoire	Type	Description
Contenu du fichier	fileContent	True	byte	Contenu du fichier source
Modèle de nom de fichier	fileNameTemplate	True	string	Modèle pour le fichier de sortie si le code-barres est trouvé
Pages sans correspondance	noMatch		string	Selon l’option fractionnée que vous choisissez ci-dessus, certaines pages n’ont aucune valeur de code-barres. Choisissez ce qu’il faut faire dans ces pages.
Aucun modèle de correspondance de code-barres	noTextFileName	True	string	Modèle pour le fichier de sortie si aucun code-barres n’est trouvé
Nom du fichier	sourceFileName	True	string	Nom du fichier source
Options de fichier de sortie	splitOption		string	Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins
Type	barcodeFormats		array of string	Spécifier les types de codes-barres que vous souhaitez identifier
Emplacement	location	True	string	Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
Motif	regex		string	Si une expression régulière est fournie ici, nous allons correspondre à n’importe quel code-barres extrait et retourner la correspondance.

Retours

Corps: ApiSplitPost200ApplicationJsonResponse

Fractionner pdf par correspondance de texte

ID d’opération :: Split-by-text

Fractionne les fichiers PDF en fonction des correspondances de texte définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation. En outre, l’outil d’extraction zonal Aquaforest est disponible à [https://www.aquaforest.com/en/zone/get-pdf-zone.html].

Paramètres

Nom	Clé	Obligatoire	Type	Description
Contenu du fichier	fileContent	True	byte	Contenu du fichier source
Modèle de nom de fichier	fileNameTemplate	True	string	Modèle pour le fichier de sortie si les correspondances de texte sont trouvées
Pages sans correspondance	noMatch		string	Selon l’option fractionnée que vous choisissez ci-dessus, certaines pages n’ont aucune valeur de texte extraite. Choisissez ce qu’il faut faire dans ces pages.
Aucun modèle de fichier	noTextFileName	True	string	Modèle pour le fichier de sortie si aucune correspondance de texte n’est trouvée
Nom du fichier	sourceFileName	True	string	Nom du fichier source
Options de fichier de sortie	splitOption		string	Choisissez l’emplacement de la page avec le code-barres dans les fichiers de sortie de l’opération de fractionnement.
Valeur	expression		array of string	Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus.
Emplacement	location	True	string	Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
Sélectionnez	position		string	Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins
Motif	regex		string	Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance.

Retours

Corps: ApiSplitPost200ApplicationJsonResponse

Fractionner pdf par page

ID d’opération :: Split-by-page-range

Fractionne les fichiers PDF en fonction des options de fractionnement définies par l’utilisateur. Visitez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] pour obtenir de la documentation.

Paramètres

Nom	Clé	Obligatoire	Type	Description
Contenu du fichier	fileContent	True	byte	Contenu du fichier source.
Nom du fichier de sortie	fileNameTemplate	True	string	Modèle de fichier cible qui peut inclure %UNIQUEn (nombre unique commençant à 1, zéro rembourré sur n chiffres) et %FILENAME (nom de fichier d’origine sans l’extension).
Nom du fichier	sourceFileName	True	string	Nom du fichier source.
Type de fractionnement	splitOption	True	string	Choisissez l’opération de fractionnement à utiliser pour chaque fichier.
Plage de pages	pageRange		string	Ensemble de plages de pages séparées par des virgules qui définissent les pages de l’original à extraire.
Répéter toutes les	repeatEvery		integer	Appliquez la plage de pages à chaque ensemble de pages Plages de pages dans le document. Par exemple, si 2 à 4 est spécifié pour les plages de pages et que 4 sont spécifiés comme plage répétée, la plage est réapppliquée toutes les 4 pages.
Conserver les signets	retainBookmarks		boolean	Les fichiers générés incluent des signets à partir du fichier d’origine.
Conserver les métadonnées	retainMetadata		boolean	Les fichiers générés incluent des métadonnées (telles que l’auteur et le titre) à partir du fichier d’origine.

Retours

Corps: ApiSplitPost200ApplicationJsonResponse

Obtenir des données au format PDF

ID d’opération :: Get-data-from-pdf

Cette action extrait les données importantes des fichiers PDF sous la forme de paires Clé/Valeur.

Paramètres

Nom	Clé	Obligatoire	Type	Description
Nom	settingName	True	string	Entrez le nom du paramètre ici
Valeur	settingValue	True	string	Entrez la valeur du paramètre ici.
Score de confiance	confidenceScore		number	Définissez un score de confiance plus élevé pour filtrer les valeurs avec une confiance inférieure. Vous pouvez définir n’importe quelle valeur comprise entre 0 et 1. Nous vous recommandons de commencer à partir de la version 0.5
Date Conversion	dateAsISO		string	Sélectionnez le format à renvoyer comme valeur de date
Clés attendues	expectedKeys		string	Fournissez un nom de clé par ligne pour rendre les valeurs disponibles pour les actions ultérieures sans analyser JSON.
Contenu du fichier	fileContent	True	byte	Contenu du fichier source
Limite de page	pageLimit		integer	Nombre maximal de pages à traiter
Plage de pages	pageRange		string	Représentation sous forme de chaîne des numéros de page que vous souhaitez traiter. Par exemple, 1,3-4
Symbole monétaire de bande	stripCurrencySymbol		boolean	Définissez cette valeur sur true si vous souhaitez que les symboles et les chaînes soient supprimés avant de retourner des valeurs monétaires
Synonyme de correspondance	synonym		boolean	Définissez cette valeur sur true si vous souhaitez que nous renvoyions toutes les clés synonymes de la clé attendue.
Dictionnaire de synonymes	synonymDictionary		string	Vous pouvez fournir un tableau JSON d’objets « entry », où chaque objet contient une liste de synonymes dans un tableau. Par exemple, si vous souhaitez que « Facture Non » et « Numéro de facture » (sans respect de la casse) soient interprétés comme la même clé, utilisez le code JSON suivant : [{'entry' : [ 'Invoice No', 'invoice number' ]}]
Découper les symboles	trimSymbols		boolean	Définissez cette valeur sur true si vous souhaitez que nous supprimions tous les symboles de début et de fin des clés trouvées avant de les mettre en correspondance avec une clé attendue.

Retours

Les sorties de cette opération sont dynamiques.

Obtenir du texte au format PDF

ID d’opération :: Get-text-value

Obtenez du texte à partir de fichiers PDF en fonction de l’emplacement du texte et des expressions régulières. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom	Clé	Obligatoire	Type	Description
Contenu du fichier	fileContent	True	byte	Contenu du fichier source
Aucun modèle de correspondance de texte	noTextTemplate	True	string	Modèle pour le texte à renvoyer si une correspondance est introuvable
Séparateur de page	pageSeparator		string	Fournissez un séparateur de page pour vous permettre de savoir où se trouvent les sauts de page.
Feuilles	pagerange		string	Fournissez une plage de pages à partir de laquelle vous souhaitez extraire du texte, il peut s’agir d’un numéro de page unique (1), de numéros de page multiples séparés par des virgules (1,2,3), d’une plage de pages (1 à 4) ou d’un mélange de tous (1,2,4-7).
Nom du fichier	sourceFileName	True	string	Nom du fichier source
Modèle de résultat de texte	textResultTemplate	True	string	Modèle pour le texte à renvoyer si une correspondance est trouvée
Valeur	expression		array of string	Fournissez ici une ou plusieurs valeurs à utiliser avec la propriété ci-dessus, nous retournerons la première valeur de texte qui correspond à la règle indiquée ci-dessus.
Emplacement	location	True	string	Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
Page (déconseillée)	pagenumber		integer	Cette propriété est déconseillée, nous vous conseillons d’utiliser la propriété Pages. La propriété Pages s’applique à toutes les zones et vous permet de sélectionner les pages que vous souhaitez traiter.
Sélectionnez	position		string	Utilisez cette option pour affiner le texte que vous extrayez plus, sélectionnez une option qui correspond à vos besoins
Motif	regex		string	Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance.

Retours

Corps: ApiGetTextValueJsonResponse

Obtenir la valeur du code-barres

ID d’opération :: Get-barcode-value

Obtenir le code-barres à partir du PDF. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom	Clé	Obligatoire	Type	Description
Modèle de résultat du code-barres	barcodeResultTemplate	True	string	Modèle pour le résultat du texte de sortie si un code-barres est trouvé
Contenu du fichier	fileContent	True	byte	Contenu du fichier source
Aucun modèle de code-barres	noBarcodeTemplate	True	string	Modèle pour le résultat du texte de sortie si aucun code-barres n’est trouvé
Séparateur de page	pageSeparator		string	Fournissez un séparateur de page pour vous permettre de savoir où se trouvent les sauts de page.
Feuilles	pagerange		string	Fournissez une plage de pages à partir de laquelle vous souhaitez extraire du texte, il peut s’agir d’un numéro de page unique (1), de numéros de page multiples séparés par des virgules (1,2,3), d’une plage de pages (1 à 4) ou d’un mélange de tous (1,2,4-7).
Nom du fichier	sourceFileName	True	string	Nom du fichier source
Type	barcodeFormats		array of string	Spécifier les types de codes-barres que vous souhaitez identifier
Emplacement	location	True	string	Zone de la page : utilisez l’outil Zonal pour obtenir des coordonnées : [https://www.aquaforest.com/en/zone/get-pdf-zone.html]
Page (déconseillée)	pagenumber		integer	Cette propriété est déconseillée, nous vous conseillons d’utiliser la propriété Pages. La propriété Pages s’applique à toutes les zones et vous permet de sélectionner les pages que vous souhaitez traiter.
Motif	regex		string	Si une expression régulière est fournie ici, nous allons faire correspondre tout texte extrait à celui-ci et renvoyer la correspondance.

Retours

Corps: ApiRenameByBarcodePost200ApplicationJsonResponse

Obtenir les propriétés PDF

ID d’opération :: Get-pdf-information

Obtient les informations relatives à un fichier PDF

Paramètres

Nom	Clé	Obligatoire	Type	Description
Contenu du fichier	fileContent	True	byte	Contenu du fichier source
Limite de page	pageLimit		integer	Nombre maximal de pages à traiter, il est utilisé uniquement pour vérifier si les pages contiennent du texte masqué ou si le fichier PDF peut faire l’objet d’une recherche

Retours

Corps: GetPDFInfoResponse

OCR PDF ou images

ID d’opération :: Ocr-file-to-pdf

Générez un FICHIER PDF pouvant faire l’objet d’une recherche à partir d’une image PDF ou d’images numérisées. Pour plus d’informations, consultez [https://www.aquaforest.com/en/aquaforest-flow-doc.asp] .

Paramètres

Nom	Clé	Obligatoire	Type	Description
AquaforestImageTimeout	aquaforestImageTimeout		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Auteur	author		string	Définissez un auteur personnalisé dans les propriétés de document PDF de sortie.
Rotation automatique	autorotate		boolean	Rotation automatique de l’image : cela garantit que tout le texte est orienté normalement
Binarize	binarize		integer	Cette valeur ne doit généralement être utilisée que dans le cadre d’instructions du support technique. Il peut contrôler la façon dont les images de couleur sont traitées et forcent la binarisation avec un seuil particulier. Une valeur de 200 a été montrée pour donner généralement de bons résultats dans les tests, mais cela devrait être confirmé avec des documents clients « typiques ». En affectant cette valeur à -1 une autre méthode est utilisée pour séparer le texte de toutes les images ou couleurs d’arrière-plan. Cela peut donner des résultats OCR améliorés pour certains documents tels que les journaux et les pages de magazines.
Limite de pixels noirs	blackPixelLimit		float	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Seuil de page vide	blankPageThreshold		integer	Utilisez cette option pour définir le nombre minimal de « Sur pixels » qui doivent être présents dans l’image pour qu’une page ne soit pas considérée comme vide. Une valeur de -1 désactive la détection de page vide.
Taille de la boîte	boxSize		integer	Cette option est idéale pour les formulaires où parfois des zones autour du texte peuvent entraîner l’identification d’une zone en tant que graphiques. Cette option supprime les zones de la copie temporaire de l’image utilisée par le moteur OCR. Elle ne supprime pas les zones de l’image finale. Techniquement, cette option supprime les éléments connectés avec une zone minimale (en pixels et défini par cette propriété). Cette option est actuellement appliquée uniquement pour les images bi-tonales.
ConvertToTiff	convertToTiff		boolean	Chaque page du document PDF est ratérisée dans une image TIFF.
CreateProcess	createProcess		boolean	Définissez cette valeur sur true si vous souhaitez lancer le processus via pinvoke.
Date de création	creationDate		string	Définissez une date de création personnalisée dans les propriétés du document PDF de sortie. La chaîne de date doit être au format 'aaaa-MM-jj HH :mm :ss'.
Deskew	deskew		boolean	Deskew (redresser) l’image.
Déspeckle	despeckle		integer	Cela supprime tous les éléments déconnectés de l’image dont la hauteur ou la largeur est inférieure à la figure spécifiée. La valeur maximale est 9 et la valeur par défaut est 0.
DictionaryLookup	dictionaryLookup		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Dotmatrix	dotmatrix		boolean	Définissez cette valeur sur true pour améliorer la reconnaissance des polices de matrice de points. La valeur par défaut est False. Si la valeur est true pour les polices non matricielles, la reconnaissance peut être médiocre.
Activer la sortie de débogage	enableDebugOutput		boolean	Active la sortie de débogage.
Compresser pdf (MRC)	enableMrc		boolean	Cela permet la compression raster mixte qui peut réduire considérablement la taille de sortie des fichiers PDF comprenant des analyses de couleurs. Notez que cette option convient uniquement lorsque la source n’est pas un fichier PDF ou utilise ConvertToTiff.
Sortie PDF/A	enablePDFAOutput		boolean	Indique si la sortie doit être au format PDF/A.
Mode d’erreur	errorMode		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Contenu du fichier source	fileContent	True	byte	Contenu du fichier en OCR
Nom de fichier source avec extension	fileNameWithExtension	True	string	Nom du fichier source avec extension ou simplement l’extension (avec une période de début '.')
Retourner détecter	flipDetect		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Qualité des nuances de gris	grayscaleQuality		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Heuristique	heuristics		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Jbig2EncFlags	jbig2EncFlags		string	Il s’agit des indicateurs qui seront transmis à l’application utilisée pour générer des versions JBIG2 d’images utilisées dans la génération PDF (en supposant que cette compression est activée). Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique.
Language	language		enum	La sélection de l’une des options ci-dessous définit la langue à utiliser pour le traitement OCR. La langue par défaut est l'anglais.
LibTiffSavePageAsBmp	libTiffSavePageAsBmp		boolean	Parfois, s’il existe une image qui est 1bpp et a la compression LZW, le prétraitement peut provoquer l’invertir de l’image (noir à blanc et blanc à noir). Définissez cette valeur sur true pour éviter cela.
Maximum deskew	maxDeskew		float	Angle maximal par lequel une page sera mise à jour. Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique (support@aquaforest.com).
Confiance minimale du bureau	minDeskewConfidence		float	Cette option ne doit généralement être utilisée que dans le cadre d’instructions du support technique (support@aquaforest.com).
Date de modification	modifiedDate		string	Définissez une date de modification personnalisée dans les propriétés du document PDF de sortie. La chaîne de date doit être au format 'aaaa-MM-jj HH :mm :ss'.
Morphe	morph		string	Options morphologiques qui seront appliquées à l’image binarisée avant OCR. Si la valeur est vide, aucune n’est appliquée. Les options courantes incluent celles répertoriées ci-dessous, mais pour plus d’options, veuillez contacter support@aquaforest.com.
MrcBackgroundFactor	mrcBackgroundFactor		integer	Taille d’échantillonnage pour la partie d’arrière-plan de l’image. Plus le nombre est élevé, plus la taille des blocs d’image est élevée pour la moyenne, ce qui entraînera une réduction de la taille, mais aussi de la qualité. La valeur par défaut est 3
MrcForegroundFactor	mrcForegroundFactor		integer	Taille d’échantillonnage pour la partie de premier plan de l’image. Plus le nombre est élevé, plus la taille des blocs d’image est élevée pour la moyenne, ce qui entraînera une réduction de la taille, mais aussi de la qualité. La valeur par défaut est 3
MrcQuality	mrcQuality		integer	Paramètre de qualité JPEG (valeur de pourcentage 1 à 100) à utiliser pour enregistrer l’arrière-plan et les images de premier plan. La valeur par défaut est 75
MrcTimeout	mrcTimeout		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
NoPictures	noPictures		boolean	Par défaut, si une zone du document est identifiée comme une zone graphique, aucun traitement OCR n’est exécuté sur cette zone. Toutefois, certains documents peuvent inclure des zones ou des zones identifiées comme des zones « graphique » ou « image », mais qui contiennent effectivement du texte utile. La définition de NoPictures sur True l’entraîne à ignorer les zones identifiées en tant qu’images tout en la définissant sur False force l’OCR des zones identifiées comme des images.
OcrProcessSetupTimeout	ocrProcessSetupTimeout		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
OcrTimeout	ocrTimeout		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Mot de passe	password		string	Mot de passe pour ouvrir le fichier PDF source
PdfToImageBpp	pdfToImageBpp		enum	Bits par pixel à utiliser pour la page PDF ratérisée lors de l’utilisation du moteur 1. Cela s’applique uniquement aux documents traités à l’aide de ConvertToTiff. La valeur par défaut de cette propriété est extraite de la page PDF.
PdfToImageCompression	pdfToImageCompression		enum	Compression à définir sur les images extraites ou ratérisées de chaque page du fichier PDF source. Ces images sont ensuite OCRed pour créer le PDF pouvant faire l’objet d’une recherche. La valeur par défaut de cette propriété est extraite de chaque page du fichier PDF source.
PdfToImageDpi	pdfToImageDpi		enum	Ppp à définir sur les images ratérisées à partir de chaque page du fichier PDF source. Ces images sont ensuite OCRed pour créer le PDF pouvant faire l’objet d’une recherche. La valeur par défaut de cette propriété est extraite de chaque page du fichier PDF source.
PdfToImageForceVectorCheck	pdfToImageForceVectorCheck		boolean	Ce paramètre est utile lorsque vous traitez des documents qui contiennent des objets vectoriels (par exemple, des dessins CAO). Par défaut, les pages qui contiennent uniquement des objets vectoriels sont ratérisées. Les pages qui n’ont pas d’images, mais contiennent des objets vectoriels ainsi que du texte électronique sont ignorées de la rastérisation. Toutefois, il peut parfois y avoir une page qui contient des objets vectoriels (dessins CAO), mais son titre peut être en texte électronique. Pour forcer la rastérisation des pages comme celles-ci, définissez cette propriété sur true.
PdfToImageIncludeText	pdfToImageIncludeText		boolean	Lorsqu’il est défini sur False, cela empêche la conversion de texte réel (par exemple, générée électroniquement par opposition au texte qui fait partie d’une image numérisée) d’être restituée dans les images de page extraites du PDF. Cela est dû au fait que le texte est déjà pouvant faire l’objet d’une recherche et ne nécessite généralement pas d’OCR. La valeur peut être définie sur True toutefois si l’OCR est requis sur ce texte réel.
PdfToImageMaxRes	pdfToImageMaxRes		integer	Résolution maximale des images ratérisées. Si la résolution récupérée à partir de la page PDF est supérieure à cette valeur, elle est définie sur cette valeur. La valeur par défaut de cette propriété est 600.
PdfToImageMinRes	pdfToImageMinRes		integer	Résolution minimale des images ratérisées. Si la résolution récupérée à partir de la page PDF est inférieure à cette valeur, elle est définie sur cette valeur. La valeur par défaut de cette propriété est 200.
PDF/A Version	pdfaVersion		enum	Version PDF/A.
PipeClientConnectionTimeout	pipeClientConnectionTimeout		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
RemoveBlankPage	removeBlankPage		boolean	Supprimez les pages vides lorsque BlankPageThreshold est supérieur à -1 et ConvertToTiff a la valeur true.
RemoveLines	removeLines		boolean	Supprimez les lignes des images fpr pour une meilleure reconnaissance.
RestartEngineEvery	restartEngineEvery		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Conserver les signets	retainBookmarks		boolean	Conserve tous les signets du fichier source dans la sortie lors de l’utilisation de ConvertToTiff.
Conserver la date de création	retainCreationDate		boolean	Conserve la date de création du fichier source dans les propriétés du document PDF de sortie.
Conserver les métadonnées	retainMetadata		boolean	Conserve les métadonnées du fichier source dans la sortie lors de l’utilisation de ConvertToTiff.
Conserver la date de modification	retainModifiedDate		boolean	Conserve la date de modification du fichier source dans les propriétés du document PDF de sortie.
Conserver les préférences de visionneuse	retainViewerPreferences		boolean	Conserve les préférences de visionneuse PDF, le mode page et la mise en page à partir du fichier source dans la sortie lors de l’utilisation de ConvertToTiff.
SavePredespeckle	savePredespeckle		boolean	Cela utilise l’image d’origine (c’est-à-dire avant d’appliquer le prétraitement) dans le fichier PDF de sortie.
Tables	tables		boolean	Cette option lorsqu’elle est définie sur true, tente d’ocr dans les cellules du tableau.
TextLayerFilterHeight	textLayerFilterHeight		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
TextLayerFilterHeightInverted	textLayerFilterHeightInverted		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
TextLayerFilterPercentage	textLayerFilterPercentage		float	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
TextLayerFilterPercentageInverted	textLayerFilterPercentageInverted		float	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
TextLayerFilterRatio	textLayerFilterRatio		float	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
TextLayerFilterRatioInverted	textLayerFilterRatioInverted		float	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
TextLayerFilterWidth	textLayerFilterWidth		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
TextLayerFilterWidthInverted	textLayerFilterWidthInverted		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
TextLayerMaxBoxes	textLayerMaxBoxes		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Mode tidy-up	tidyUpMode		integer	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.
Valider PDF/A	validatePDFA		boolean	Indique si le document PDF/A doit être validé après la conversion
Seuil de correspondance word	wordMatchThreshold		float	Contactez le support technique (support@aquaforest.com) pour obtenir des conseils sur l’utilisation de cette propriété.

Retours

Données de réponse pour l’opération OCR

Corps: ocr_response

Définitions

ApiExtractPost200ApplicationJsonResponse

Nom	Chemin d’accès	Type	Description
Erreur	ErrorMessage	string	Si la valeur Is Successful est false, nous retournerons un message d’erreur
Réussite	IsSuccessful	boolean	Cela retourne true si au moins une page a été extraite
Informations de licence	LicenceInfo	string	Informations sur votre clé d’abonnement API
Extraire des fichiers de sortie	SplittedFile	array of object	Tableau de fichiers extraits
(Contenu du fichier)	SplittedFile.SplitFileContent	byte	Chaîne de base 64 représentant le contenu du fichier
(Nom de fichier)	SplittedFile.SplitFileName	string	Chaîne contenant le nom de fichier généré
(Numéro de page)	SplittedFile.pageNumber	string	Plage de pages contenant le numéro de page où l’extraction s’est produite

ApiGetTextValueJsonResponse

Nom	Chemin d’accès	Type	Description
Message d'erreur	ErrorMessage	string	Si la valeur Is Successful est false, nous retournerons un message d’erreur
Réussite	IsSuccessful	boolean	Si le texte a été mis en correspondance avec succès
Informations de licence	LicenceInfo	string	Informations sur votre clé d’abonnement API
Résultat du texte	TextResult	string	Chaîne générée à partir de l’application du texte extrait au modèle de résultat de texte fourni. Notez que si le nombre de pages est supérieur à un, il concatène toutes les pages à l’aide du séparateur de page.
Results	TextResults	array of object	Tableau contenant une liste de pages et les valeurs de texte extraites
(Numéro de page)	TextResults.pageNumber	string	Page où le texte a été trouvé
(Texte de la page)	TextResults.valueExtracted	string	Chaîne générée à partir de l’application du texte extrait au modèle de résultat de texte fourni.
(Valeurs de zone)	TextResults.zoneValues	array of string	Tableau contenant le texte extrait de chaque zone.

ApiRenameByBarcodePost200ApplicationJsonResponse

Nom	Chemin d’accès	Type	Description
Code-barres	BarcodeResult	string	Chaîne générée à partir de l’application du texte extrait au modèle de résultat du code-barres fourni. Notez que si le nombre de pages est supérieur à un, il concatène toutes les pages à l’aide du séparateur de page.
Results	BarcodeResults	array of object	Tableau contenant une liste de pages et les valeurs de code-barres extraites
(Numéro de page)	BarcodeResults.pageNumber	string	Page où le code-barres a été trouvé
(Code-barres de page)	BarcodeResults.valueExtracted	string	Chaîne générée à partir de l’application de la valeur de code-barres extraite au modèle de résultat de code-barres fourni.
(Valeurs de zone)	BarcodeResults.zoneValues	array of string	Tableau contenant le code-barres extrait de chaque zone.
Message d'erreur	ErrorMessage	string	Si la valeur Is Successful est false, nous retournerons un message d’erreur
Réussite	IsSuccessful	boolean	Si un code-barres a été détecté
Informations de licence	LicenceInfo	string	Informations sur votre clé d’abonnement API

ApiSplitPost200ApplicationJsonResponse

Nom	Chemin d’accès	Type	Description
Message d'erreur	ErrorMessage	string	Si la valeur Is Successful est false, nous retournerons un message d’erreur
Réussite	IsSuccessful	boolean	Cela retourne true si au moins une page fractionnée a été mise en correspondance.
Informations de licence	LicenceInfo	string	Informations sur votre clé d’abonnement API
Fractionner les fichiers de sortie	SplittedFile	array of object	Tableau contenant chacun des fichiers fractionnés avec des détails tels que le nom de fichier généré et le numéro de page.
(Contenu du fichier)	SplittedFile.SplitFileContent	byte	Chaîne de base 64 représentant le contenu du fichier
(Nom de fichier)	SplittedFile.SplitFileName	string	Chaîne contenant le nom de fichier généré
(Plage de pages)	SplittedFile.pageNumber	string	Plage de pages contenant les numéros de page de l’opération de fractionnement

GetPDFInfoResponse

Nom	Chemin d’accès	Type	Description
Autoriser l’assembly	AllowAssembly	boolean	Autoriser la rotation, l’insertion ou la suppression de pages.
Autoriser l’impression détériorée	AllowDegradedPrinting	boolean	Autorisez l’impression de faible qualité.
Autoriser l’extraction du contenu	AllowExtractContents	boolean	Autoriser l’extraction de texte et de graphiques.
Autoriser l’extraction pour l’accessibilité	AllowExtractForAccessibility	boolean	Autoriser l’extraction de texte et de graphiques en prise en charge de l’accessibilité.
Autoriser le remplissage du formulaire	AllowFillInForm	boolean	Autoriser le remplissage des champs de formulaire.
Autoriser la modification des annotations	AllowModifyAnnotations	boolean	Autoriser la modification des annotations.
Autoriser la modification du contenu	AllowModifyContents	boolean	Autoriser la modification du contenu.
Autoriser l’impression	AllowPrinting	boolean	Autorisez l’impression de haute qualité.
Auteur	Author	string	Qui a créé le document.
Date de création	CreationDate	string	Il s’agit de la date et de l’heure de création du fichier PDF.
Créateur	Creator	string	Application ou bibliothèque d’origine.
Message d'erreur	ErrorMessage	string	Si la valeur Is Successful est false, nous retournerons un message d’erreur
Taille du fichier (octets)	FileSize	number	Taille du fichier en octets
Contient du texte masqué	HasHiddenText	boolean	Cela retourne true si le fichier PDF a une couche OCR.
Est chiffré	IsEncrypted	boolean	Cela retourne true si ce document est chiffré ou non.
Peut faire l’objet d’une recherche	IsSearchable	boolean	Cette propriété retourne true si le fichier PDF peut faire l’objet d’une recherche.
Réussite	IsSuccessful	boolean	Retourne true si l’action a réussi.
Mots clés	Keywords	string	Les mots clés peuvent être séparés par des virgules.
Informations de licence	LicenceInfo	string	Résumé json du quota de votre abonnement.
Date de modification	ModifiedDate	string	Cette propriété représente la date et l’heure de la dernière modification du fichier PDF
Nombre de pages	NumberofPages	integer	Nombre de pages dans le fichier PDF.
PDF Version	PDFversion	number	La version de la spécification PDF sur le document a été générée.
Producer	Producer	string	Produit qui a créé le fichier PDF. Dans les premiers jours de pdf, les utilisateurs utiliseraient une application Creator comme Microsoft Word pour écrire un document, l’imprimer dans un fichier PostScript, puis le producteur serait Acrobat Distill, l’application qui a converti le fichier PostScript en pdf. Aujourd’hui Créateur et Producteur sont souvent identiques ou un champ est laissé vide.
Sujet	Subject	string	À propos du document.
Titre	Title	string	Titre du document.
Attrapé	Trapped	string	Cette propriété est une valeur booléenne qui indique si le document a été piégé. Le piège est un processus de pré-presse qui introduit des zones de couleur dans les séparations de couleurs afin d’obscurcir les erreurs potentielles d’enregistrement.
Métadonnées XMP	XmpMetadata	string	La plateforme de métadonnées extensible (XMP) est une norme ISO, créée à l’origine par Adobe Systems Inc., pour la création, le traitement et l’échange de métadonnées standardisées et personnalisées pour les documents numériques et les jeux de données.

ocr_response

Données de réponse pour l’opération OCR

Nom	Chemin d’accès	Type	Description
Message d'erreur	ErrorMessage	string	Si la valeur Is Successful est false, nous retournerons un message d’erreur
Réussite	IsSuccessful	boolean	Retourne true si l’OCR a réussi.
Informations de licence	LicenceInfo	string	Informations sur votre clé d’abonnement API
Contenu du fichier journal	LogFileContent	byte	Contenu du journal de l’opération
Contenu du fichier traité	OutputFileContent	byte	Fichier généré par le convertisseur PDF Aquaforest.

Partager via

Aquaforest PDF

Prerequisites

Comment obtenir des informations d’identification

Création d’une connexion

Faire défaut

Limitations

Actions

Extraire des pages PDF par code-barres

Paramètres

Retours

Extraire des pages PDF par texte

Paramètres

Retours

Fractionner pdf par code-barres

Paramètres

Retours

Fractionner pdf par correspondance de texte

Paramètres

Retours

Fractionner pdf par page

Paramètres

Retours

Obtenir des données au format PDF

Paramètres

Retours

Obtenir du texte au format PDF

Paramètres

Retours

Obtenir la valeur du code-barres

Paramètres

Retours

Obtenir les propriétés PDF

Paramètres

Retours

OCR PDF ou images

Paramètres

Retours

Définitions

ApiExtractPost200ApplicationJsonResponse

ApiGetTextValueJsonResponse

ApiRenameByBarcodePost200ApplicationJsonResponse

ApiSplitPost200ApplicationJsonResponse

GetPDFInfoResponse

ocr_response