IndexingParametersConfiguration interface

Paquet:: @azure/search-documents

Dictionnaire de propriétés de configuration spécifiques à l’indexeur. Chaque nom est le nom d’une propriété spécifique. Chaque valeur doit être d’un type primitif.

Propriétés

allowSkillsetToReadFileData	Si la valeur est true, créez un chemin //document//file_data qui est un objet représentant les données de fichier d’origine téléchargées à partir de votre source de données blob. Cela vous permet de transmettre les données de fichier d’origine à une compétence personnalisée pour le traitement dans le pipeline d’enrichissement ou à la compétence Extraction de documents.
dataToExtract	Spécifie les données à extraire du stockage Blob Azure et indique à l’indexeur quelles données extraire du contenu de l’image lorsque « imageAction » est défini sur une valeur autre que « none ». Cela s’applique au contenu d’image incorporé dans une .PDF ou d’autres applications, ou des fichiers image tels que .jpg et .png, dans des objets blob Azure.
delimitedTextDelimiter	Pour les objets blob CSV, spécifie le délimiteur à caractère unique de fin de ligne pour les fichiers CSV où chaque ligne démarre un nouveau document (par exemple, « \| »).
delimitedTextHeaders	Pour les objets blob CSV, spécifie une liste délimitée par des virgules d’en-têtes de colonne, utile pour mapper les champs sources aux champs de destination dans un index.
documentRoot	Pour les tableaux JSON, en fonction d’un document structuré ou semi-structuré, vous pouvez spécifier un chemin d’accès au tableau à l’aide de cette propriété.
excludedFileNameExtensions	Liste délimitée par des virgules des extensions de nom de fichier à ignorer lors du traitement à partir du stockage Blob Azure. Par exemple, vous pouvez exclure «.png, .mp4» pour ignorer ces fichiers pendant l’indexation.
executionEnvironment	Spécifie l’environnement dans lequel l’indexeur doit s’exécuter.
failOnUnprocessableDocument	Pour les objets blob Azure, définissez la valeur false si vous souhaitez continuer l’indexation en cas d’échec de l’indexation d’un document.
failOnUnsupportedContentType	Pour les objets blob Azure, définissez la valeur false si vous souhaitez continuer l’indexation lorsqu’un type de contenu non pris en charge est rencontré et que vous ne connaissez pas tous les types de contenu (extensions de fichier) à l’avance.
firstLineContainsHeaders	Pour les objets blob CSV, indique que la première ligne (non vide) de chaque objet blob contient des en-têtes.
imageAction	Détermine comment traiter des images incorporées et des fichiers image dans le stockage d’objets blob Azure. La définition de la configuration « imageAction » sur n’importe quelle valeur autre que « none » nécessite qu’un ensemble de compétences soit également attaché à cet indexeur.
indexedFileNameExtensions	Liste délimitée par des virgules d’extensions de nom de fichier à sélectionner lors du traitement à partir du stockage Blob Azure. Par exemple, vous pouvez concentrer l’indexation sur des fichiers d’application spécifiques «.docx, .pptx, .msg » pour inclure spécifiquement ces types de fichiers.
indexStorageMetadataOnlyForOversizedDocuments	Pour les objets blob Azure, définissez cette propriété sur true pour toujours indexer les métadonnées de stockage pour le contenu d’objet blob trop volumineux à traiter. Les objets blob surdimensionnés sont traités comme des erreurs par défaut. Pour connaître les limites relatives à la taille de l’objet blob, consultez https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
parsingMode	Représente le mode d’analyse pour l’indexation à partir d’une source de données d’objet blob Azure.
pdfTextRotationAlgorithm	Détermine l’algorithme d’extraction de texte à partir de fichiers PDF dans le stockage d’objets blob Azure.
queryTimeout	Augmente le délai d’expiration au-delà de la valeur par défaut de 5 minutes pour les sources de données de base de données Azure SQL, spécifiées au format « hh :mm :ss ».

Détails de la propriété

allowSkillsetToReadFileData

Si la valeur est true, créez un chemin //document//file_data qui est un objet représentant les données de fichier d’origine téléchargées à partir de votre source de données blob. Cela vous permet de transmettre les données de fichier d’origine à une compétence personnalisée pour le traitement dans le pipeline d’enrichissement ou à la compétence Extraction de documents.

allowSkillsetToReadFileData?: boolean

Valeur de propriété

boolean

dataToExtract

Spécifie les données à extraire du stockage Blob Azure et indique à l’indexeur quelles données extraire du contenu de l’image lorsque « imageAction » est défini sur une valeur autre que « none ». Cela s’applique au contenu d’image incorporé dans une .PDF ou d’autres applications, ou des fichiers image tels que .jpg et .png, dans des objets blob Azure.

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

Valeur de propriété

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

Pour les objets blob CSV, spécifie le délimiteur à caractère unique de fin de ligne pour les fichiers CSV où chaque ligne démarre un nouveau document (par exemple, « | »).

delimitedTextDelimiter?: string

Valeur de propriété

string

delimitedTextHeaders

Pour les objets blob CSV, spécifie une liste délimitée par des virgules d’en-têtes de colonne, utile pour mapper les champs sources aux champs de destination dans un index.

delimitedTextHeaders?: string

Valeur de propriété

string

documentRoot

Pour les tableaux JSON, en fonction d’un document structuré ou semi-structuré, vous pouvez spécifier un chemin d’accès au tableau à l’aide de cette propriété.

documentRoot?: string

Valeur de propriété

string

excludedFileNameExtensions

Liste délimitée par des virgules des extensions de nom de fichier à ignorer lors du traitement à partir du stockage Blob Azure. Par exemple, vous pouvez exclure «.png, .mp4» pour ignorer ces fichiers pendant l’indexation.

excludedFileNameExtensions?: string

Valeur de propriété

string

executionEnvironment

Spécifie l’environnement dans lequel l’indexeur doit s’exécuter.

executionEnvironment?: "standard" | "private"

Valeur de propriété

"standard" | "private"

failOnUnprocessableDocument

Pour les objets blob Azure, définissez la valeur false si vous souhaitez continuer l’indexation en cas d’échec de l’indexation d’un document.

failOnUnprocessableDocument?: boolean

Valeur de propriété

boolean

failOnUnsupportedContentType

Pour les objets blob Azure, définissez la valeur false si vous souhaitez continuer l’indexation lorsqu’un type de contenu non pris en charge est rencontré et que vous ne connaissez pas tous les types de contenu (extensions de fichier) à l’avance.

failOnUnsupportedContentType?: boolean

Valeur de propriété

boolean

firstLineContainsHeaders

Pour les objets blob CSV, indique que la première ligne (non vide) de chaque objet blob contient des en-têtes.

firstLineContainsHeaders?: boolean

Valeur de propriété

boolean

imageAction

Détermine comment traiter des images incorporées et des fichiers image dans le stockage d’objets blob Azure. La définition de la configuration « imageAction » sur n’importe quelle valeur autre que « none » nécessite qu’un ensemble de compétences soit également attaché à cet indexeur.

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

Valeur de propriété

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Liste délimitée par des virgules d’extensions de nom de fichier à sélectionner lors du traitement à partir du stockage Blob Azure. Par exemple, vous pouvez concentrer l’indexation sur des fichiers d’application spécifiques «.docx, .pptx, .msg » pour inclure spécifiquement ces types de fichiers.

indexedFileNameExtensions?: string

Valeur de propriété

string

indexStorageMetadataOnlyForOversizedDocuments

Pour les objets blob Azure, définissez cette propriété sur true pour toujours indexer les métadonnées de stockage pour le contenu d’objet blob trop volumineux à traiter. Les objets blob surdimensionnés sont traités comme des erreurs par défaut. Pour connaître les limites relatives à la taille de l’objet blob, consultez https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

Valeur de propriété

boolean

parsingMode

Représente le mode d’analyse pour l’indexation à partir d’une source de données d’objet blob Azure.

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

Valeur de propriété

pdfTextRotationAlgorithm

Détermine l’algorithme d’extraction de texte à partir de fichiers PDF dans le stockage d’objets blob Azure.

pdfTextRotationAlgorithm?: "none" | "detectAngles"

Valeur de propriété

"none" | "detectAngles"

queryTimeout

Augmente le délai d’expiration au-delà de la valeur par défaut de 5 minutes pour les sources de données de base de données Azure SQL, spécifiées au format « hh :mm :ss ».

queryTimeout?: string

Valeur de propriété

string

Partager via

IndexingParametersConfiguration interface

Propriétés

Détails de la propriété

allowSkillsetToReadFileData

Valeur de propriété

dataToExtract

Valeur de propriété

delimitedTextDelimiter

Valeur de propriété

delimitedTextHeaders

Valeur de propriété

documentRoot

Valeur de propriété

excludedFileNameExtensions

Valeur de propriété

executionEnvironment

Valeur de propriété

failOnUnprocessableDocument

Valeur de propriété

failOnUnsupportedContentType

Valeur de propriété

firstLineContainsHeaders

Valeur de propriété

imageAction

Valeur de propriété

indexedFileNameExtensions

Valeur de propriété

indexStorageMetadataOnlyForOversizedDocuments

Valeur de propriété

parsingMode

Valeur de propriété

pdfTextRotationAlgorithm

Valeur de propriété

queryTimeout

Valeur de propriété