IndexingParametersConfiguration interface

パッケージ:: @azure/search-documents

インデクサー固有の構成プロパティのディクショナリ。各名前は、特定のプロパティの名前です。各値はプリミティブ型である必要があります。

プロパティ

allowSkillsetToReadFileData	true の場合、BLOB データソースからダウンロードされた元のファイルデータを表すオブジェクトであるパス //document//file_data が作成されます。これにより、元のファイルデータをエンリッチメントパイプライン内で処理するためのカスタムスキルまたはドキュメント抽出スキルに渡すことができます。
dataToExtract	Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージコンテンツから抽出するデータをインデクサーに指示します。これは、.PDFまたはその他のアプリケーションの埋め込みイメージコンテンツ、または Azure BLOB の .jpg や .pngなどのイメージファイルに適用されます。
delimitedTextDelimiter	CSV BLOB の場合、各行が新しいドキュメント ("\|" など) を開始する CSV ファイルの行末の単一文字区切り記号を指定します。
delimitedTextHeaders	CSV BLOB の場合、列ヘッダーのコンマ区切りのリストを指定します。これは、ソースフィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。
documentRoot	JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。
excludedFileNameExtensions	Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。
executionEnvironment	インデクサーを実行する環境を指定します。
failOnUnprocessableDocument	Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。
failOnUnsupportedContentType	Azure BLOB の場合、サポートされていないコンテンツタイプが検出されたときにインデックス作成を続行する必要があり、すべてのコンテンツタイプ (ファイル拡張子) を事前に把握していない場合は false に設定します。
firstLineContainsHeaders	CSV BLOB の場合、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。
imageAction	Azure BLOB ストレージ内の埋め込みイメージとイメージファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。
indexedFileNameExtensions	Azure Blob Storage から処理するときに選択するファイル名拡張子のコンマ区切りの一覧。たとえば、特定のアプリケーションファイル ".docx、.pptx、.msg" にインデックスを付けて、これらのファイルの種類を具体的に含めることができます。
indexStorageMetadataOnlyForOversizedDocuments	Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージメタデータのインデックスを作成するには、このプロパティを true に設定します。サイズ超過の BLOB は、既定でエラーとして扱われます。 BLOB サイズの制限については、https://docs.microsoft.com/azure/search/search-limits-quotas-capacityを参照してください。
parsingMode	Azure BLOB データソースからのインデックス作成の解析モードを表します。
pdfTextRotationAlgorithm	Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。
queryTimeout	"hh:mm:ss" という形式で指定された Azure SQL データベースデータソースの 5 分間の既定値を超えてタイムアウトを増やします。

プロパティの詳細

allowSkillsetToReadFileData

true の場合、BLOB データソースからダウンロードされた元のファイルデータを表すオブジェクトであるパス //document//file_data が作成されます。これにより、元のファイルデータをエンリッチメントパイプライン内で処理するためのカスタムスキルまたはドキュメント抽出スキルに渡すことができます。

allowSkillsetToReadFileData?: boolean

プロパティ値

boolean

dataToExtract

Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージコンテンツから抽出するデータをインデクサーに指示します。これは、.PDFまたはその他のアプリケーションの埋め込みイメージコンテンツ、または Azure BLOB の .jpg や .pngなどのイメージファイルに適用されます。

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

プロパティ値

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

CSV BLOB の場合、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の単一文字区切り記号を指定します。

delimitedTextDelimiter?: string

プロパティ値

string

delimitedTextHeaders

CSV BLOB の場合、列ヘッダーのコンマ区切りのリストを指定します。これは、ソースフィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。

delimitedTextHeaders?: string

プロパティ値

string

documentRoot

JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。

documentRoot?: string

プロパティ値

string

excludedFileNameExtensions

Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。

excludedFileNameExtensions?: string

プロパティ値

string

executionEnvironment

インデクサーを実行する環境を指定します。

executionEnvironment?: "standard" | "private"

プロパティ値

"standard" | "private"

failOnUnprocessableDocument

Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。

failOnUnprocessableDocument?: boolean

プロパティ値

boolean

failOnUnsupportedContentType

Azure BLOB の場合、サポートされていないコンテンツタイプが検出されたときにインデックス作成を続行する必要があり、すべてのコンテンツタイプ (ファイル拡張子) を事前に把握していない場合は false に設定します。

failOnUnsupportedContentType?: boolean

プロパティ値

boolean

firstLineContainsHeaders

CSV BLOB の場合、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。

firstLineContainsHeaders?: boolean

プロパティ値

boolean

imageAction

Azure BLOB ストレージ内の埋め込みイメージとイメージファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

プロパティ値

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Azure Blob Storage から処理するときに選択するファイル名拡張子のコンマ区切りの一覧。たとえば、特定のアプリケーションファイル ".docx、.pptx、.msg" にインデックスを付けて、これらのファイルの種類を具体的に含めることができます。

indexedFileNameExtensions?: string

プロパティ値

string

indexStorageMetadataOnlyForOversizedDocuments

Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージメタデータのインデックスを作成するには、このプロパティを true に設定します。サイズ超過の BLOB は、既定でエラーとして扱われます。 BLOB サイズの制限については、https://docs.microsoft.com/azure/search/search-limits-quotas-capacityを参照してください。

indexStorageMetadataOnlyForOversizedDocuments?: boolean

プロパティ値

boolean

parsingMode

Azure BLOB データソースからのインデックス作成の解析モードを表します。

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

プロパティ値

pdfTextRotationAlgorithm

Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。

pdfTextRotationAlgorithm?: "none" | "detectAngles"

プロパティ値

"none" | "detectAngles"

queryTimeout

"hh:mm:ss" という形式で指定された Azure SQL データベースデータソースの 5 分間の既定値を超えてタイムアウトを増やします。

queryTimeout?: string

プロパティ値

string

次の方法で共有

IndexingParametersConfiguration interface

プロパティ

プロパティの詳細

allowSkillsetToReadFileData

プロパティ値

dataToExtract

プロパティ値

delimitedTextDelimiter

プロパティ値

delimitedTextHeaders

プロパティ値

documentRoot

プロパティ値

excludedFileNameExtensions

プロパティ値

executionEnvironment

プロパティ値

failOnUnprocessableDocument

プロパティ値

failOnUnsupportedContentType

プロパティ値

firstLineContainsHeaders

プロパティ値

imageAction

プロパティ値

indexedFileNameExtensions

プロパティ値

indexStorageMetadataOnlyForOversizedDocuments

プロパティ値

parsingMode

プロパティ値

pdfTextRotationAlgorithm

プロパティ値

queryTimeout

プロパティ値