次の方法で共有


IndexingParametersConfiguration interface

インデクサー固有の構成プロパティのディクショナリ。 各名前は、特定のプロパティの名前です。 各値はプリミティブ型である必要があります。

プロパティ

allowSkillsetToReadFileData

true の場合、BLOB データ ソースからダウンロードされた元のファイル データを表すオブジェクトであるパス //document//file_data が作成されます。 これにより、元のファイル データをエンリッチメント パイプライン内で処理するためのカスタム スキルまたはドキュメント抽出スキルに渡すことができます。

dataToExtract

Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージ コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の .jpg や .pngなどのイメージ ファイルに適用されます。

delimitedTextDelimiter

CSV BLOB の場合、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の単一文字区切り記号を指定します。

delimitedTextHeaders

CSV BLOB の場合、列ヘッダーのコンマ区切りのリストを指定します。これは、ソース フィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。

documentRoot

JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。

excludedFileNameExtensions

Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。 たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。

executionEnvironment

インデクサーを実行する環境を指定します。

failOnUnprocessableDocument

Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。

failOnUnsupportedContentType

Azure BLOB の場合、サポートされていないコンテンツ タイプが検出されたときにインデックス作成を続行する必要があり、すべてのコンテンツ タイプ (ファイル拡張子) を事前に把握していない場合は false に設定します。

firstLineContainsHeaders

CSV BLOB の場合、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。

imageAction

Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。

indexedFileNameExtensions

Azure Blob Storage から処理するときに選択するファイル名拡張子のコンマ区切りの一覧。 たとえば、特定のアプリケーション ファイル ".docx、.pptx、.msg" にインデックスを付けて、これらのファイルの種類を具体的に含めることができます。

indexStorageMetadataOnlyForOversizedDocuments

Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージ メタデータのインデックスを作成するには、このプロパティを true に設定します。 サイズ超過の BLOB は、既定でエラーとして扱われます。 BLOB サイズの制限については、https://docs.microsoft.com/azure/search/search-limits-quotas-capacityを参照してください。

parsingMode

Azure BLOB データ ソースからのインデックス作成の解析モードを表します。

pdfTextRotationAlgorithm

Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。

queryTimeout

"hh:mm:ss" という形式で指定された Azure SQL データベース データ ソースの 5 分間の既定値を超えてタイムアウトを増やします。

プロパティの詳細

allowSkillsetToReadFileData

true の場合、BLOB データ ソースからダウンロードされた元のファイル データを表すオブジェクトであるパス //document//file_data が作成されます。 これにより、元のファイル データをエンリッチメント パイプライン内で処理するためのカスタム スキルまたはドキュメント抽出スキルに渡すことができます。

allowSkillsetToReadFileData?: boolean

プロパティ値

boolean

dataToExtract

Azure BLOB ストレージから抽出するデータを指定し、"imageAction" が "none" 以外の値に設定されている場合に、イメージ コンテンツから抽出するデータをインデクサーに指示します。 これは、.PDFまたはその他のアプリケーションの埋め込みイメージ コンテンツ、または Azure BLOB の .jpg や .pngなどのイメージ ファイルに適用されます。

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

プロパティ値

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

CSV BLOB の場合、各行が新しいドキュメント ("|" など) を開始する CSV ファイルの行末の単一文字区切り記号を指定します。

delimitedTextDelimiter?: string

プロパティ値

string

delimitedTextHeaders

CSV BLOB の場合、列ヘッダーのコンマ区切りのリストを指定します。これは、ソース フィールドをインデックス内の宛先フィールドにマッピングするのに役立ちます。

delimitedTextHeaders?: string

プロパティ値

string

documentRoot

JSON 配列の場合、構造化ドキュメントまたは半構造化ドキュメントを指定すると、このプロパティを使用して配列へのパスを指定できます。

documentRoot?: string

プロパティ値

string

excludedFileNameExtensions

Azure BLOB ストレージからの処理時に無視するファイル名拡張子のコンマ区切りの一覧。 たとえば、".png、.mp4" を除外して、インデックス作成中にこれらのファイルをスキップできます。

excludedFileNameExtensions?: string

プロパティ値

string

executionEnvironment

インデクサーを実行する環境を指定します。

executionEnvironment?: "standard" | "private"

プロパティ値

"standard" | "private"

failOnUnprocessableDocument

Azure BLOB の場合、ドキュメントのインデックス作成に失敗した場合にインデックス作成を続行する場合は false に設定します。

failOnUnprocessableDocument?: boolean

プロパティ値

boolean

failOnUnsupportedContentType

Azure BLOB の場合、サポートされていないコンテンツ タイプが検出されたときにインデックス作成を続行する必要があり、すべてのコンテンツ タイプ (ファイル拡張子) を事前に把握していない場合は false に設定します。

failOnUnsupportedContentType?: boolean

プロパティ値

boolean

firstLineContainsHeaders

CSV BLOB の場合、各 BLOB の最初の (空白以外の) 行にヘッダーが含まれていることを示します。

firstLineContainsHeaders?: boolean

プロパティ値

boolean

imageAction

Azure BLOB ストレージ内の埋め込みイメージとイメージ ファイルを処理する方法を決定します。 "imageAction" 構成を "none" 以外の値に設定するには、スキルセットもそのインデクサーにアタッチする必要があります。

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

プロパティ値

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Azure Blob Storage から処理するときに選択するファイル名拡張子のコンマ区切りの一覧。 たとえば、特定のアプリケーション ファイル ".docx、.pptx、.msg" にインデックスを付けて、これらのファイルの種類を具体的に含めることができます。

indexedFileNameExtensions?: string

プロパティ値

string

indexStorageMetadataOnlyForOversizedDocuments

Azure BLOB の場合、処理するには大きすぎる BLOB コンテンツのストレージ メタデータのインデックスを作成するには、このプロパティを true に設定します。 サイズ超過の BLOB は、既定でエラーとして扱われます。 BLOB サイズの制限については、https://docs.microsoft.com/azure/search/search-limits-quotas-capacityを参照してください。

indexStorageMetadataOnlyForOversizedDocuments?: boolean

プロパティ値

boolean

parsingMode

Azure BLOB データ ソースからのインデックス作成の解析モードを表します。

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

プロパティ値

"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

pdfTextRotationAlgorithm

Azure BLOB ストレージ内の PDF ファイルからテキストを抽出するためのアルゴリズムを決定します。

pdfTextRotationAlgorithm?: "none" | "detectAngles"

プロパティ値

"none" | "detectAngles"

queryTimeout

"hh:mm:ss" という形式で指定された Azure SQL データベース データ ソースの 5 分間の既定値を超えてタイムアウトを増やします。

queryTimeout?: string

プロパティ値

string