次の方法で共有


Content Understanding の分類/セグメント化

Content Understanding を使用すると、お客様はアナライザー操作要求の一部として分類と分割を実装できます。 コンテンツ分類とコンテンツ抽出は、1 つの API 呼び出しの一部として実行できます。

analyzerのグローバルな概念には、アプリケーション内で処理する入力データを分類して分割するためのcontentCategoriesenableSegmentの概念が含まれるようになりました。 このアナライザー機能は、入力ファイル全体の分類を実行できます。 また、入力ファイル内の 1 つのドキュメントの複数のドキュメントまたは複数のインスタンスを識別することもできます。

GA バージョン以降では、ドキュメント分類とビデオセグメント化の設計が統一され、モダリティに関係なく入力データを処理するための一貫したアプローチが可能になります。 このドキュメントでの "Content Understanding 分類" とは、入力データ (contentCategoriesenableSegment) の分類と分割に必要な分析操作を指します。

ビジネス ユース ケース

Content Understanding 分類を使用すると、さまざまな形式とテンプレートで複雑なドキュメントやビデオを処理できます。

  • 請求書: 必要に応じて、複数のベンダーからの請求書を分類し、異なるコンテンツ解釈アナライザーを使用して各カテゴリを処理します。
  • 税務書類: 複数の税務書類を 1040 や 1099 などのさまざまな種類の税フォームに分類します。
  • 契約: 長い非構造化契約を分類して運用を効率化し、さまざまな種類の契約とその具体的な法的影響を理解します。
  • スポーツ ビデオ: シーンを自動的にセグメント化して、広告や実際のスポーツ コンテンツなどの論理的なチャンクに分割します。

分類/セグメント化の機能

Content Understanding では、単一または複数ファイルのドキュメントを分析して、入力ファイルを定義されたカテゴリに分類できるかどうかを識別できます。 次のシナリオがサポートされています。

ドキュメントのシナリオ:

  • 分類のみ: 入力ファイル全体を分類します。 たとえば、ローン申請フォームなど、1 つのドキュメントの種類を含む 1 つのファイルです。
  • 分類と分析: 入力を目的の抽出アナライザーにルーティングすることで、入力ファイルを分類および分析します。
  • 分類とセグメント: 複数の種類またはドキュメントのインスタンスが連結されている可能性がある 1 つの入力ファイルを分類してセグメント化します。 たとえば、ローン申請フォーム、支払伝票、銀行明細書を含むローン申請パッケージなどです。 もう 1 つの例は、1 つのファイル内のスキャンされた請求書のコレクションです。
  • 分類、セグメント、分析: セグメントが分類されたら、各セグメントを目的の抽出アナライザーにルーティングして、さらにフィールド抽出を行います。
  • 階層分類子: カテゴリに応じたオプションの追加分析は、分類子アナライザーにすることもできます。

ビデオ のシナリオ:

  • セグメントのみ: descriptioncontentCategoriesフィールドで定義されたコンテンツ特性に基づいて、ビデオをセグメントに分割します。 たとえば、スポーツ放送をゲームプレイ、コマーシャル、解説セグメントに分割します。
  • セグメント化と分析: ビデオをセグメントに分割し、フィールド抽出のために各セグメントをアナライザーにルーティングします。

ドキュメントの分類の最小単位は 1 ページです。 ページ内分類はサポートされていません。

分類カテゴリを作成する

Content Understanding 分類では、トレーニング データセットは必要ありません。 分析操作では、最大 200 個のカテゴリ名と説明を定義できます。 既定では、ファイル全体は 1 つのコンテンツ オブジェクトとして扱われます。つまり、ファイルは 1 つのカテゴリに関連付けられます。

GA バージョン以降では、other内に contentCategories カテゴリを含めて、定義されたカテゴリのいずれかに対してコンテンツが一致しないようにする必要があります。 otherカテゴリが含まれていない場合、すべてのファイルは定義されたカテゴリのいずれかに分類されます。 contentCategories内で定義する各カテゴリ名には、定義しているカテゴリに関する詳細情報を提供するdescriptionを含めることもできます。

入力ファイルの分割

ファイルに複数のドキュメントがある場合、分類子は、分割機能を使用して入力ファイルに含まれるさまざまなドキュメントの種類を識別できます。 分類子の応答には、ファイル内に含まれる識別されたドキュメントの種類ごとにページ範囲が含まれます。 この応答には、同じドキュメントの種類のインスタンスを複数含めることができます。

analyze操作を実行すると、分割動作をきめ細かく制御できるenableSegment プロパティが含まれるようになりました。 ページ番号を指定して、入力ドキュメントの特定のページのみを分析することもできます。

  • 入力ファイル全体を分類のために結合された複数のドキュメントとして扱うために、 enableSegmenttrue に設定します。 その場合、サービスは入力ファイル内のセグメントのカテゴリを自動的に返します。
  • 入力ファイル全体を 1 つのドキュメントとして扱うために、 enableSegmentfalse に設定します。

ビデオの場合、セグメント化のみがサポートされます。 単一の contentCategories は、enableSegment に設定した true で定義する必要があります。 descriptionフィールドを使用して、ビデオをセグメントに分割する条件を指定します。

省略可能な分析

完全なエンド ツー エンド フローでは、分類子カテゴリを既存のカスタム アナライザーおよび事前構築済みアナライザーとリンクできます。 リンクされたアナライザーを使用してカテゴリに分類されたコンテンツ オブジェクトごとに、サービスは、対応するアナライザーを使用してコンテンツ オブジェクトに対する分析を自動的に呼び出します。

たとえば、このリンクの設定を使用して、ドキュメント内に複数の種類のフォームが含まれる PDF からの請求書のみを識別および分析する分類子を作成できます。 analyzerIdを事前構築済みのアナライザーまたはカスタム アナライザーのいずれかに設定して、分類されたドキュメントまたはページからフィールド抽出をルーティングして実行します。

また、分類する analyzerId の設定は省略できますが、分類されたファイルまたはセグメントに対してコンテンツ分析を実行することはできません。

最上位レイヤーでは、 omitContent を true に指定して、元のコンテンツ オブジェクトを省略し、分類されたセグメントまたはファイルに対して実行された他の分析からコンテンツ オブジェクトのみを返すこともできます。

階層分類子

新しく設計されたアナライザー操作により、階層的な分割と分類が可能になります。 たとえば、基本アナライザー操作内で、カスタム アナライザーで定義したコンテンツ カテゴリの analyzerID を設定し、ニーズに応じて追加の分類または分割を実行できます。 階層型アナライザーを定義すると、請求書、コントラクト、レシートなどのさまざまな種類のドキュメントを分類するなどのシナリオで、これらのカテゴリごとに analyzerID を使用して、請求書、コントラクト、およびレシート内のさまざまな種類のファイルに対して追加の分類を有効にした分析操作を行うこともできます。

ドキュメント入力では 5 レベルの入れ子がサポートされ、ビデオ入力では 2 つサポートされます。

分類子の制限

サポートされている入力ドキュメントの形式と分類子の制限については、「サービスのクォータと制限」を参照してください。

ベスト プラクティス

分類と分割の品質を向上させるには、適切なカテゴリ名と説明を使用して、特定のコンテキストを持つカテゴリをモデルが理解できるようにします。 カテゴリ名と説明の詳細については、「ベスト プラクティス」を参照してください。

主な利点

  • 正確性と信頼性: 正確なドキュメント分類を確保して、エラーを減らし、効率を高めます。
  • スケーラビリティ: ビジネス需要に合わせてドキュメント処理をスケールアウトします。
  • カスタマイズ可能: 特定のワークフローに合わせてドキュメント分類子を調整します。

サポートされている言語とリージョン

サポートされている言語とリージョンの一覧については、「言語とリージョンのサポート」を参照してください。

データのプライバシーとセキュリティ

コンテンツ解釈を使用する開発者は、顧客データに関する Microsoft ポリシーを確認する必要があります。 詳細については、「データ、保護、プライバシー」を参照してください。