ソリューションのアイデア
この記事ではソリューションのアイデアについて説明します。 クラウド アーキテクトはこのガイダンスを使用すると、このアーキテクチャの一般的な実装の主要コンポーネントを視覚化しやすくなります。 ワークロードの特定の要件に適合する、適切に設計されたソリューションを設計するための出発点として、この記事を使用してください。
このコンテンツ処理ソリューションは、信頼度スコア付けとユーザー検証を通じてデータを抽出し、マルチモーダル コンテンツ全体にスキーマを適用します。 非構造化コンテンツから情報を抽出し、構造化された形式にマッピングすることで、要求、請求書、契約、およびその他のドキュメントを処理します。
このアーキテクチャでは、Microsoft Foundry、Azure Content Understanding、Foundry Models の Azure OpenAI、およびその他の Azure サービスを使用して、イベントドリブン処理パイプラインを介して大量の非構造化コンテンツを変換します。 テキスト、画像、テーブル、グラフを処理し、ビジネス ドキュメント ワークフローの自動品質チェックと人間によるレビュー機能を提供します。
アーキテクチャ
このアーキテクチャの Visio ファイルをダウンロードします。
Workflow
次のワークフローは、上記のダイアグラムに対応しています。
ユーザーは、Web フロントエンド インターフェイスを使用して、ドキュメント、画像、コントラクト、請求書などのマルチモーダル コンテンツをアップロードします。 ユーザーは、特定の処理要件とターゲット スキーマを含むコンテンツを送信します。
Azure Container Apps Web サイトは、コンテンツアップロード要求を受け取り、Container Apps でホストされている処理 API を呼び出します。 ソフトウェア チームは、両方のコンポーネント用のカスタム コードを開発して、このシナリオに合わせて調整します。 API は適切な処理パイプラインを選択し、コンテンツ分析ワークフローを開始します。
Container Apps は処理ワークフローを管理し、Content Understanding を Azure OpenAI に接続します。
Content Understanding は、機械学習ベースの光学式文字認識 (OCR) を実行し、画像、テーブル、グラフなどのさまざまなコンテンツ形式からテキストを抽出します。
GPT Vision を使用した Azure OpenAI は、抽出されたコンテンツを処理し、それをカスタムまたは業界で定義されたスキーマにマップし、信頼度スコアリングを含む構造化された JSON 出力を生成します。
Container Apps のオーケストレーション コードは、Azure Cosmos DB の監査証跡と継続的な改善のために、処理された結果、信頼度スコア、スキーマ マッピング、履歴処理データを格納します。
Container Apps のオーケストレーション コードでは、Azure Blob Storage を使用して、信頼性の高いデータの永続化と取得のために、ソース ドキュメント、中間処理成果物、および最終的な構造化出力を格納します。
Azure Queue Storage は、このソリューションのサービス間のイベント ドリブン処理ワークフローを管理します。 この管理により、パイプライン コンポーネント全体の信頼性の高いメッセージ処理と処理の調整が保証されます。
コンテンツ プロセッサ モニター Web サイトには、Web インターフェイスを介して処理された結果がユーザーに表示されます。 ユーザーは、構造化された JSON 出力を確認し、不正確な情報を修正し、コンテキストまたはフィードバックのコメントを追加して、検証された最終的な結果をシステムに保存できます。
コンテンツ プロセッサ モニター Web サイトは、処理メトリックとユーザー フィードバック データを Power BI ダッシュボードに直接フィードします。 Azure Cosmos DB に格納されている処理されたデータとメタデータは、次の分析情報を含むコンテンツ処理パイプラインの分析を提供します。
- 主要業績評価指標 (KPI)
- 成功率
- ドキュメントの種類の分布
- 信頼度スコアの傾向
- ユーザー修正パターン
- コンテンツ処理パイプラインのデータドリブン最適化をサポートするその他の運用メトリック
コンポーネント
Container Apps は、マイクロサービスとコンテナー化されたアプリケーションを実行するサーバーレス コンテナー プラットフォームです。 このアーキテクチャでは、Container Apps は、コンテンツ分析を調整し、AI サービス間で調整し、抽出ワークフローと変換ワークフローを管理する処理パイプライン API をホストします。 ソフトウェア エンジニアリング チームがカスタム コードを開発します。
Foundry は、自然言語の処理と生成のための高度な言語モデルへのアクセスを提供するマネージド AI サービスです。 このアーキテクチャでは、Foundry は、コンテンツ処理パイプラインで使用される AI モデルをデプロイおよび管理するための基盤を提供します。 また、Content Understanding などの接続済み AI サービスへのゲートウェイとしても機能します。
Azure OpenAI は Foundry のコンポーネントであり、GPT-4o や GPT-4o mini などの言語モデルを提供します。 このアーキテクチャでは、Foundry はサービスとしてモデルをホストします。 これらのモデルは、スキーマベースのデータ変換を実行し、抽出されたコンテンツを構造化された形式にマップし、抽出精度の信頼度スコアを計算します。
Content Understanding は、オーディオ、ビデオ、テキスト、画像など、さまざまな種類のメディア コンテンツを分析するマルチモーダル AI サービスです。 コンテンツを構造化された検索可能なデータに変換します。 このアーキテクチャでは、Content Understanding はマルチモーダル ドキュメントからの高度な OCR とコンテンツ抽出を実行します。
Azure Cosmos DB は、低待機時間と柔軟なスケーラビリティを保証する、グローバルに分散された複数モデルのデータベース サービスです。 このアーキテクチャでは、Azure Cosmos DB は、監査証跡とパフォーマンスの最適化のために、処理された結果、信頼度スコア、検証結果、履歴処理データを格納します。
Blob Storage は、大量の非構造化データを格納するために最適化されたオブジェクト ストレージ ソリューションです。 このアーキテクチャでは、Blob Storage はソース ドキュメント、中間処理成果物、および最終的な構造化された出力を保持します。 これは、永続的でグローバルに使用可能なストレージを提供します。
Azure Container Registry は、コンテナー イメージを格納および管理するマネージド Docker レジストリ サービスです。 このアーキテクチャでは、Container Registry は処理パイプライン コンポーネントのバージョン管理されたコンテナー イメージを管理します。 このシステムにより、一貫性のあるデプロイとロールバックの機能が保証されます。
Power BI は、ビジネス分析情報の作成、共有、使用を支援するために連携するソフトウェア サービス、アプリ、コネクタのコレクションです。 このアーキテクチャでは、Power BI は Azure Cosmos DB に接続し、監視 Web アプリケーションからリアルタイム処理メトリックを受け取り、ドキュメント処理のパフォーマンス、ユーザー フィードバック パターン、運用 KPI に関する分析を提供します。
選択肢
このアーキテクチャには、ワークロードの機能要件と非機能要件に応じて、他の Azure サービスまたはアプローチに置き換えることができる複数のコンポーネントが含まれています。 次の代替手段とトレードオフを検討してください。
コンテンツ抽出アプローチ
現在のアプローチ: このソリューションでは、高度な OCR とコンテンツ抽出に Content Understanding を使用し、スキーママッピングと変換に Azure OpenAI と組み合わせて使用します。 この方法では、複雑なマルチモーダル コンテンツの精度が高く、柔軟なスキーマのカスタマイズがサポートされます。
別の方法: 請求書、領収書、フォームなどの一般的なドキュメントの種類に対して事前構築済みのモデルを使用して、ドキュメント処理に Azure ドキュメント インテリジェンスを使用します。 この方法では、標準のドキュメントの種類に対する実装が高速化されますが、カスタム スキーマの柔軟性は低くなります。
ワークロードに次の特性がある場合は、この代替手段を検討してください。
主に、適切に定義された書式を持つ標準のドキュメントの種類を処理します。
事前構築済みの抽出モデルを使用して、市場投入までの時間を短縮する必要があります。
スキーマ要件は、標準のドキュメント インテリジェンス モデルと一致します。
スキーマ マッピング用のカスタム開発リソースが制限されています。
オーケストレーションの処理
現在のアプローチ: このソリューションでは、Container Apps を使用して、コンテンツ分析パイプラインを調整するカスタム処理ロジックをホストします。 この方法では、処理ワークフロー、エラー処理、およびカスタム ビジネス ロジック統合を最大限に制御できます。
別の方法: AI サービスへの組み込みコネクタを使用したワークフロー オーケストレーションには、Azure Logic Apps または Azure Functions を使用します。 このアプローチでは、視覚的なワークフロー設計とマネージド サービスの利点が得られますが、処理ロジックの制御は少なくなります。
ワークロードに次の特性がある場合は、この代替手段を検討してください。
カスタム コード開発よりも視覚的なワークフロー設計を優先します。
処理ワークフローは比較的単純であり、標準の条件付きロジックを使用します。
インフラストラクチャ管理のオーバーヘッドを最小限に抑える必要があります。
チームは、コンテナー化されたアプリケーションよりも低コードおよびコードなしのソリューションに関する専門知識を持っています。
シナリオの詳細
組織によっては、大量の非構造化マルチモーダル コンテンツから、毎日意味のあるデータを抽出しています。 コントラクト、請求書、クレーム、コンプライアンス レポートなどのドキュメントの従来の手動処理は、時間がかかり、エラーが発生しやすく、ビジネスの成長に合わせてスケーリングされません。 その結果、組織は一貫性のないデータ品質、標準化の欠如、抽出された情報をダウンストリームのビジネス プロセスに統合することが困難になります。 このコンテンツ処理ソリューションは、これらの問題に対処します。
このソリューションでは、高度な AI サービスを使用して、さまざまな種類のドキュメントからコンテンツを自動的に抽出、変換、検証します。 システムは信頼度スコアリングを提供し、信頼度の高い抽出の自動処理を可能にしながら、人間のレビューのために信頼度の低い結果にフラグを設定します。 このアプローチにより、速度と精度の両方が確保され、多様なコンテンツ形式とカスタム ビジネス スキーマを処理する柔軟性が維持されます。
考えられるユース ケース
次の潜在的なユース ケースについて考えてみましょう。
金融サービスの処理
要求処理の自動化: 自動検証とコンプライアンスチェックを使用して、保険金請求のドキュメント、写真、調整者レポートからポリシーの詳細、損害評価、コスト見積もりを抽出します。
請求書と契約の処理: 請求書と契約からベンダー情報、品目、条件、条件を自動的に抽出し、承認ワークフローの信頼度スコアリングを使用してエンタープライズ システムにマップします。
規制ドキュメント分析: 規制のファイリング、コンプライアンス レポート、監査ドキュメントを処理して、主要なメトリックを抽出し、財務規制とレポート要件への準拠を確保します。
医療に関するドキュメント
臨床文書処理: 医療記録、ラボレポート、臨床ノートから患者情報、診断、治療計画、および医薬品情報を抽出し、電子健康記録統合を行います。
医療請求の自動化: 医療請求、請求明細書、保険フォームを処理して、自動請求ワークフローのプロシージャ コード、患者の詳細、カバレッジ情報を抽出します。
調査データの抽出: 臨床試験のドキュメント、研究論文、および患者の同意フォームを分析して、医療研究ワークフローの研究パラメーター、結果、コンプライアンス データを抽出します。
法的およびコンプライアンス
コントラクトの分析と抽出: 法的契約、契約、および修正を処理して、契約管理とコンプライアンスの監視のための主要な条件、義務、日付、および関係者を抽出します。
法的ドキュメントの検出: 訴訟のサポートとケースの準備に関する関連する事実、引用、証拠を抽出するために、法的な概要、堆積物、およびケース ファイルを分析します。
コンプライアンスに関するドキュメント: 規制の提出、監査レポート、コンプライアンス証明書を処理して、ガバナンス ワークフローの要件、結果、是正措置を抽出します。
製造とサプライ チェーン
品質ドキュメントの処理: 品質管理のドキュメントと証明書から検査結果、テスト データ、および認定の詳細を抽出します。 抽出されたデータを使用して、コンプライアンスの追跡とプロセスの改善を行います。
サプライヤーのドキュメント: 調達ワークフローのコンプライアンス データとサプライ チェーン情報を抽出するために、ベンダーの認定、材料仕様、出荷ドキュメントを処理します。
メンテナンス レコード分析: 予測メンテナンスおよび資産管理システムの技術ドキュメントから、機器データ、メンテナンス スケジュール、修理履歴を抽出します。
考慮事項
これらの考慮事項は、ワークロードの品質向上に使用できる一連の基本原則である Azure Well-Architected Framework の要素を組み込んでいます。 詳細については、「 Well-Architected Framework」を参照してください。
コストの最適化
コストの最適化では、不要な経費を削減し、運用効率を向上させる方法に重点を置いています。 詳細については、「コスト最適化の設計レビュー チェックリスト」を参照してください。
このシナリオを実行するためのコストの詳細については、 Azure 料金計算ツールで構成済みの見積もりを参照してください。
価格はリージョンと使用状況によって異なるため、デプロイの正確なコストを予測することはできません。 このインフラストラクチャのほとんどの Azure リソースは、使用量ベースの価格レベルに従います。 ただし、Container Registry では、レジストリごとに 1 日あたりの固定コストが発生します。
このシナリオのデプロイ
このアーキテクチャの実装をデプロイするには、 GitHub リポジトリの手順に従います。
貢献者達
Microsoft では、この記事を保持しています。 次の共同作成者がこの記事を書きました。
主要著者:
- ソロモン・ピケット |ソフトウェア エンジニア II
その他の共同作成者:
- アニッシュ・アローラ |シニア ソフトウェア エンジニア
- トッドハーマン |プリンシパル ソフトウェア エンジニア
- マロリーローズ |シニア ソフトウェア エンジニア
公開されていない LinkedIn プロフィールを見るには、LinkedIn にサインインしてください。