次の方法で共有


探索および検索パターン

現代のエージェントは、多様なデータソースからの情報に効果的にアクセス・処理するために高度な検索・検索機能を必要としています。 本記事では、エージェントアーキテクチャにおける検索と検索の実装における4つの主要なパターン、すなわちMicrosoftの組み込み検索機能、構造化データベースクエリ、カスタムセマンティックインデックス、そしてハイブリッド多段階アプローチを検証します。

各パターンは、開発者の労力、制御の細かさ、性能特性の面で独自の利点とトレードオフを提供します。 これらのパターンを理解することで、ソリューションアーキテクトは自社の具体的なユースケース、既存インフラ、パフォーマンス要件に基づいて最適なアプローチを選択することができます。

主な考慮事項:

以下のセクションでは、各パターンのアーキテクチャ、実装の考慮点、最適なユースケースを詳述し、検索および検索戦略の意思決定を導きます。

組み込みの検索機能

Microsoftの組み込み検索機能は、Microsoft 365インフラストラクチャで管理される事前構築されたインデックスを使用することで、開発者の労力を最小限に抑えています。 これらの機能には、Copilotコネクター、SharePointナレッジベース、ウェブ検索機能が含まれます。

Copilotコネクタ、SharePointの知識、ウェブ検索を最小限の開発者設定で活用したMicrosoftの組み込み検索フローを示すアーキテクチャ図。

このモデルはMicrosoft 365エコシステムとのシームレスな統合を提供しますが、インデックスされたプロパティ、インデックス間隔、対応ファイル形式の制御はプラットフォーム提供の機能に限定されます。 検索の順序や順位付けは開発者の管理外であり、汎用検索シナリオには適していますが、専門的な要件には制限が出る可能性があります。

意味インデックスはデータの断片(短い抜粋)を返すため、完全な文書分析や包括的な表分析が必要なシナリオには適していません。 長いドキュメントの複数ページやスプレッドシート内の複数のテーブルから情報が必要なユースケースは、この検索タイプには最適ではありません。

構造化データベースクエリ

構造化クエリアーキテクチャは、言語モデルが既存のデータベースシステムに対して実行するためのクエリ言語文字列を生成する能力を利用しています。 このアプローチは、データベースストレージシステム内で既に解決された計算値や導出値を必要とするワークフローを最適化します。

構造化クエリフローを示す図で、言語モデルがユーザー入力からエンティティを抽出し、データベース実行のためのSQLまたはKQLクエリを生成する。

このモデルは、SQL、KQL、DAX(データ分析式)などの確立されたクエリ言語を通じて構造化データにアクセスする必要がある場合に優れています。 最適化されたデータベースビューは、一般的なクエリパターンを事前に計算し、言語モデルのデータアクセスを簡素化することでパフォーマンスをさらに向上させます。

開発者は包括的なドキュメントとフィールド説明を提供し、言語モデルが適切なクエリを作成できるようにします。 言語モデルはクエリ言語に精通していますが、効果的なクエリを生成するためにはデータ構造や関係に関する詳細な文脈が必要です。

カスタムセマンティックインデックス付け

カスタムセマンティックインデックス作成は、開発者が外部ホストのインデックスを作成し、カスタム解析、ランキング、辞書、スニペットサイズ設定を行う必要があります。 このアプローチは検索結果を細かく制御し、特定のコンテンツタイプやユースケースに特化した最適化を可能にします。

外部ホスティング、カスタム解析、細かな検索結果制御を備えたカスタムセマンティックインデックス実装を示すアーキテクチャ図。

カスタムセマンティックインデックスはMicrosoft 365ホストエージェントの外部ツールとして提供されるため、反復的な推論ループや複雑な多段階検索操作を可能にします。 この柔軟性は、ドメイン固有の最適化や専門的なコンテンツ処理を必要とする高度な検索シナリオをサポートします。

ハイブリッドマルチターンアプローチ

ハイブリッドアプローチは、初期ファイル識別のための構造化またはセマンティック検索と、包括的なコンテンツ分析のためのマルチターンフローを組み合わせます。 このパターンは、包括的な分析のパフォーマンス影響を管理しつつ、ファイル全体内容に対してより深い推論を提供します。

初期検索によるファイル識別と複数ターンフローによる完全なコンテンツ抽出と推論を用いるハイブリッド検索アプローチを示す図。

マルチターンフローは、完全な応答を生成するために複数のサービスコールが必要なため、追加の処理時間が必要です。 このアプローチは応答時間を犠牲にして完全性を提供し、包括的な分析が速度要件を上回るシナリオに適しています。

次のステップ

エージェントが外部システムとどのように相互作用し、単なる情報検索を超えた行動を行うかを決定してください。