次の方法で共有


電子情報開示のほぼ重複検出 (Premium)

重要

従来の電子情報開示エクスペリエンスは 、2025 年 8 月 31 日に廃止されました。 この廃止には、従来のコンテンツ検索、クラシック電子情報開示 (Standard)、クラシック電子情報開示 (Premium) が含まれます。 これらのオプションは、Microsoft Purview ポータルのエクスペリエンス オプションとしては使用できません。

特定の短期的な移行シナリオでこれらのレガシ機能を使用するときに Microsoft と直接作業する場合を除き、Microsoft Purview ポータル新しい電子情報開示エクスペリエンスのガイダンスを使用してください。

サブセットが同じテンプレートに基づいており、ほとんど同じボイラープレート言語を持ち、ところどころにいくつかの違いがある、レビュー対象の一連のドキュメントを考えてみましょう。 校閲者がこのサブセットを特定し、そのうちの 1 つを徹底的に確認し、残りの部分の違いを確認できる場合、カバーするすべてのドキュメントの読み取りにかかる時間をわずかしかかからずに、一意の情報を見逃す必要はありません。 準重複の検出グループは、テキスト的に類似したドキュメントをまとめてグループ化し、レビュープロセスをより効率的にします。

どのような仕組みですか?

準重複の検出が実行されると、システムはテキストを含むすべてのドキュメントを解析します。 次に、すべてのドキュメントを互いに比較して、それらの類似度を設定したしきい値よりも大きいかどうかを判断します。 大きい場合は、ドキュメントはグループ化されます。 すべてのドキュメントが比較およびグループ化されると、各グループのドキュメントが「ピボット」としてマークされます。ドキュメントのレビューでは、最初にピボットをレビューし、同じ準重複セット内の他のドキュメントをレビューして、ピボットとレビュー中のドキュメントの違いに焦点を合わせることができます。