このタスクでは、サプライヤー ID ドメインとサプライヤー名ドメインに対してナレッジ検出アクティビティを実行します。 このシナリオでは、ナレッジ検出プロセスは主にこれら 2 つのドメインの値をインポートします。
このチュートリアルでは、最初からナレッジ ベースの構築を開始しました。 ナレッジ検出アクティビティを実行して、ナレッジ ベースの作成を開始することもできます。 メイン ページで [ ナレッジ ベースの作成 ] をクリックすると、DQS クライアントによって、そのアクティビティに対して ドメイン管理 アクティビティが選択されたページが表示されます。 アクティビティを Knowledge Discovery に変更すると、次のページでナレッジ検出プロセスの一部としてドメインを作成できます。 詳細については、「 ナレッジ検出の実行 」を参照してください。
DQS クライアントのメイン ページの [最近使用したナレッジ ベース] セクションで、[仕入先] ナレッジ ベースの横にある右矢印をクリックし、[ナレッジ検出] をクリックします。 または、[ナレッジ ベースを開く] をクリックし、ナレッジ ベースの一覧から [サプライヤー] を選択し、[アクティビティとしてナレッジ検出] を選択し、[次へ] をクリックします。
データ ソースの Excel ファイルを選択します。
[ 参照] をクリックし、Suppliers.xls移動 して選択し 、[ 開く] をクリックします。
ワークシート の検出の仕入先 を選択 します。
[マッピング] セクションで、ドロップダウン リストを使用して、Excel ファイルの SupplierID 列を仕入先 ID ドメインにマップし、仕入先名列を仕入先名ドメインにマップします。 Excel ファイルには、 仕入先 ID ドメインと 仕入先名 ドメインのサンプル データがあります。 検出プロセスでは、値を検出するドメインを選択できます。 このページでドメインを作成し、ソース列をそれらのドメインにマップできます。 ドメイン管理アクティビティ中にドメインを作成するのではなく、ナレッジ検出アクティビティ中にドメインを作成することは珍しくありません。
[ 次へ ] をクリックして、[ 検出 ] ページに切り替えます。
[ 検出 ] ページで、[ 開始 ] をクリックして検出プロセスを開始します。 検出は、Suppliers.xls ファイル内の SupplierID 列と仕入先名列に対して実行されます。 サプライヤー ID ドメインとサプライヤー名ドメインには、検出から得られたナレッジが設定されている必要があります。
分析が完了したら、ページの下部にある [プロファイラー] タブでソース統計を確認します。 合計 20 個の値を持つ 10 個の新しいレコード (Excel ワークシートの SupplierID と Supplier Name の値) が検出されました。 また、新しい値、一意の値、新しい値、一意の値、有効な値の数も表示されます。 右側のリスト ボックスには、検出プロセスに関係する各ドメインの詳細が表示されます。 [完了] 列のステータス バーの上にマウス ポインターを置くと、ソースの列に欠損値があるかどうかを確認できます。
[ 次へ ] をクリックして、[ ドメイン値の管理] ページに切り替えます。
[ ドメイン値の管理 ] ページで、ドメインの一覧から [ 仕入先名 ドメイン] をクリックします。
右側のウィンドウで、 Lazy Country Storex を右クリックし (末尾に "x" と表示されます)、 Lazy Country Store を選択します。 DQS では、ドメインでスペル チェックを実行した後にこの変更が提案されます。 既定では、作成したドメインでスペル チェックが有効になっています。
ドメイン値の一覧で、 Lazy Country Storex の値がエラー (赤い X マーク) として設定され、 Lazy Country Store も有効な値として 追加されていることを確認 します。
[完了] をクリックします。
[SQL Server Data Quality Services] ダイアログ ボックスで、[発行] をクリックします。
成功メッセージ ボックスで [ OK] を クリックします。
チュートリアルの最初のレッスンを完了しました。