다음을 통해 공유


모델 테스트 데이터 선택 및 매핑

Analysis Services에서 정확도 차트를 만들려면 모델을 테스트하는 데 사용할 데이터를 선택하고 데이터를 모델에 매핑해야 합니다.

기본적으로 Analysis Services는 마이닝 구조를 빌드할 때 홀드아웃 데이터 집합을 만든 경우 마이닝 모델 테스트 데이터를 사용합니다. 홀드아웃 테스트 집합을 만드는 것이 동일한 마이닝 구조를 기반으로 하는 모델을 테스트하는 가장 쉬운 방법입니다. 열 이름 및 데이터 형식은 항상 모델과 일치하므로 데이터 분포가 비슷하다는 것을 합리적으로 확신할 수 있습니다. 또한 디자이너는 입력 열과 모델 열 간의 관계를 자동으로 만듭니다.

또는 외부 데이터 원본을 지정할 수 있습니다. 외부 데이터의 경우 다음과 같은 몇 가지 추가 요구 사항이 있습니다.

  • 외부 데이터 집합은 Analysis Services 인스턴스에서 데이터 원본 뷰로 정의되어야 합니다.

  • 외부 데이터 집합에는 마이닝 모델의 예측 가능한 열에 매핑할 수 있는 열이 하나 이상 포함되어야 합니다. 일부 열을 무시하도록 선택할 수 있습니다.

  • 다른 데이터 원본 뷰에서 새 열을 추가하거나 열을 매핑할 수 없습니다. 선택한 데이터 원본 뷰에는 예측 쿼리에 필요한 모든 열이 포함되어야 합니다.

  • 외부 열 이름이 모델의 이름과 정확히 일치하면 디자이너가 해당 이름을 매핑합니다. 매핑이 잘못된 경우 해당 매핑을 변경하거나 기존 열에 대한 새 매핑을 삭제하고 만들 수 있습니다.

  • 외부 데이터 원본을 사용하는 경우 필터를 적용하여 테스트 데이터를 관련 사례 하위 집합으로 제한할 수 있습니다.

  • 홀드아웃 테스트 집합을 사용하는 경우에도 필터가 마이닝 구조와 연결된 테스트 데이터와 마이닝 모델 테스트 사례 간에 차이를 일으킬 수 있다는 점에 유의해야 합니다.

이 항목에서는 테스트 데이터를 선택하고 매핑하는 방법을 설명합니다.

입력 테이블을 선택하여 마이닝 모델의 정확도 테스트

모델 열을 테스트 데이터의 열에 매핑

테스트 데이터의 열이 모델에 매핑되는 방식 변경

입력 테이블을 선택하여 마이닝 모델의 정확도를 테스트하려면

  1. SSDT(SQL Server Data Tools)의 데이터 마이닝 디자이너에서 차트를 작성하려는 모델이 포함된 마이닝 구조를 두 번 클릭합니다.

  2. 마이닝 정확도 차트 탭을 선택합니다.

  3. 마이닝 정확도 차트 보기의 입력 선택 탭에서 다음 옵션 중 하나를 선택합니다.

    마이닝 모델 테스트 사례 사용

    마이닝 구조 테스트 사례 사용

    다른 데이터 집합 지정

  4. 다른 데이터 집합 지정을 선택한 경우 선택적으로 필터 편집기 열기를 클릭하여 입력 데이터 집합에 필터 조건을 만듭니다. OK를 클릭합니다.

  5. 차트 리프트 탭 또는 분류 행렬 탭을 클릭하여 지정한 테스트 데이터를 사용하여 차트를 자동으로 작성합니다.

모델 열을 테스트 데이터의 열에 매핑하려면

  1. 차트에 포함할 모델이 포함된 마이닝 구조를 두 번 클릭하여 데이터 마이닝 디자이너에서 구조 및 모델을 엽니다.

  2. 마이닝 정확도 차트 탭을 선택한 다음 입력 선택 탭을 선택합니다.

  3. 입력 선택 탭의 정확도 차트에 사용할 데이터 집합 선택에서 다른 데이터 집합 지정을 선택합니다.

  4. 찾아보기 단추 (...) 를 클릭하여 대화 상자를 열고 외부 데이터 집합의 정의를 작성합니다.

  5. 마이닝 구조 선택 대화 상자에서 작업할 모델이 포함된 마이닝 구조를 선택한 다음 확인을 클릭합니다.

  6. 선택 입력 테이블 테이블이 있는 마이닝 정확도 차트 탭에서 사례 테이블 선택를 클릭하여 테이블 선택 대화 상자를 엽니다.

  7. 테이블 선택 대화 상자의 데이터 원본 목록에서 데이터 원본을 선택합니다. 예측 쿼리에서 모델의 정확도를 결정하는 데 사용할 데이터가 포함된 테이블을 선택합니다.

  8. 테이블/뷰 이름 상자에서 모델을 테스트하는 데 사용할 데이터가 포함된 테이블을 선택합니다.

  9. 필요한 경우 매핑을 편집합니다. 마이닝 구조의 열은 입력 테이블에서 이름이 같은 열에 자동으로 매핑됩니다. 매핑을 수동으로 만들려면 입력 테이블 선택 테이블에서 열을 클릭하고 마이닝 구조 테이블의 해당 열로 끕니다. 매핑을 삭제하려면 마이닝 구조 테이블의 열을 입력 테이블 선택 테이블의 매핑된 열에 연결하는 줄을 클릭한 다음 DELETE 키를 누릅니다.

  10. OK를 클릭합니다.

입력 데이터가 모델에 매핑되는 방식을 수정하려면

  1. 데이터 마이닝 디자이너에서 차트를 작성할 모델이 포함된 구조를 두 번 클릭합니다.

  2. 마이닝 정확도 차트 탭을 선택합니다.

  3. 입력 선택 탭을 클릭합니다.

  4. 정확도 차트에 사용할 데이터 집합 선택에서 다른 데이터 집합 지정 옵션을 선택합니다.

  5. 찾아보기 단추 (...) 를 클릭하여 대화 상자를 열고 외부 데이터 원본의 정의를 작성합니다.

  6. 열 매핑 지정 대화 상자에서 사례 테이블 선택을 클릭합니다.

  7. 테이블 선택 대화 상자의 목록에서 데이터 원본 뷰를 선택하고 사례 데이터가 포함된 테이블을 선택합니다. OK를 클릭합니다.

  8. 필요한 테이블을 사용할 수 없는 경우 대화 상자를 닫고 테이블이 포함된 새 데이터 원본 뷰를 만듭니다. 데이터 원본 뷰를 만드는 방법에 대한 자세한 내용은 데이터 원본 뷰 정의(Analysis Services)를 참조하세요.

  9. 마이닝 모델에 중첩 테이블이 포함된 경우 중첩 테이블 선택을 클릭하고 데이터 원본 뷰의 테이블 목록에서 중첩 테이블을 선택합니다. OK를 클릭합니다.

  10. 수정할 매핑의 조인 줄을 선택하고 연결 수정을 선택합니다.

    매핑 수정 대화 상자가 열립니다. 이 대화 상자의 표에서 마이닝 구조 열 은 선택한 마이닝 구조에 포함된 각 열을 나열하고 테이블 은 마이닝 구조의 열에 매핑된 입력 테이블의 열을 나열합니다.

  11. 테이블 열 아래에서 관계를 수정하려는 마이닝 구조 열 아래의 행에 해당하는 행을 선택합니다. 목록에서 새 열을 선택하거나 목록에서 빈 항목을 선택하여 열을 삭제합니다.

  12. OK를 클릭합니다.

    새 열 매핑이 열 매핑 지정 대화 상자에 표시됩니다. 열 사이의 줄을 선택하고 DELETE 키를 눌러 매핑을 제거할 수 있습니다. 마이닝 구조 테이블에서 열을 선택하고 SelectInput Table 테이블의 해당 열로 끌어 새 연결을 만들 수 있습니다.

또한 참조하십시오

테스트 및 유효성 검사 작업 및 방법(데이터 마이닝)