다음을 통해 공유


마이닝 모델 테스트에 사용할 열 선택

마이닝 모델의 정확도를 측정하려면 먼저 평가하려는 결과를 결정해야 합니다. 대부분의 데이터 마이닝 모델에서는 모델을 만들 때 예측 가능한 특성으로 사용할 열을 하나 이상 선택해야 합니다. 따라서 모델의 정확도를 테스트할 때 일반적으로 테스트할 특성을 선택해야 합니다.

다음 목록에서는 테스트에 사용할 예측 가능한 특성을 선택하기 위한 몇 가지 추가 고려 사항을 설명합니다.

  • 일부 유형의 데이터 마이닝 모델은 여러 특성 간의 관계를 탐색할 수 있는 신경망과 같은 여러 특성을 예측할 수 있습니다.

  • 클러스터링 모델과 같은 다른 유형의 마이닝 모델에는 예측 가능한 특성이 반드시 있는 것은 아닙니다. 클러스터링 모델은 예측 가능한 특성이 없으면 테스트할 수 없습니다.

  • 산점도를 만들거나 회귀 모델의 정확도를 측정하려면 연속 예측 가능한 특성을 결과로 선택해야 합니다. 이 경우 대상 값을 지정할 수 없습니다. 산점도 이외의 항목을 만드는 경우 기본 마이닝 구조 열에는 불연속 또는 불연속화된 콘텐츠 형식도 있어야 합니다.

  • 불연속 특성을 예측 가능한 결과로 선택하는 경우 대상 값을 지정하거나 예측 값 필드를 비워 둘 수도 있습니다. 예측 값을 포함하는 경우 차트는 대상 값을 예측할 때 모델의 효과만 측정합니다. 대상 결과를 지정하지 않으면 모델은 모든 결과를 예측하는 정확도로 측정됩니다.

  • 여러 모델을 포함하고 단일 정확도 차트에서 비교하려는 경우 모든 모델은 동일한 예측 가능한 열을 사용해야 합니다.

  • 교차 유효성 검사 보고서를 만들면 Analysis Services는 예측 가능한 특성이 동일한 모든 모델을 자동으로 분석합니다.

  • 예측 열 및 값 동기화 옵션이 선택되면 Analysis Services는 이름과 일치하는 데이터 형식이 같은 예측 가능한 열을 자동으로 선택합니다. 열이 이러한 조건을 충족하지 않는 경우 이 옵션을 끄고 예측 가능한 열을 수동으로 선택할 수 있습니다. 모델과 열이 다른 외부 데이터 집합으로 모델을 테스트하는 경우 이 작업을 수행해야 할 수 있습니다. 그러나 데이터 형식이 잘못된 열을 선택하면 오류 또는 잘못된 결과가 발생합니다.

예측할 결과 지정

  1. 마이닝 구조를 두 번 클릭하여 데이터 마이닝 디자이너에서 엽니다.

  2. 마이닝 정확도 차트 탭을 선택합니다.

  3. 입력 선택 탭을 선택합니다.

  4. 입력 선택 탭의 예측 가능한 열 이름 아래에서 차트에 포함하는 각 모델에 대해 예측 가능한 열을 선택합니다.

    예측 가능한 열 이름 상자에서 사용할 수 있는 마이닝 모델 열은 사용 유형이 Predict 또는 Predict Only로 설정된 열에만 해당합니다.

  5. 모델의 리프트를 확인하려면 예측 값 목록에서 선택하여 측정할 특정 결과 값을 선택해야 합니다.

또한 참조하십시오

모델 테스트 데이터 선택 및 매핑
정확도 차트 종류 선택 및 차트 옵션 설정