다음을 통해 공유


구조에 마이닝 모델 추가(Analysis Services - 데이터 마이닝)

마이닝 구조는 여러 마이닝 모델을 지원하기 위한 것입니다. 따라서 마법사를 완료한 후 구조를 열고 새 마이닝 모델을 추가할 수 있습니다. 모델을 만들 때마다 다른 알고리즘을 사용하거나, 매개 변수를 변경하거나, 필터를 적용하여 데이터의 다른 하위 집합을 사용할 수 있습니다.

새 마이닝 모델 추가

데이터 마이닝 마법사를 사용하여 새 마이닝 모델을 만들 때는 기본적으로 항상 마이닝 구조를 먼저 만들어야 합니다. 그런 다음 마법사는 구조에 초기 마이닝 모델을 추가하는 옵션을 제공합니다. 그러나 모델을 바로 만들 필요는 없습니다. 구조만 만드는 경우 예측 가능한 특성으로 사용할 열이나 특정 모델에서 데이터를 사용하는 방법을 결정할 필요가 없습니다. 대신 나중에 사용할 일반 데이터 구조를 설정하고 나중에 데이터 마이닝 디자이너 를 사용하여 구조를 기반으로 하는 새 마이닝 모델을 추가할 수 있습니다.

비고

DMX에서 CREATE MINING MODEL 문은 데이터 마이닝 모델에서 시작합니다. 즉, 선택한 마이닝 모델을 정의하고 Analysis Services는 기본 구조를 자동으로 생성합니다. 나중에 ALTER STRUCTURE... ADD MODEL 문을 사용하여 해당 구조에 새 마이닝 모델을 계속 추가할 수 있습니다.

알고리즘 선택

기존 구조에 새 모델을 추가할 때 가장 먼저 해야 할 일은 해당 모델에서 사용할 데이터 마이닝 알고리즘을 선택하는 것입니다. 알고리즘을 선택하는 것은 각 알고리즘이 다른 유형의 분석을 수행하고 요구 사항이 다르기 때문에 중요합니다.

데이터와 호환되지 않는 알고리즘을 선택하면 경고가 표시됩니다. 경우에 따라 알고리즘에서 처리할 수 없는 열을 무시해야 할 수 있습니다. 다른 경우에는 알고리즘이 자동으로 조정됩니다. 예를 들어 구조에 숫자 데이터가 포함되어 있고 알고리즘이 불연속 값만 사용할 수 있는 경우 숫자 값을 개별 범위로 그룹화합니다. 경우에 따라 먼저 키를 선택하거나 예측 가능한 특성을 선택하여 데이터를 수동으로 수정해야 할 수 있습니다.

새 모델을 만들 때 알고리즘을 변경할 필요가 없습니다. 동일한 알고리즘을 사용하지만 데이터를 필터링하거나 클러스터링 메서드 또는 최소 항목 집합 크기와 같은 매개 변수를 변경하여 매우 다른 결과를 얻을 수 있는 경우가 많습니다. 최상의 결과를 생성하는 매개 변수를 확인하기 위해 여러 모델을 실험하는 것이 좋습니다.

모든 새 모델을 사용하려면 모든 새 모델을 처리해야 합니다.

새 마이닝 모델에서 열 사용 지정

기존 마이닝 구조에 새 마이닝 모델을 추가하는 경우 모델에서 각 데이터 열을 사용하는 방법을 지정해야 합니다. 모델에 대해 선택한 알고리즘의 유형에 따라 기본적으로 이러한 선택 항목 중 일부가 선택될 수 있습니다. 열의 사용 유형을 지정하지 않으면 열이 마이닝 구조에 포함되지 않습니다. 모델이 지원하는 경우, 열의 데이터를 계속해서 세부 조회에 사용할 수 있습니다.

모델에서 사용되는 마이닝 구조의 열(무시로 설정되지 않은 경우)은 키, 입력 열, 예측 가능한 열 또는 예측 가능한 열이어야 하며 이 열 값은 모델에 대한 입력으로도 사용됩니다.

  • 키 열에는 테이블의 각 행에 대한 고유 식별자가 포함됩니다. 시퀀스 클러스터링 또는 시계열 알고리즘을 기반으로 하는 마이닝 모델과 같은 일부 마이닝 모델에는 여러 키 열이 포함될 수 있습니다. 그러나 이러한 여러 키는 관계형 측면에서 복합 키가 아니라 시계열 및 시퀀스 클러스터링 분석을 지원하도록 선택해야 합니다.

  • 입력 열은 예측이 이루어지는 정보를 제공합니다. 데이터 마이닝 마법사는 예측 가능한 열을 선택할 때 사용하도록 설정된 제안 기능을 제공합니다. 이 단추를 클릭하면 마법사에서 예측 가능한 값을 샘플링하고 구조의 다른 열 중 어떤 열이 좋은 변수를 만드는지 결정합니다. 고유 값이 많은 키 열 또는 기타 열을 거부하고 결과와 상관 관계가 있는 것처럼 보이는 열을 제안합니다.

    이 기능은 데이터 세트에 마이닝 모델을 빌드하는 데 필요한 것보다 많은 열이 포함된 경우에 특히 편리합니다. 제안 기능은 데이터 세트의 각 열과 예측 가능한 열 간의 관계를 설명하는 숫자 점수를 0에서 1로 계산합니다. 이 점수에 따라 이 기능은 마이닝 모델에 대한 입력으로 사용할 열을 제안합니다. 제안 기능을 사용하는 경우 제안된 열을 사용하거나 필요에 맞게 선택을 수정하거나 제안을 무시할 수 있습니다.

  • 예측 가능한 열에는 마이닝 모델에서 예측하려는 정보가 포함됩니다. 여러 열을 예측 가능한 특성으로 선택할 수 있습니다. 클러스터링 모델은 예측 가능한 특성이 선택 사항이라는 예외입니다.

    모델 형식에 따라 예측 가능한 열은 특정 데이터 형식이어야 할 수 있습니다. 예를 들어 선형 회귀 모델에는 예측 값으로 숫자 열이 필요합니다. Naïve Bayes 알고리즘에는 불연속 값이 필요하며 모든 입력도 불연속이어야 합니다.

열 내용 지정

일부 열의 경우 열 콘텐츠를 지정해야 할 수도 있습니다. SQL Server 데이터 마이닝에서 각 데이터 열의 콘텐츠 형식 속성은 해당 열의 데이터를 처리하는 방법을 알고리즘에 알려줍니다. 예를 들어 데이터에 Income 열이 있는 경우 콘텐츠 형식을 연속으로 설정하여 열에 연속 번호가 포함되도록 지정해야 합니다. 그러나 콘텐츠 형식을 불연속화로 설정하고 필요에 따라 정확한 버킷 수를 지정하여 Income 열의 숫자를 버킷으로 그룹화하도록 지정할 수도 있습니다. 열을 다르게 처리하는 다른 모델을 만들 수 있습니다. 예를 들어 고객을 세 개의 연령 그룹으로 버킷하는 모델 하나와 고객을 10개 연령대로 버킷하는 다른 모델을 시도할 수 있습니다.

또한 참조하십시오

마이닝 구조체(Analysis Services - 데이터 마이닝)
관계형 마이닝 구조 만들기
마이닝 모델 속성
마이닝 모델 열