구조체에 모델 추가를 클릭하면 기존 마이닝 구조에 사용할 새 마이닝 모델을 만드는 데 도움이 되는 마법사가 시작됩니다. 이 옵션은 동일한 데이터를 기반으로 하는 모델을 비교하거나 사용자 지정된 모델을 만들 수 있기 때문에 유용합니다.
Analysis Services 인스턴스에 필요한 데이터가 아직 포함되어 있지 않은 경우 마이닝 구조 만들기(SQL Server 데이터 마이닝 추가 기능) 마법사를 사용하여 마이닝 구조를 설정합니다. 또는 모델링 마법사 중 하나를 시작하고 마법사에서 만든 구조에 새 모델을 추가할 수 있습니다.
마법사에서 지원하지 않는 알고리즘을 사용하여 고급 모델을 만들려면 마이닝 구조를 만든 다음 데이터 마이닝 고급 쿼리 편집기를 사용하여 모델을 추가합니다.
기존 구조에 새 모델 추가
데이터 마이닝 리본에서 고급 아래의 화살표를 클릭한 다음 구조체에 모델 추가를 선택합니다.
구조 선택 대화 상자에서 사용할 데이터가 포함된 구조를 선택한 다음 다음을 클릭합니다.
팁: 필요한 데이터가 포함된 마이닝 구조가 확실하지 않은 경우 문서 모델 마법사를 사용하여 데이터에 대한 열 및 기본 통계를 확인합니다.
마이닝 구조를 찾을 수 없는 경우 현재 사용 중인 연결을 확인합니다. 다른 서버에 대한 연결을 열어야 할 수도 있습니다.
마이닝 알고리즘 선택 대화 상자에서 새 마이닝 모델에서 사용할 마이닝 알고리즘을 선택합니다.
대화 상자는 마법사에서 볼 수 있는 것보다 훨씬 더 많은 옵션을 제공합니다. 데이터가 호환되는 경우 Analysis Services 서버에서 지원되는 알고리즘을 사용하여 모델을 만들 수 있습니다.
또한 매개 변수 단추를 클릭하여 알고리즘 매개 변수 대화 상자를 열고 알고리즘에서 매개 변수를 사용자 지정하는 것이 좋습니다. 이 옵션은 사용자 지정 마이닝 모델을 만드는 가장 쉬운 방법입니다.
다음을 클릭합니다.
열 선택 대화 상자에서 열 목록을 검토하고 필요한 경우 열 사용을 다음 값 중 하나로 변경합니다.
입력. 열에 결과에 영향을 줄 수 있고 모델에 대한 입력으로 사용해야 하는 변수가 포함되어 있음을 나타냅니다.
입력 및 예측. 데이터를 입력으로 사용해야 하며 이러한 값도 예측하려고 했음을 나타냅니다.
예측 전용입니다. 데이터가 모델에 대한 입력으로 사용되어서는 안 됨을 나타냅니다.
키입니다. 각 모델에는 하나 이상의 키가 필요합니다. 모델 유형에 따라 SequenceKey 또는 TimeKey 와 같은 추가 특수 키에 대한 옵션도 있을 수 있습니다.
사용하지 마세요. 구조체에 있는 경우에도 모델에서 데이터를 사용하면 안 됨을 나타냅니다.
찾아보기 (...) 단추를 클릭하여 열 모델 플래그 설정 대화 상자를 엽니다.
각 데이터 열의 사용이 모델에 적합한지 확인하는 데 1분 정도 걸릴 수 있습니다. 이 단계는 모델을 처리하려고 할 때 오류를 방지하기 위한 중요한 단계입니다.
예를 들어 의사 결정 트리 모델에 대해 만들어진 구조를 다시 사용하고 Naïve Bayes 알고리즘을 적용하는 경우 데이터 형식과 콘텐츠 형식
NumericContinuous이 있는 열을 비닝하거나 불연속 변수로 변경해야 합니다.구조체의 열이 새 알고리즘에 적용되지 않는 경우 사용 안 함(Do not use)을 선택하여 해당 열을 무시할 수 있습니다.
열 모델 플래그 설정 대화 상자에서 모델링 플래그(있는 경우)를 검토하거나 설정합니다.
모델링 플래그를 사용하면 무엇보다도 null이 처리되는 방식을 제어할 수 있습니다. 자세한 내용은 모델링 플래그(데이터 마이닝)를 참조하세요.
완료되면 확인을 클릭하여 대화 상자를 닫습니다.
마침 대화 상자에서 새 마이닝 모델의 이름과 설명을 입력합니다.
빌드한 모델 유형에 따라 다음 옵션도 있을 수 있습니다.
빌드된 후 완료된 마이닝 모델을 찾아봅니다.
모델에서 원본 데이터로 드릴스루를 사용합니다.
자세한 내용은 마이닝 모델에 대한 드릴스루를 참조하세요.
마침을 클릭하여 변경 내용을 저장합니다. 이렇게 하면 새 모델이 서버에 배포되고 처리됩니다.
관련 옵션
| 옵션 | 코멘트 |
|---|---|
| 구조 또는 모델 선택 대화 상자 | 새 모델을 빌드하기 위한 기준으로 사용할 기존 마이닝 구조를 선택합니다. 선택한 구조체는 현재 연결에 있어야 합니다. 그렇지 않은 경우 원본 데이터에 연결(Excel용 데이터 마이닝 클라이언트) 도구를 사용하여 연결을 변경합니다. |
| 마이닝 알고리즘 선택 대화 상자 | 데이터 마이닝 알고리즘 목록은 연결된 서버에 따라 달라집니다. Analysis Services는 Standard 및 Enterprise 버전에서 다양한 알고리즘을 제공합니다. 관리자가 사용자 지정 알고리즘을 추가했을 수도 있습니다. 알고리즘을 볼 수 없는 경우 Analysis Services 인스턴스에 연결되어 있는지 확인합니다. |
| 알고리즘 매개 변수 대화 상자 | 이러한 설정에서는 분석 방법과 관련된 매개 변수를 사용하여 각 알고리즘을 사용자 지정할 수 있습니다. 시드를 설정하여 여러 학습 패스에서 모델의 결과를 재현할 수 있도록 할 수도 있습니다. 자세한 내용은 알고리즘 매개 변수(SQL Server 데이터 마이닝 추가 기능)를 참조하세요. |
| 열 모델 플래그 설정 대화 상자 | 모델링 플래그는 누락된 데이터를 처리하는 방법을 지정하여 모델을 향상시킬 수 있습니다. 자세한 내용은 모델링 플래그(데이터 마이닝)를 참조하세요. |
열 사용 설정
기존 마이닝 구조에 새 모델을 추가하는 경우 모델이 마이닝 구조의 각 데이터 열을 사용하는 방법을 지정해야 합니다. 이 마법사의 옵션이 마이닝 구조의 옵션보다 훨씬 더 자세한 것을 확인할 수 있습니다. 이유는 무엇입니까?
그 이유는 마법사를 사용하여 모델과 구조를 함께 만들 때 알고리즘에서 데이터를 사용하는 방법을 제어하는 많은 옵션이 자동으로 설정되기 때문입니다. 그러나 기존에 새 모델을 추가하는 경우 이러한 옵션을 수동으로 확인하고 데이터를 분석에 사용할지 여부, 데이터 형식이 올바른지 여부 등을 지정해야 합니다.
기존 데이터에 새 알고리즘을 적용할 때 오류 메시지가 표시될 수 있지만 이러한 메시지는 일반적으로 모델을 처리할 수 있도록 하는 데 필요한 수정 사항에 대한 자세한 정보를 제공합니다. 일반적인 문제는 다음과 같습니다.
모델에는 구조체에 포함된 데이터 형식과 다른 데이터 형식이 필요합니다.
일부 알고리즘은 숫자로만 작동할 수 있습니다. 일부는 텍스트로만 작업할 수 있습니다. 데이터가 새 모델의 잘못된 형식인 경우 모델을 처리할 수 있도록 구조를 수정해야 할 수 있습니다.
마이닝 구조에는 예측 가능한 특성이 없습니다.
클러스터링 모델은 예측 가능한 값 없이 빌드할 수 있지만, 일반적으로 다른 모델에서는 예측을 위해 단일 열을 지정해야 합니다.
데이터 컴퍼지션은 선택한 알고리즘과 호환되지 않습니다.
일부 유형의 분석에는 고유한 규칙에 따라 신중하게 구조화된 데이터가 필요합니다. 예를 들어 예측 모델 및 연결 모델이 있습니다. 사용자 지정을 통해 동일한 형식의 새 모델을 쉽게 추가할 수 있지만 다른 알고리즘에서는 데이터가 작동하지 않을 수 있습니다.
요구 사항
데이터 마이닝 모델을 만들려면 Analysis Services 인스턴스에 연결해야 합니다. 연결을 만들거나 변경하는 방법에 대한 자세한 내용은 원본 데이터에 연결(Excel용 데이터 마이닝 클라이언트)을 참조하세요.
원하는 데이터 마이닝 구조를 볼 수 없는 경우 구조가 다른 인스턴스 또는 다른 Analysis Services 데이터베이스에 저장되었을 수 있습니다. 다른 데이터 마이닝 연결로 변경하는 방법에 대한 자세한 내용은 데이터 마이닝 서버에 연결을 참조하세요.