마이닝 모델은 데이터에 알고리즘을 적용하여 만들지만 알고리즘 또는 메타데이터 컨테이너 이상입니다. 예측을 생성하고 관계에 대해 유추하기 위해 새 데이터에 적용할 수 있는 데이터, 통계 및 패턴 집합입니다.
이 섹션에서는 데이터 마이닝 모델의 정의와 사용할 수 있는 용도에 대해 설명합니다. 모델 및 구조의 기본 아키텍처, 마이닝 모델의 속성 및 마이닝 모델을 만들고 사용하는 방법.
마이닝 모델 아키텍처
데이터 마이닝 모델은 마이닝 구조에서 데이터를 가져오고 데이터 마이닝 알고리즘을 사용하여 해당 데이터를 분석합니다. 마이닝 구조와 마이닝 모델은 별도의 개체입니다. 마이닝 구조는 데이터 원본을 정의하는 정보를 저장합니다. 마이닝 모델은 분석 결과로 발견된 패턴과 같이 데이터의 통계 처리에서 파생된 정보를 저장합니다.
마이닝 구조에서 제공하는 데이터가 처리 및 분석될 때까지 마이닝 모델은 비어 있습니다. 마이닝 모델이 처리되면 마이닝 구조에 대한 메타데이터, 결과 및 바인딩이 포함됩니다.
메타데이터는 모델 및 저장된 서버의 이름뿐만 아니라 모델 작성에 사용된 마이닝 구조의 열, 모델을 처리할 때 적용된 필터의 정의 및 데이터를 분석하는 데 사용된 알고리즘을 포함하여 모델의 정의를 지정합니다. 이러한 모든 선택 항목- 데이터 열 및 해당 데이터 형식, 필터 및 알고리즘은 분석 결과에 강력한 영향을 줍니다.
예를 들어 클러스터링 알고리즘, 의사 결정 트리 알고리즘 및 Naïve Bayes 알고리즘을 사용하여 동일한 데이터를 사용하여 여러 모델을 만들 수 있습니다. 각 모델 형식은 예측을 만드는 데 사용할 수 있는 다양한 패턴, 항목 집합, 규칙 또는 수식 집합을 만듭니다. 일반적으로 각 알고리즘은 다른 방식으로 데이터를 분석하므로 결과 모델의 내용 도 다른 구조로 구성됩니다. 한 가지 유형의 모델에서 데이터 및 패턴은 클러스터에서 그룹화될 수 있습니다. 다른 유형의 모델에서 데이터는 트리, 분기 및 데이터를 나누고 정의하는 규칙으로 구성될 수 있습니다.
또한 모델은 학습하는 데이터의 영향을 받습니다. 데이터를 다르게 필터링하거나 분석 중에 다른 시드를 사용하는 경우 동일한 마이닝 구조에서 학습된 모델도 다른 결과를 얻을 수 있습니다. 그러나 실제 데이터는 모델에 저장되지 않고 요약 통계만 저장되며, 실제 데이터는 마이닝 구조에 있습니다. 모델을 학습할 때 데이터에 대한 필터를 만든 경우 필터 정의도 모델 개체와 함께 저장됩니다.
모델에는 마이닝 구조에 캐시된 데이터를 가리키는 바인딩 집합이 포함되어 있습니다. 데이터가 구조에 캐시되고 처리 후 지워지지 않은 경우 이러한 바인딩을 사용하면 결과에서 결과를 지원하는 사례로 드릴스루할 수 있습니다. 그러나 실제 데이터는 모델이 아닌 구조 캐시에 저장됩니다.
데이터 마이닝 모델 정의
다음 일반 단계에 따라 데이터 마이닝 모델을 만듭니다.
기본 마이닝 구조를 만들고 필요할 수 있는 데이터 열을 포함합니다.
분석 작업에 가장 적합한 알고리즘을 선택합니다.
모델에서 사용할 구조의 열을 선택하고, 각 열을 어떻게 사용할 것인지 명시하십시오. 예를 들어, 어떤 열이 예측하려는 결과를 포함하는지, 어떤 열이 입력 전용인지 등을 지정합니다.
필요에 따라 매개 변수를 설정하여 알고리즘으로 처리를 미세 조정합니다.
구조 및 모델을 처리 하여 모델을 데이터로 채웁다.
Analysis Services는 마이닝 모델을 관리하는 데 도움이 되는 다음 도구를 제공합니다.
데이터 마이닝 마법사를 사용하면 구조 및 관련 마이닝 모델을 만들 수 있습니다. 가장 쉽게 사용할 수 있는 방법입니다. 마법사는 필요한 마이닝 구조를 자동으로 만들고 중요한 설정의 구성에 도움이 됩니다.
DMX CREATE MODEL 문을 사용하여 모델을 정의할 수 있습니다. 필요한 구조는 프로세스의 일부로 자동으로 만들어집니다. 따라서 이 메서드를 사용하여 기존 구조를 다시 사용할 수 없습니다. 만들려는 모델을 정확히 알고 있거나 모델을 스크립치하려는 경우 이 메서드를 사용합니다.
DMX ALTER STRUCTURE ADD MODEL 문을 사용하여 기존 구조에 새 마이닝 모델을 추가할 수 있습니다. 동일한 데이터 집합을 기반으로 하는 다양한 모델을 실험하려는 경우 이 메서드를 사용합니다.
AMO 또는 XML/A를 사용하거나 Excel용 데이터 마이닝 클라이언트와 같은 다른 클라이언트를 사용하여 프로그래밍 방식으로 마이닝 모델을 만들 수도 있습니다. 자세한 내용은 다음 항목을 참조하세요.
마이닝 모델 속성
각 마이닝 모델에는 모델 및 해당 메타데이터를 정의하는 속성이 있습니다. 여기에는 이름, 설명, 모델이 마지막으로 처리된 날짜, 모델에 대한 사용 권한 및 학습에 사용되는 데이터에 대한 필터가 포함됩니다.
각 마이닝 모델에는 마이닝 구조에서 파생된 속성과 모델에서 사용하는 데이터 열을 설명하는 속성도 있습니다. 모델에서 사용하는 열이 중첩 테이블인 경우 열에 별도의 필터가 적용될 수도 있습니다.
또한 각 마이닝 모델에는 두 가지 특수 속성 Algorithm 과 .Usage
Algorithm 속성 모델을 만드는 데 사용되는 알고리즘을 지정합니다. 사용 가능한 알고리즘은 사용 중인 공급자에 따라 달라집니다. SQL Server Analysis Services에 포함된 알고리즘 목록은 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝)을 참조하세요. 이 속성은
Algorithm마이닝 모델에 적용되며 각 모델에 대해 한 번만 설정할 수 있습니다. 나중에 알고리즘을 변경할 수 있지만 선택한 알고리즘에서 지원하지 않는 경우 마이닝 모델의 일부 열이 유효하지 않을 수 있습니다. 이 속성을 변경한 후 항상 모델을 다시 처리해야 합니다.Usage 속성 모델에서 각 열을 사용하는 방법을 정의합니다. 열 사용량을 , 또는
PredictPredict OnlyKey.로Input정의할 수 있습니다. 이 속성은Usage개별 마이닝 모델 열에 적용되며 모델에 포함된 모든 열에 대해 개별적으로 설정해야 합니다. 구조체에 모델에서 사용하지 않는 열이 포함된 경우 사용법은 .로Ignore설정됩니다. 마이닝 구조에 포함할 수 있지만 분석에 사용하지 않는 데이터의 예는 고객 이름 또는 전자 메일 주소일 수 있습니다. 이렇게 하면 분석 단계에서 포함하지 않고도 나중에 쿼리할 수 있습니다.
마이닝 모델을 만든 후 마이닝 모델 속성의 값을 변경할 수 있습니다. 그러나 마이닝 모델의 이름을 변경하더라도 모델을 다시 처리해야 합니다. 모델을 다시 처리한 후 다른 결과가 표시될 수 있습니다.
마이닝 모델 열
마이닝 모델에는 마이닝 구조에 정의된 열에서 가져온 데이터 열이 포함됩니다. 모델에서 사용할 마이닝 구조의 열을 선택할 수 있으며 마이닝 구조 열의 복사본을 만든 다음 이름을 바꾸거나 사용량을 변경할 수 있습니다. 모델 빌드 프로세스의 일부로 모델별 열 사용도 정의해야 합니다. 여기에는 열이 키인지 여부, 예측에 사용되는지 여부 또는 알고리즘에서 무시할 수 있는지 여부와 같은 정보가 포함됩니다.
사용 가능한 모든 데이터 열을 자동으로 추가하는 대신 모델을 빌드하는 동안 구조의 데이터를 신중하게 검토하고 분석에 적합한 열만 모델에 포함하는 것이 좋습니다. 예를 들어 동일한 데이터를 반복하는 여러 열을 포함하지 않아야 하며, 대부분 고유한 값이 있는 열은 사용하지 않아야 합니다. 열을 사용해서는 안 된다고 생각되는 경우 마이닝 구조 또는 마이닝 모델에서 열을 삭제할 필요가 없습니다. 대신 모델을 빌드할 때 무시하도록 지정하는 열에 플래그를 설정할 수 있습니다. 즉, 열은 마이닝 구조에 남아 있지만 마이닝 모델에는 사용되지 않습니다. 모델에서 마이닝 구조로 드릴스루를 사용하도록 설정한 경우 나중에 열에서 정보를 검색할 수 있습니다.
선택한 알고리즘에 따라 마이닝 구조의 일부 열이 특정 모델 형식과 호환되지 않거나 결과가 좋지 않을 수 있습니다. 예를 들어 데이터에 Income 열과 같은 연속 숫자 데이터가 포함되어 있고 모델에 불연속 값이 필요한 경우 데이터를 불연속 범위로 변환하거나 모델에서 제거해야 할 수 있습니다. 경우에 따라 알고리즘은 자동으로 데이터를 변환하거나 범주화하지만 결과가 항상 원하는 것이 아닐 수도 있습니다. 열의 추가 복사본을 만들고 다른 모델을 사용해 보세요. 개별 열에 플래그를 설정하여 특수 처리가 필요한 위치를 나타낼 수도 있습니다. 예를 들어 데이터에 null이 포함된 경우 모델링 플래그를 사용하여 처리를 제어할 수 있습니다. 특정 열을 모델에서 회귀자로 간주하려는 경우 모델링 플래그를 사용하여 이 작업을 수행할 수 있습니다.
모델을 만든 후에는 열 추가 또는 제거 또는 모델 이름 변경과 같은 변경을 수행할 수 있습니다. 그러나 모델 메타데이터만 변경하려면 모델을 다시 처리해야 합니다.
마이닝 모델 처리
데이터 마이닝 모델은 처리될 때까지 빈 개체입니다. 모델을 처리할 때 구조에 의해 캐시된 데이터는 모델에 정의되어 있고 알고리즘에 의해 분석되는 경우 필터를 통해 전달됩니다. 알고리즘은 데이터를 설명하는 요약 통계 집합을 계산하고, 데이터 내의 규칙과 패턴을 식별한 다음, 이러한 규칙과 패턴을 사용하여 모델을 채웁니다.
마이닝 모델은 처리된 후 통계, 규칙 및 회귀 수식을 포함하여 분석을 통해 찾은 데이터 및 패턴에 대한 풍부한 정보를 포함합니다. 사용자 지정 뷰어를 사용하여 이 정보를 찾아보거나 데이터 마이닝 쿼리를 만들어 이 정보를 검색하고 분석 및 프레젠테이션에 사용할 수 있습니다.
마이닝 모델 보기 및 쿼리
모델을 처리한 후에는 SSDT(SQL Server Data Tools) 및 SQL Server Management Studio에서 제공되는 사용자 지정 뷰어를 사용하여 모델을 탐색할 수 있습니다. 때문에
마이닝 모델에 대한 쿼리를 만들어 예측을 만들거나 모델 메타데이터 또는 모델에서 만든 패턴을 검색할 수도 있습니다. DMX(데이터 마이닝 확장)를 사용하여 쿼리를 만듭니다.
관련 내용
| 토픽 | 링크 |
|---|---|
| 여러 마이닝 모델을 지원할 수 있는 마이닝 구조를 빌드하는 방법을 알아봅니다. 모델에서 열의 사용에 대해 알아봅니다. |
마이닝 데이터 구조 열 마이닝 모델 열 콘텐츠 형식(데이터 마이닝) |
| 다양한 알고리즘에 대해 알아보고 알고리즘 선택이 모델 콘텐츠에 미치는 영향을 알아봅니다. |
마이닝 모델 콘텐츠(분석 서비스 - 데이터 마이닝) 데이터 마이닝 알고리즘(Analysis Services - 데이터 마이닝) |
| 이제 모델의 컴퍼지션 및 동작에 영향을 주는 속성을 설정할 수 있습니다. |
마이닝 모델 속성 모델링 플래그(데이터 마이닝) |
| 데이터 마이닝에 대한 프로그래밍 가능한 인터페이스에 대해 알아봅니다. |
AMO(Analysis Management Objects)를 사용하여 개발 DMX(데이터 마이닝 확장) 참조 |
| Analysis Services에서 사용자 지정 데이터 마이닝 뷰어를 사용하는 방법을 알아봅니다. | 데이터 마이닝 모델 뷰어 |
| 데이터 마이닝 모델에 대해 사용할 수 있는 다양한 유형의 쿼리 예제를 봅니다. | 데이터 마이닝 쿼리 |
관련 작업
다음 링크를 사용하여 데이터 마이닝 모델 작업에 대한 자세한 정보를 가져옵니다.
| 과업 | 링크 |
|---|---|
| 마이닝 모델 추가 및 삭제 |
기존 마이닝 구조에 마이닝 모델 추가 마이닝 구조에서 마이닝 모델 삭제 |
| 마이닝 모델의 열을 다루기 |
마이닝 모델에서 열 제외 모델 열에 대한 별칭 만들기 마이닝 모델에서 열의 구간화 변경 모델에서 회귀로 사용할 열 지정 |
| 모델 속성 변경 |
마이닝 모델의 속성 변경 마이닝 모델에 필터 적용 마이닝 모델에서 필터 삭제 마이닝 모델에 드릴스루 기능 활성화 알고리즘 매개 변수 보기 또는 변경 |
| 복사. 모델 이동 또는 관리 |
마이닝 모델의 복사본 만들기 마이닝 모델 보기 복사 EXPORT(DMX) IMPORT(DMX) |
| 데이터로 모델 채우기 또는 모델에서 데이터 업데이트 | 마이닝 모델 처리 |
| OLAP 모델 작업 | 데이터 마이닝 차원 만들기 |