처리 요구 사항 및 고려 사항(데이터 마이닝)

이 항목에서는 데이터 마이닝 개체를 처리할 때 유의해야 할 몇 가지 기술적 고려 사항에 대해 설명합니다. 처리란 무엇이며 데이터 마이닝에 적용되는 방법에 대한 일반적인 설명은 데이터 마이닝 개체 처리를 참조하세요.

처리 중 관계형 저장소에 대한 쿼리

데이터 마이닝의 경우 원본 데이터 쿼리, 원시 통계 결정, 모델 정의 및 알고리즘을 사용하여 마이닝 모델을 학습시키는 세 가지 단계를 처리해야 합니다.

Analysis Services 서버는 원시 데이터를 제공하는 데이터베이스에 대한 쿼리를 실행합니다. 이 데이터베이스는 SQL Server 2014 또는 이전 버전의 SQL Server 데이터베이스 엔진 인스턴스일 수 있습니다. 데이터 마이닝 구조를 처리할 때 원본의 데이터는 마이닝 구조로 전송되고 압축된 새로운 형식으로 디스크에 유지됩니다. 데이터 원본의 모든 열이 처리되는 것은 아닙니다. 바인딩에 정의된 대로 마이닝 구조에 포함된 열만 처리됩니다.

Analysis Services는 이 데이터를 사용하여 모든 데이터 및 불연속 열의 인덱스를 작성하고 연속 열에 대해 별도의 인덱스를 만듭니다. 인덱스 만들기 위해 각 중첩 테이블에 대해 하나의 쿼리가 실행되고 중첩 테이블당 추가 쿼리가 생성되어 중첩 테이블과 사례 테이블의 각 쌍 간의 관계를 처리합니다. 여러 쿼리를 만드는 이유는 특수한 내부 다차원 데이터 저장소를 처리하기 위해서입니다. 서버 속성을 DatabaseConnectionPoolMax설정하여 Analysis Services에서 관계형 저장소로 보내는 쿼리 수를 제한할 수 있습니다. 자세한 내용은 OLAP 속성을 참조하세요.

모델을 처리할 때 모델은 데이터 원본에서 데이터를 다시 읽지 않고 마이닝 구조에서 데이터의 요약을 가져옵니다. 서버는 캐시된 인덱스 및 사례 데이터가 캐시된 큐브와 함께 생성된 큐브를 사용하여 모델을 학습시키기 위해 독립적인 스레드를 만듭니다.

병렬 모델 처리를 지원하는 SQL Server 버전에 대한 자세한 내용은 SQL Server 2012 버전에서 지원하는 기능 (https://go.microsoft.com/fwlink/?linkid=232473)을 참조하세요.

마이닝 구조 처리

마이닝 구조는 모든 종속 모델과 함께 처리하거나 별도로 처리할 수 있습니다. 일부 모델을 처리하는 데 시간이 오래 걸리고 해당 작업을 연기하려는 경우 모델과 별도로 마이닝 구조를 처리하는 것이 유용할 수 있습니다.

자세한 내용은 마이닝 구조 처리를 참조하세요.

하드 디스크 공간을 절약하는 데 관심이 있는 경우 Analysis Services는 마이닝 구조 캐시를 로컬로 유지합니다. 즉, 모든 학습 데이터를 로컬 하드 디스크에 씁니다. 데이터를 캐시하지 않으려면 마이닝 구조의 ClearAfterProcessing 속성을 MiningStructureCacheMode로 설정하여 기본값을 변경할 수 있습니다. 그러면 모델이 처리된 후 캐시가 삭제됩니다. 그러나 마이닝 구조에서 드릴스루를 사용하지 않도록 설정합니다. 자세한 내용은 드릴스루 쿼리(데이터 마이닝)를 참조하세요.

또한 캐시를 지우면 홀드아웃 테스트 집합을 사용할 수 없으며, 이를 정의한 경우 테스트 집합 파티션의 정의가 손실됩니다. 홀드아웃 테스트 집합에 대한 자세한 내용은 학습 및 테스트 데이터 집합을 참조하세요.

마이닝 모델 처리

마이닝 모델을 연결된 마이닝 구조와 별도로 처리하거나 구조를 기반으로 하는 모든 모델을 구조와 함께 처리할 수 있습니다.

자세한 내용은 마이닝 모델 처리를 참조하세요.

그러나 SSDT(SQL Server Data Tools) 및 SQL Server Management Studio에서는 마이닝 모델을 다중 선택하여 구조로 처리할 수 없습니다. 처리되는 모델을 제어해야 하는 경우 개별적으로 선택하거나 XMLA 또는 DMX를 사용하여 모델을 직렬로 처리해야 합니다.

재처리가 필요한 경우

사용자가 정의한 Analysis Services 모델을 처리해야 작업을 시작할 수 있습니다. 또한 마이닝 모델 구조를 변경하거나, 학습 데이터를 업데이트하거나, 기존 마이닝 모델을 변경하거나, 구조에 새 마이닝 모델을 추가할 때마다 마이닝 모델을 다시 처리해야 합니다.

마이닝 모델은 다음 시나리오에서도 처리됩니다.

프로젝트 배포: 프로젝트 설정 및 프로젝트의 현재 상태에 따라 프로젝트의 마이닝 모델은 일반적으로 프로젝트가 배포될 때 완전히 처리됩니다.

배포를 시작하면 Analysis Services 서버에 이전에 처리된 버전이 있고 구조적 변경 내용이 없는 한 처리가 자동으로 시작됩니다. 드롭다운 목록에서 솔루션 배포 를 선택하거나 F5 키를 눌러 프로젝트를 배포할 수 있습니다. 다음을 수행할 수 있습니다

마이닝 모델을 배포하는 방법을 제어하는 Analysis Services 배포 속성을 설정하는 방법에 대한 자세한 내용은 데이터 마이닝 솔루션 배포를 참조하세요.

마이닝 모델 이동: EXPORT 명령을 사용하여 마이닝 모델을 이동하는 경우 모델에 데이터를 제공할 것으로 예상되는 마이닝 구조의 이름을 포함하여 모델의 정의만 내보냅니다.

EXPORT 및 IMPORT 명령을 사용하여 다음 시나리오에 대한 요구 사항을 다시 처리합니다.

마이닝 구조가 대상 인스턴스에 있고 마이닝 구조가 처리되지 않은 상태입니다.

구조체와 모델 모두 다시 처리해야 합니다.
마이닝 구조가 대상 인스턴스에 있고 마이닝 구조가 처리되었습니다. 마이닝 모델만 내보냅니다.

모델을 처리하지 않고 사용할 수 있습니다.
또한 WITH DEENDENCIES 키워드를 사용하여 마이닝 구조 정의를 내보냅니다.

구조체와 모델 모두 다시 처리해야 합니다.

자세한 내용은 데이터 마이닝 개체 내보내기 및 가져오기를 참조하세요.

또한 참조하십시오

마이닝 구조체(Analysis Services - 데이터 마이닝)
마이닝 구조(분석 서비스 - 데이터 마이닝)
다차원 모델 개체 처리

Last updated on 2017-06-13