다음을 통해 공유


처리 요구 사항 및 고려 사항(데이터 마이닝)

이 항목에서는 데이터 마이닝 개체를 처리할 때 유의해야 할 몇 가지 기술적 고려 사항에 대해 설명합니다. 처리란 무엇이며 데이터 마이닝에 적용되는 방법에 대한 일반적인 설명은 데이터 마이닝 개체 처리를 참조하세요.

관계형 저장소에 대한 쿼리

마이닝 구조 처리

마이닝 모델 처리

처리 중 관계형 저장소에 대한 쿼리

데이터 마이닝의 경우 원본 데이터 쿼리, 원시 통계 결정, 모델 정의 및 알고리즘을 사용하여 마이닝 모델을 학습시키는 세 가지 단계를 처리해야 합니다.

Analysis Services 서버는 원시 데이터를 제공하는 데이터베이스에 대한 쿼리를 실행합니다. 이 데이터베이스는 SQL Server 2014 또는 이전 버전의 SQL Server 데이터베이스 엔진 인스턴스일 수 있습니다. 데이터 마이닝 구조를 처리할 때 원본의 데이터는 마이닝 구조로 전송되고 압축된 새로운 형식으로 디스크에 유지됩니다. 데이터 원본의 모든 열이 처리되는 것은 아닙니다. 바인딩에 정의된 대로 마이닝 구조에 포함된 열만 처리됩니다.

Analysis Services는 이 데이터를 사용하여 모든 데이터 및 불연속 열의 인덱스를 작성하고 연속 열에 대해 별도의 인덱스를 만듭니다. 인덱스 만들기 위해 각 중첩 테이블에 대해 하나의 쿼리가 실행되고 중첩 테이블당 추가 쿼리가 생성되어 중첩 테이블과 사례 테이블의 각 쌍 간의 관계를 처리합니다. 여러 쿼리를 만드는 이유는 특수한 내부 다차원 데이터 저장소를 처리하기 위해서입니다. 서버 속성을 DatabaseConnectionPoolMax설정하여 Analysis Services에서 관계형 저장소로 보내는 쿼리 수를 제한할 수 있습니다. 자세한 내용은 OLAP 속성을 참조하세요.

모델을 처리할 때 모델은 데이터 원본에서 데이터를 다시 읽지 않고 마이닝 구조에서 데이터의 요약을 가져옵니다. 서버는 캐시된 인덱스 및 사례 데이터가 캐시된 큐브와 함께 생성된 큐브를 사용하여 모델을 학습시키기 위해 독립적인 스레드를 만듭니다.

병렬 모델 처리를 지원하는 SQL Server 버전에 대한 자세한 내용은 SQL Server 2012 버전에서 지원하는 기능 (https://go.microsoft.com/fwlink/?linkid=232473)을 참조하세요.

마이닝 구조 처리

마이닝 구조는 모든 종속 모델과 함께 처리하거나 별도로 처리할 수 있습니다. 일부 모델을 처리하는 데 시간이 오래 걸리고 해당 작업을 연기하려는 경우 모델과 별도로 마이닝 구조를 처리하는 것이 유용할 수 있습니다.

자세한 내용은 마이닝 구조 처리를 참조하세요.

하드 디스크 공간을 절약하는 데 관심이 있는 경우 Analysis Services는 마이닝 구조 캐시를 로컬로 유지합니다. 즉, 모든 학습 데이터를 로컬 하드 디스크에 씁니다. 데이터를 캐시하지 않으려면 마이닝 구조의 ClearAfterProcessing 속성을 MiningStructureCacheMode로 설정하여 기본값을 변경할 수 있습니다. 그러면 모델이 처리된 후 캐시가 삭제됩니다. 그러나 마이닝 구조에서 드릴스루를 사용하지 않도록 설정합니다. 자세한 내용은 드릴스루 쿼리(데이터 마이닝)를 참조하세요.

또한 캐시를 지우면 홀드아웃 테스트 집합을 사용할 수 없으며, 이를 정의한 경우 테스트 집합 파티션의 정의가 손실됩니다. 홀드아웃 테스트 집합에 대한 자세한 내용은 학습 및 테스트 데이터 집합을 참조하세요.

마이닝 모델 처리

마이닝 모델을 연결된 마이닝 구조와 별도로 처리하거나 구조를 기반으로 하는 모든 모델을 구조와 함께 처리할 수 있습니다.

자세한 내용은 마이닝 모델 처리를 참조하세요.

그러나 SSDT(SQL Server Data Tools) 및 SQL Server Management Studio에서는 마이닝 모델을 다중 선택하여 구조로 처리할 수 없습니다. 처리되는 모델을 제어해야 하는 경우 개별적으로 선택하거나 XMLA 또는 DMX를 사용하여 모델을 직렬로 처리해야 합니다.

재처리가 필요한 경우

사용자가 정의한 Analysis Services 모델을 처리해야 작업을 시작할 수 있습니다. 또한 마이닝 모델 구조를 변경하거나, 학습 데이터를 업데이트하거나, 기존 마이닝 모델을 변경하거나, 구조에 새 마이닝 모델을 추가할 때마다 마이닝 모델을 다시 처리해야 합니다.

마이닝 모델은 다음 시나리오에서도 처리됩니다.

프로젝트 배포: 프로젝트 설정 및 프로젝트의 현재 상태에 따라 프로젝트의 마이닝 모델은 일반적으로 프로젝트가 배포될 때 완전히 처리됩니다.

배포를 시작하면 Analysis Services 서버에 이전에 처리된 버전이 있고 구조적 변경 내용이 없는 한 처리가 자동으로 시작됩니다. 드롭다운 목록에서 솔루션 배포 를 선택하거나 F5 키를 눌러 프로젝트를 배포할 수 있습니다. 다음을 수행할 수 있습니다

마이닝 모델을 배포하는 방법을 제어하는 Analysis Services 배포 속성을 설정하는 방법에 대한 자세한 내용은 데이터 마이닝 솔루션 배포를 참조하세요.

마이닝 모델 이동: EXPORT 명령을 사용하여 마이닝 모델을 이동하는 경우 모델에 데이터를 제공할 것으로 예상되는 마이닝 구조의 이름을 포함하여 모델의 정의만 내보냅니다.

EXPORT 및 IMPORT 명령을 사용하여 다음 시나리오에 대한 요구 사항을 다시 처리합니다.

  • 마이닝 구조가 대상 인스턴스에 있고 마이닝 구조가 처리되지 않은 상태입니다.

    구조체와 모델 모두 다시 처리해야 합니다.

  • 마이닝 구조가 대상 인스턴스에 있고 마이닝 구조가 처리되었습니다. 마이닝 모델만 내보냅니다.

    모델을 처리하지 않고 사용할 수 있습니다.

  • 또한 WITH DEENDENCIES 키워드를 사용하여 마이닝 구조 정의를 내보냅니다.

    구조체와 모델 모두 다시 처리해야 합니다.

자세한 내용은 데이터 마이닝 개체 내보내기 및 가져오기를 참조하세요.

또한 참조하십시오

마이닝 구조체(Analysis Services - 데이터 마이닝)
마이닝 구조(분석 서비스 - 데이터 마이닝)
다차원 모델 개체 처리