다음을 통해 공유


논리 아키텍처(Analysis Services - 데이터 마이닝)

데이터 마이닝은 여러 구성 요소의 상호 작용을 포함하는 프로세스입니다.

  • 학습, 테스트 또는 예측에 사용할 SQL Server 데이터베이스 또는 기타 데이터 원본의 데이터 원본에 액세스합니다.

  • SSDT(SQL Server Data Tools) 또는 Visual Studio를 사용하여 데이터 마이닝 구조 및 모델을 정의합니다.

  • SQL Server Management Studio를 사용하여 데이터 마이닝 개체를 관리하고 예측 및 쿼리를 만듭니다.

  • 솔루션이 완료되면 Analysis Services 인스턴스에 배포합니다.

이러한 솔루션 개체를 만드는 프로세스는 이미 다른 곳에서 설명되어 있습니다. 자세한 내용은 데이터 마이닝 솔루션을 참조하세요.

데이터 마이닝 원본 데이터

데이터 마이닝에 사용하는 데이터는 데이터 마이닝 솔루션에 저장되지 않습니다. 바인딩만 저장됩니다. 데이터는 이전 버전의 SQL Server, CRM 시스템 또는 플랫 파일에서 만든 데이터베이스에 상주할 수 있습니다. 처리하여 구조 또는 모델을 학습하는 경우 데이터의 통계 요약이 만들어지고 나중에 작업에서 사용할 수 있도록 유지되거나 처리 후 삭제될 수 있는 캐시에 저장됩니다. 자세한 내용은 마이닝 구조(Analysis Services - 데이터 마이닝)를 참조하세요.

데이터 원본 위에 추상화 계층을 제공하는 Analysis Services DSV(데이터 원본 뷰) 개체 내에서 서로 다른 데이터를 결합합니다. 테이블 간 조인을 지정하거나 다대일 관계가 있는 테이블을 추가하여 중첩 테이블 열을 만들 수 있습니다. 이러한 개체의 정의인 데이터 원본 및 데이터 원본 뷰는 파일 이름 확장명 *.ds 및 *.dsv를 사용하여 솔루션 내에 저장됩니다. Analysis Services 데이터 원본 및 데이터 원본 뷰를 만들고 사용하는 방법에 대한 자세한 내용은 지원되는 데이터 원본(SSAS 다차원)을 참조하세요.

AMO 또는 XMLA를 사용하여 데이터 원본 및 데이터 원본 뷰를 정의하고 변경할 수도 있습니다. 이러한 개체를 프로그래밍 방식으로 사용하는 방법에 대한 자세한 내용은 논리 아키텍처 개요(Analysis Services - 다차원 데이터)를 참조하세요.

마이닝 구조

데이터 마이닝 구조는 마이닝 모델이 빌드되는 데이터 도메인을 정의하는 논리 데이터 컨테이너입니다. 단일 마이닝 구조는 여러 마이닝 모델을 지원할 수 있습니다.

데이터 마이닝 솔루션에서 데이터를 사용해야 하는 경우 Analysis Services는 원본에서 데이터를 읽고 집계 및 기타 정보의 캐시를 생성합니다. 기본적으로 이 캐시는 학습 데이터를 다시 사용하여 추가 모델을 지원할 수 있도록 유지됩니다. 캐시를 삭제해야 하는 경우 마이닝 구조 개체의 CacheMode 속성을 값 ClearAfterProcessing으로 변경합니다. 자세한 내용은 AMO 데이터 마이닝 클래스를 참조하세요.

또한 SQL Server 2014 Analysis Services(SSAS)는 데이터를 학습 및 테스트 데이터 집합으로 구분하여 임의로 선택한 대표 데이터 집합에서 마이닝 모델을 테스트할 수 있는 기능을 제공합니다. 데이터는 실제로 별도로 저장되지 않습니다. 오히려 구조 캐시의 사례 데이터는 특정 사례가 학습 또는 테스트에 사용되는지 여부를 나타내는 속성으로 표시됩니다. 캐시가 삭제되면 해당 정보를 검색할 수 없습니다.

자세한 내용은 마이닝 구조(Analysis Services - 데이터 마이닝)를 참조하세요.

데이터 마이닝 구조에는 중첩 테이블이 포함될 수 있습니다. 중첩 테이블은 기본 데이터 테이블에서 모델링되는 사례에 대한 추가 세부 정보를 제공합니다. 자세한 내용은 중첩 테이블(Analysis Services - 데이터 마이닝)을 참조하세요.

마이닝 모델

처리하기 전에 데이터 마이닝 모델은 메타데이터 속성의 조합일 뿐입니다. 이러한 속성은 마이닝 구조를 지정하고, 데이터 마이닝 알고리즘을 지정하며, 데이터 처리 방식에 영향을 주는 매개 변수 및 필터 설정의 컬렉션을 정의합니다. 자세한 내용은 마이닝 모델(Analysis Services - 데이터 마이닝)을 참조하세요.

모델을 처리할 때 마이닝 구조 캐시에 저장된 학습 데이터는 데이터의 통계 속성과 알고리즘 및 해당 매개 변수로 정의된 추론을 기반으로 패턴을 생성하는 데 사용됩니다. 이를 모델 학습 이라고 합니다.

학습 결과는 모델 콘텐츠에 포함된 요약 데이터 집합으로, 발견된 패턴을 설명하고 예측을 생성하는 규칙을 제공합니다. 자세한 내용은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.

제한된 경우 모델의 논리적 구조를 표준 형식인 PMML(예측 모델링 태그 언어)에 따라 모델 수식 및 데이터 바인딩을 나타내는 파일로 내보낼 수도 있습니다. 이 논리 구조를 PMML 및 모델을 활용하는 다른 시스템으로 가져올 수 있으므로 예측에 사용할 수 있습니다. 자세한 내용은 DMX Select 문 이해를 참조하세요.

사용자 지정 데이터 마이닝 개체

정확도 차트 또는 예측 쿼리와 같은 데이터 마이닝 프로젝트의 컨텍스트에서 사용하는 다른 개체는 솔루션 내에서 유지되지 않지만 ASSL을 사용하여 스크립트하거나 AMO를 사용하여 빌드할 수 있습니다.

또한 다음 사용자 지정 개체를 추가하여 Analysis Services 인스턴스에서 사용할 수 있는 서비스 및 기능을 확장할 수 있습니다.

사용자 지정 어셈블리
.NET 어셈블리는 CLR 또는 COM 불만 언어를 사용하여 정의한 다음 SQL Server 인스턴스에 등록할 수 있습니다. 어셈블리 파일은 애플리케이션에서 정의한 위치에서 로드되고 복사본은 데이터와 함께 서버에 저장됩니다. 어셈블리 파일의 복사본은 서비스가 시작될 때마다 어셈블리를 로드하는 데 사용됩니다.

자세한 내용은 다차원 모델 어셈블리 관리를 참조하세요.

사용자 지정 저장 프로시저
Analysis Services 데이터 마이닝은 저장 프로시저를 사용하여 데이터 마이닝 개체를 사용할 수 있도록 지원합니다. 고유한 저장 프로시저를 만들어 기능을 확장하고 예측 쿼리 및 콘텐츠 쿼리에서 반환된 데이터를 보다 쉽게 사용할 수 있습니다.

저장 프로시저 정의

교차 유효성 검사를 수행하는 데 사용할 수 있는 저장 프로시저는 다음과 같습니다.

데이터 마이닝 저장 프로시저(Analysis Services - 데이터 마이닝)

또한 Analysis Services에는 데이터 마이닝에 내부적으로 사용되는 많은 시스템 저장 프로시저가 포함되어 있습니다. 시스템 저장 프로시저는 내부용이지만 유용한 바로 가기를 찾을 수 있습니다. Microsoft는 필요에 따라 이러한 저장 프로시저를 변경할 수 있는 권한을 보유합니다. 따라서 프로덕션 사용을 위해 DMX, AMO 또는 XMLA를 사용하여 쿼리를 만드는 것이 좋습니다.

사용자 지정 플러그 인 알고리즘
Analysis Services는 사용자 고유의 알고리즘을 만든 다음, 알고리즘을 새 데이터 마이닝 서비스로 서버 인스턴스에 추가하는 메커니즘을 제공합니다.

Analysis Services는 COM 인터페이스를 사용하여 플러그 인 알고리즘과 통신합니다. 새 알고리즘을 구현하는 방법에 대한 자세한 내용은 플러그 인 알고리즘을 참조하세요.

새 알고리즘을 사용하려면 먼저 각 새 알고리즘을 등록해야 합니다. 알고리즘을 등록하려면 Analysis Services 인스턴스의 .ini 파일에 알고리즘에 필요한 메타데이터를 추가합니다. 새 알고리즘을 사용하려는 각 인스턴스에 정보를 추가해야 합니다. 알고리즘을 추가한 후 인스턴스를 다시 시작하고 MINING_SERVICES 스키마 행 집합을 사용하여 알고리즘이 지원하는 옵션 및 공급자를 포함하여 새 알고리즘을 볼 수 있습니다.

또한 참조하십시오

다차원 모델 개체 처리
DMX(데이터 마이닝 확장) 참조