다음을 통해 공유


신경망 모델 검색

찾아보기를 사용하여 신경망 또는 로지스틱 회귀 모델을 열면 모델이 Analysis Services의 신경망 모델 뷰어와 유사한 대화형 뷰어에 표시됩니다. 뷰어는 상관 관계를 탐색하고 모델의 패턴 및 기본 데이터에 대한 정보를 가져오는 데 도움이 됩니다.

모델 탐색

Microsoft 신경망 또는 로지스틱 회귀 알고리즘을 기반으로 하는 모델은 알려진 입력 및 출력 간의 연결 집합으로 데이터를 분석한다는 측면에서 비슷합니다. 찾아보기 뷰어를 사용하면 다음 컨트롤을 사용하여 이러한 연결을 탐색할 수 있습니다.

이 뷰어를 실험하려는 경우 분류 마법사(Excel용 데이터 마이닝 추가 기능) 마법사를 사용하여 모델을 만들고 고급 옵션을 사용하여 알고리즘 매개 변수 대화 상자에서 알고리즘을 Microsoft 로지스틱 회귀로 변경할 수 있습니다.

변수

변수 창에는 입력 변수 목록이 모델에 미치는 영향 순서대로 표시됩니다. 입력출력 컨트롤을 사용하여 모델을 필터링하여 표시되는 변수와 순서에 영향을 줍니다.

이 뷰어를 사용하면 고객이 자전거 구매자 범주에 속할 가능성이 더 높거나 비구매자 범주에 속할지를 결정하는 데 가장 중요한 요소를 살펴볼 수 있습니다.

선택한 특성의 결과에 대한 테스트 효과

변수 탐색
  1. 처음에는 현재 필터가 지정된 경우 변수 창이 가장 중요한 특성 순서로 정렬됩니다. 막대의 길이는 요소의 강도를 나타냅니다.

    이 예제에서는 소득이 가장 영향력 있는 요인이며 그 다음에 지역이 뒤따르는 것을 볼 수 있습니다. 다른 한편으로는, 많은 자동차와 많은 아이들이있는 고객은 자전거를 구입할 가능성이 매우 낮습니다.

  2. 변수 창에서 특성의 열 머리글을 클릭합니다.

    특성을 정렬하면 각 입력 열에 대해 만들어진 bin을 볼 수 있습니다. 직업과 같은 불연속 값이 있는 열은 리터럴 값으로 범주화 됩니다.

  3. 연령 및 소득에 대해 발견된 값의 범위를 확인합니다.

    입력 열이 숫자(즉, 데이터의 전체 열이 연속 숫자 데이터 형식)인 경우 숫자는 개별 범위로 버킷 또는 범주화됩니다.

    Income의 경우 열은 78.4-154.06(최상위 소득 범위의 경우)과 같은 그룹으로 세분화되었습니다.

    변수가 범주화된 방법을 보려면 정렬하십시오.

    다른 그룹화하려는 경우 모델을 빌드하기 전에 레이블 다시 지정(SQL Server 데이터 마이닝 추가 기능) 도구 또는 Excel 함수를 사용하여 새 소득 범주를 만들어야 합니다.

  4. [예]를 클릭하여 그래프를 기본 보기로 복원합니다.

    기본적으로 뷰는 첫 번째 결과 값에 대한 Favors 값으로 정렬됩니다. 출력에서 값 1 및 값2에 대한 새 값을 선택하여 첫 번째 및 두 번째 열에 할당되는 결과를 변경할 수 있습니다.

  5. 차트에서 가장 위쪽에 색이 지정된 막대 위로 마우스를 일시 중지합니다.

    중요도 점수, 한 쌍의 확률 점수 및 리프트 값 쌍을 포함하는 툴팁이 나타납니다.

    • 중요도 는 전체 데이터 세트에서 계산되며, 모든 입력이 대상 결과와 가장 상관 관계가 있는 특성을 식별합니다. 뷰어는 중요도 점수를 기준으로 차트의 값을 정렬합니다.

    • 확률 은 전체 데이터 집합에서 대상 결과에 대한 특성-값 쌍의 각 집합에 대해 계산됩니다.

    • 리프트 는 이 특정 특성-값 쌍이 한 결과 또는 다른 결과를 승격하는 데 얼마나 유용한지 알려줍니다.

    참고: 도구 설명에는 마우스를 한 열 위에 놓든 다른 열 위에 놓든 관계없이 동일한 정보가 포함됩니다.

맨 위로 돌아가기

입력

입력 창을 사용하면 입력 집합을 선택하고 이를 모델에 필터로 적용할 수 있습니다. 이를 통해 학습 데이터에 따라 결과에 대한 선택 항목의 영향을 볼 수 있습니다.

입력 탐색
  1. 특정 그룹을 대상으로 지정하고 해당 그룹의 구매에 가장 큰 영향을 주는 요인을 확인하려는 경우를 가정해 보겠습니다.

    입력 창에서 특성 아래의 <모든> 셀을 클릭하고 나이를 선택합니다.

    의 경우 가장 어린 연령 범주를 선택합니다.

  2. 특정 연령대를 필터링해도 태평양 지역은 목록 맨 위에 오게 됩니다. 이는 태평양 지역의 고객이 다른 지역의 고객보다 자전거를 구입할 가능성이 훨씬 높기 때문입니다.

    지역은 영향을 줄 수 있는 것이 아니므로 이 변수를 고려에서 제거하고 다른 요소를 보려면 입력을 다시 변경할 수 있습니다.

    입력 창에서 Age 아래의 빈 셀을 클릭하고 지역을 선택합니다.

    의 경우 유럽을 선택합니다.

  3. 입력 필터를 계속 추가하여 특정 관심 그룹에 집중합니다.

    예를 들어 입력 특성의 경우 Gender를 추가하고 여성을 값으로 선택합니다.

    선택한 특성의 결과에 대한 테스트 효과

    변수 목록이 어떻게 변경되는지 확인합니다. 이제 Income 은 대상 결과를 예측하는 데 가장 중요한 변수입니다.

    입력 필터를 적용하는 순서는 결과에 영향을 주지 않습니다.

맨 위로 돌아가기

출력물

출력 창에서 관심 있는 결과를 선택할 수 있습니다. 신경망을 사용하면 원하는 만큼 결과 열을 지정할 수 있지만, 더 많은 출력을 추가하면 모델의 복잡성이 늘어나고 처리 시간이 훨씬 더 길어질 수 있습니다.

두 출력을 비교하려면 예측 또는 예측 전용 열로 지정되어야 합니다.

출력 탐색
  1. 출력 특성 목록을 사용하여 특성을 선택합니다.

  2. 값 1 및 값 2 목록에서 두 가지 결과를 선택합니다. 출력 특성의 이러한 두 상태는 변수 창에서 비교됩니다.

맨 위로 돌아가기

신경망 모델에 대한 자세한 정보

뷰어의 정보는 이 모델 유형인 System.Microsoft.AnalysisServices.System.DataMining.NeuralNet.GetAttributeScores와 관련된 저장 프로시저를 사용하여 서버에서 검색됩니다.

추가 기능을 사용하여 여러 예측 가능한 특성이 있는 모델을 만들려면 고급 모델링 옵션을 사용합니다.

자세한 내용은 마이닝 구조 만들기(SQL Server 데이터 마이닝 추가 기능)구조에 모델 추가(Excel용 데이터 마이닝 추가 기능)를 참조하세요.

또한 참조하십시오

Excel에서 모델 찾아보기(SQL Server 데이터 마이닝 추가 기능)