다음을 통해 공유


예측 계산기(Excel용 테이블 분석 도구)

예측 계산기 도구

예측 계산기 도구를 사용하면 새 데이터를 분석하고 옵션 또는 위험을 평가하는 데 사용할 수 있는 성과 기록표를 만들 수 있습니다. 예를 들어 고객에 대한 기록 및 인구 통계 데이터가 있는 경우 예측 계산기 도구를 사용하면 다음 두 가지 주요 작업을 수행할 수 있습니다.

  • 인구 통계, 구매 행동 및 기타 다양한 요인에 대한 기본 분석을 생성합니다.

  • 멤버를 평가하고 새 제품 또는 서비스 제품에 대한 권장 사항을 만드는 데 도움이 되는 작업 성과 기록표를 만듭니다.

또한 마법사는 모델과 상호 작용하고 다른 입력 값이 최종 점수에 미치는 영향을 확인할 수 있도록 모든 기본 계산을 저장하는 워크시트를 만듭니다.

선택하는 경우 마법사는 오프라인 채점에 사용할 수 있는 인쇄된 버전의 워크시트를 만들 수도 있습니다. 온라인 Excel 통합 문서와 마찬가지로 모델과 상호 작용할 수는 없지만 인쇄된 버전은 값을 입력하고 최종 점수를 계산하는 데 필요한 모든 계산을 제공합니다.

예측 계산기 도구 사용

  1. 분석하려는 데이터가 포함된 Excel 테이블을 엽니다.

  2. 분석 탭에서 예측 계산기를 클릭합니다.

  3. 예측 계산기 대화 상자에서 대상에 대해 구매 동작과 같이 예측하려는 열을 선택합니다.

  4. 대상 값을 지정합니다. 값이 숫자인 경우 In 범위 옵션을 사용한 다음 원하는 범위의 최소값과 최대값을 입력합니다. 값이 불연속인 경우 정확히 옵션을 선택한 다음 드롭다운 목록에서 값을 선택합니다.

  5. 분석에 사용할 열 선택을 클릭합니다.

  6. 고급 열 선택 대화 상자에서 유용한 정보가 있는 열을 선택합니다. 분석과 관련이 없는 열을 제거합니다. OK를 클릭합니다.

    결과가 왜곡되는 것을 방지하려면 중복 정보가 있는 열도 제거해야 합니다. 예를 들어 숫자 데이터가 포함된 Income 열과 높음, 중간 및 낮음 레이블이 포함된 소득 그룹 열이 있는 경우 동일한 모델에 두 열을 모두 포함하면 안 됩니다. 대신 각 열에 대해 별도의 모델을 만들 수 있습니다.

  7. 출력 옵션 섹션에서 작업 계산기를 선택하여 Excel 통합 문서 내에서 분석 및 성과 기록표를 만듭니다. 프린터 준비 계산기를 선택하여 분석을 만들고 직접 채점하는 데 인쇄 및 사용할 수 있는 보고서를 생성합니다.

  8. 실행을 클릭합니다.

    이 도구는 보고서 및 성과 기록표를 포함하는 새 워크시트를 만듭니다.

요구 사항

예측 계산기 도구는 불연속 값과 불연속 및 연속 숫자 데이터로 작업할 수 있는 Microsoft 로지스틱 회귀 알고리즘을 사용합니다.

점수 매기기 보고서 이해

두 출력 옵션을 모두 선택하면 예측 계산기가 현재 통합 문서 내에 다음 세 개의 새 워크시트를 만듭니다.

  • 상호 작용 및 수익을 실험하는 데 도움이 되는 대화형 테이블 및 그래프로 완성된 분석 결과를 포함하는 예측 보고서입니다.

  • 점수를 만드는 데 도움이 되는 대화형 예측 계산기 입니다.

  • 점수 매기기에 사용할 명령 및 계수가 있는 인쇄 가능한 계산기 입니다.

  • 이 섹션에서는 각 보고서의 정보와 다양한 보고서 옵션을 사용하는 방법을 설명합니다.

그래프를 사용하는 예측 보고서

첫 번째 예측 보고서의 제목은 <대상 상태>의 <대상 특성>에 대한 예측 계산기 보고서입니다. 특정 분석의 재정적 영향을 평가하는 데 도움이 되는 도구와 함께 분석에서 파생된 요인 테이블이 포함되어 있습니다.

비용 및 수익 지정 표

보고서의 왼쪽 위에 있는 이 보고서의 첫 번째 도구는 값을 올바르고 잘못 예측하는 것과 관련된 비용과 수익을 지정할 수 있는 테이블입니다. 계산기의 최적 점수 임계값을 계산하려면 이러한 비용과 수익이 필요합니다.

항목 설명 및 예
가양성 비용 실제로 예측이 잘못된 경우 모델이 긍정 결과를 올바르게 예측했다고 가정하는 비용입니다.

예를 들어 모델은 고객이 무언가를 구매할 것이라고 예측하고, 이를 기반으로 해당 고객을 대상으로 하는 캠페인을 고안합니다. 여기에 고객에게 아웃리치 비용을 입력할 수 있습니다.
거짓 부정 비용 실제로 예측이 잘못되었을 때 모델이 부정을 올바르게 예측했다고 가정하는 비용입니다.

예를 들어 모델은 오래된 고객이 자전거를 구매할 가능성이 낮다고 예측할 수 있지만 모델이 왜곡되어 나이든 고객을 대상으로 할 기회를 놓쳤습니다. 여기에서 누락된 기회 비용을 할당할 수 있습니다.
진정한 긍정적 이익 긍정적인 결과를 올바르게 예측하여 이익을 얻습니다. 예를 들어 올바른 고객을 대상으로 하고 고객에게 접근하여 판매 성공이 이루어지면, 여기에 고객당 수익을 입력합니다.
진정한 음수 이익 부정적인 결과를 올바르게 예측하여 이익을 얻습니다.

예를 들어 대상을 지정하지 않아야 하는 고객을 올바르게 식별할 수 있는 경우 여기에 고객당 X의 광고 달러를 입력할 수 있습니다.

최대 수익을 보기 위한 차트

테이블에 값을 입력하면 관련 그래프가 자동으로 업데이트되어 현재 모델에서 수익을 극대화하는 데 가장 적합한 지점이 표시됩니다. 이 테이블의 오른쪽에 있는 꺾은선형 그래프는 다양한 점수 임계값에 대한 수익을 표시합니다. 수익은 모델의 예측 및 확률에 따라 테이블에 입력하는 수익 및 비용 수치를 사용하여 추정됩니다.

예를 들어 왼쪽 위 표에서 이익을 최대화하기 위해 제안된 임계값 의 셀에 값 500이 표시되면 오른쪽의 차트는 선 그래프에서 가장 높은 지점으로 500을 표시합니다. 이 값이 500이라는 의미는 수익을 최대화하려면 마이닝 모델의 상위 500개 권장 사항을 확률별로 정렬하여 사용해야 한다는 것입니다.

각 특성 및 값에 대한 점수를 나열하는 테이블

보고서 왼쪽 아래의 표에는 검색된 값에 대한 자세한 분석과 각 값이 결과에 미치는 영향을 보여 줍니다. 이 테이블의 값은 변경할 수 없습니다. 예측을 이해하는 데 도움이 되도록 표시됩니다.

예를 들어 다음 표에서는 고객이 자전거를 구매하는 경우의 결과 예를 보여 줍니다. 이 표에는 입력이 모델에 영향을 주었는지 여부에 관계없이 모델에서 사용된 각 입력 열이 나열됩니다. 또한 입력 열에 연속 숫자 데이터가 포함된 경우 이산 값과 불연속 값도 나열됩니다.

상대 영향 열의 값은 백분율로 표현되는 확률입니다. 이 값이 결과에 미치는 영향을 시각적으로 나타내기 위해 셀이 음영 처리됩니다.

특성 가치 상대적 영향
결혼 상태 결혼한 0
결혼 상태 싱글 71
성별 여성 13
성별 남성 0

다음과 같이 이러한 요소를 해석할 수 있습니다.

  • 결혼해도 고객이 자전거를 구입할 가능성은 영향을 받지 않습니다.

  • 그러나 싱글이 된다는 것은 고객이 자전거를 구매할 가능성이 높다는 강력한 지표(70%)입니다.

  • 고객의 성별은 고객이 여성인 경우 예측된 자전거 구매 행동에 한계 효과(13%)만 적용되며, 고객이 남성인 경우 예측된 자전거 구매 행동에는 영향을 미치지 않습니다.

누적 오분류 비용 차트

보고서의 오른쪽 아래에 있는 영역형 차트는 다양한 점수 임계값에 대한 누적 오분류 비용을 보여 줍니다. 또한 이 차트는 위양성, 참양성, 위부정 및 위양성으로 입력한 비용 및 이익 수치를 사용합니다.

수익 극대화에 중점을 둔 보고서의 오른쪽 위에 있는 차트와 달리 이 차트는 잘못된 예측을 만드는 비용을 통합합니다. 이 차트는 잘못된 결정을 내리는 비용이 올바르게 추측하는 비용보다 훨씬 큰 방지와 같은 시나리오에서 특히 유용합니다.

예를 들어 첫 번째 차트는 모델에서 예측한 상위 500명의 고객을 대상으로 하는 것이 수익을 극대화하는 방법임을 시사하지만, 이 두 번째 차트를 살펴보면 고객을 잘못 대상으로 하는 비용이 너무 크다고 판단하고 처음 400명의 고객에게 마케팅 캠페인을 중단하기로 결정할 수 있습니다.

대화형 예측 계산기

예측 계산기 도구에서 만든 두 번째 워크시트의 제목은 대상 특성>의 <대상 상태에> 대한 <예측 계산기입니다. 개별 점수를 계산하는 데 사용할 수 있는 대화형 워크시트입니다. 이 워크시트는 모델에 저장된 패턴과 통계를 사용하므로 다양한 값을 실험하고 예측 점수에 미치는 영향을 확인할 수 있습니다. 또한 이 보고서에는 두 개의 섹션이 있습니다. 하나는 대화형이며 하나는 참조로 제공됩니다.

첫 번째 테이블

테이블의 열에서 새 값을 선택하거나 입력하여 값 변경이 점수에 미치는 영향을 확인할 수 있습니다.

예를 들어 보고서에 다음 값이 포함된 경우 자동차 값을 1로 줄인 다음 0으로 줄여 고객 구매 동작에 미치는 영향을 확인할 수 있습니다. 자동차 값을 0으로 변경하면 아래쪽의 예측이 TRUE로 변경됩니다.

특성 가치 상대적 영향
결혼 상태 결혼한 0
성별 남성 0
소득 39050 - 71062 117
자녀 0 157
교육 학사 22
직업 숙련된 수작업자 33
주택 소유자 8 (여덟)
자동차 2 50
통근 거리 0-1 마일 99
지역 북아메리카 0
나이 37 - 46 5
총계 491
'예'에 대한 예측 거짓

새 값을 입력하면 셀에 표시되는 예측 점수가 "예"에서 "TRUE"로 변경되고, 다양한 특성에 대한 상대 영향 점수도 업데이트됩니다.

비고

자동차 수와 같은 값을 하나만 변경하더라도 다른 특성의 값과 영향은 변경됩니다. 이는 데이터 마이닝 모델이 데이터 간에 복잡한 관계를 찾는 경우가 많기 때문에 하나의 변수를 변경하면 예기치 않은 영향을 미칠 수 있기 때문입니다. 이러한 이유로 대화형 예측 계산기를 사용하여 서로 다른 값을 실험하거나 마이닝 모델을 찾아 상호 작용을 더 잘 이해하는 것이 좋습니다. 자세한 내용은 모델 찾아보기를 참조하세요.

점수 분류

이 표에서는 입력 열의 가능한 각 상태에 대한 개별 점수와 점수가 결과에 미치는 상대적 영향을 보여 줍니다. 이 테이블은 정적이며 참조 전용입니다.

인쇄 가능한 예측 계산기

예측 계산기 도구에서 만든 세 번째 워크시트의 제목은 <대상 상태>의 <대상 특성>에 대한 PrintablePrediction 계산기입니다. 이 성과 기록표는 컴퓨터에서 떨어져 있을 때 수동으로 점수를 계산할 수 있도록 인쇄하기 위한 것입니다.

예측 계산기에서 생성된 점수 매기기 보고서를 인쇄하고 사용하려면
  1. 특성>에 대한 인쇄 가능한 예측 계산기라는 탭을 <클릭합니다.

  2. Excel 파일 메뉴에서 인쇄 미리 보기를 선택합니다.

  3. 성과 기록표가 원하는 방식으로 페이지에 맞을 때까지 페이지 방향, 여백 및 기타 인쇄 옵션을 변경합니다.

    이 성과 기록표는 동적이 아니고 모델에 연결되지 않으므로 기본 데이터에 영향을 주지 않고 열 또는 행을 이동하여 서식을 개선할 수 있습니다.

  4. 성과 기록표를 인쇄합니다.

  5. 각 특성에 대해 하나의 값만 선택합니다. 선택한 값의 경우 확인란에 확인 표시를 넣고 점수 열에 해당 숫자를 씁니다.

  6. 정확도를 보장하기 위해 가능한 한 많은 특성을 입력합니다.

  7. 각 특성의 점수 합계를 계산하고 Total 행에 해당 숫자를 입력합니다.

  8. Total 행 바로 뒤의 시트에 인쇄된 조건을 사용하여 점수를 예측 결과로 변환 합니다 .

Analysis Services는 이러한 유형의 분석에 사용할 Microsoft 로지스틱 회귀 알고리즘을 제공합니다. 로지스틱 회귀에 이미 익숙한 경우 Excel용 데이터 마이닝 클라이언트의 고급 옵션을 사용하여 로지스틱 회귀 모델을 쉽게 만들 수 있습니다. 자세한 내용은 고급 모델링(Excel용 데이터 마이닝 추가 기능)을 참조하세요. 로지스틱 회귀 모델의 옵션 및 매개 변수에 대한 자세한 내용은 SQL Server 온라인 설명서의 "Microsoft 로지스틱 회귀 알고리즘" 항목을 참조하세요.

또한 참조하십시오

Excel용 테이블 분석 도구