산점도는 모델에서 예측한 값에 대해 데이터의 실제 값을 그래프로 표시합니다. 산점도는 X축을 따라 실제 값을 표시하고 Y축을 따라 예측 값을 표시합니다. 또한 예측 값이 실제 값과 정확히 일치하는 완벽한 예측을 보여 주는 선을 표시합니다. 이 이상적인 45도 각도 선에서 점의 거리는 예측이 얼마나 잘 수행되었는지 또는 얼마나 저조한지를 나타냅니다.
산점도에 대한 이해
마케팅 부서에서 홍보용 전자 메일로 보낸 링크의 클릭 수에 따라 일일 매출을 예측하는 모델을 고려합니다. 클릭 수와 판매 금액은 모두 연속 숫자 값이므로 클릭 수를 독립 변수로 그래프로 표시하고 판매량을 종속 변수로 그래프로 표시할 수 있습니다. 이렇게 하면 직선에 예상 선형 관계가 표시되고 해당 선 주위에 흩어져 있는 점이 실제 데이터가 예상과 어떻게 다른지 보여 줍니다. 이 분석은 결과 집합이 특정 입력과 얼마나 밀접하게 연관되어 있는지, 그리고 이상적인 모델에서 얼마나 많은 차이가 있는지를 한눈에 알 수 있습니다.
결과 해석
다음 다이어그램은 앞서 설명된 시나리오에 대해 생성된 산점도의 예를 보여줍니다.
줄 주위에 흩어져 있는 모든 지점에서 마우스를 일시 중지하여 도구 설명에서 예측 값과 실제 값을 볼 수 있습니다. 산점도에 대한 마이닝 범례 가 없습니다. 그러나 차트 자체에는 모델과 연결된 점수를 표시하는 범례가 포함됩니다. 점수 해석에 대한 자세한 내용은 선형 회귀 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.
차트의 시각적 표현을 클립보드에 복사할 수 있지만 기본 데이터나 수식은 복사할 수 없습니다. 줄의 회귀 수식을 보려면 모델에 대한 콘텐츠 쿼리를 만들 수 있습니다. 자세한 내용은 선형 회귀 모델 쿼리 예제를 참조하세요.
산점도에 대한 제한 사항
분산형 플롯은 입력 선택 탭에서 선택한 모델에 예측 가능한 연속 특성이 포함된 경우에만 만들 수 있습니다. 추가로 선택할 필요가 없습니다. 산점도 차트 종류는 모델 및 특성 유형에 따라 리프트 차트 탭에 자동으로 표시됩니다.
시계열 모델은 연속 숫자를 예측하지만 산점도를 사용하여 시계열 모델의 정확도를 측정할 수는 없습니다. 기록 데이터의 일부를 예약하는 등 사용할 수 있는 다른 메서드가 있습니다. 자세한 내용은 시계열 모델 쿼리 예제를 참조하세요.
관련 내용
다음 항목에는 산점도 및 관련 정확도 차트를 빌드하고 사용하는 방법에 대한 자세한 정보가 포함되어 있습니다.
| 토픽 | 링크 |
|---|---|
| 타깃 메일링 모델의 리프트 차트를 만드는 방법에 대한 단계별 가이드를 제공합니다. |
기본 데이터 마이닝 자습서 리프트 차트를 사용하여 정확도 테스트(기본 데이터 마이닝 자습서) |
| 관련 차트 종류에 대해 설명합니다. |
리프트 차트 (Analysis Services - 데이터 마이닝) 수익 차트(Analysis Services - 데이터 마이닝) 분류 매트릭스(Analysis Services - 데이터 마이닝) |
| 마이닝 모델 및 마이닝 구조에 대한 교차 유효성 검사의 사용에 대해 설명합니다. | 교차 검증(Analysis Services - 데이터 마이닝) |
| 리프트 차트 및 기타 정확도 차트를 만드는 단계를 설명합니다. | 테스트 및 유효성 검사 작업 및 방법(데이터 마이닝) |