이 항목에서는 Microsoft 로지스틱 회귀 알고리즘을 사용하는 모델과 관련된 마이닝 모델 콘텐츠에 대해 설명합니다. 모든 모델 형식에서 공유하는 통계 및 구조와 마이닝 모델 콘텐츠와 관련된 용어의 일반 정의를 해석하는 방법에 대한 설명은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.
로지스틱 회귀 모델의 구조 이해
로지스틱 회귀 모델은 숨겨진 노드를 제거하기 위해 모델을 제한하는 매개 변수와 함께 Microsoft 신경망 알고리즘을 사용하여 만들어집니다. 따라서 로지스틱 회귀 모델의 전체 구조는 신경망의 구조와 거의 동일합니다. 각 모델에는 모델 및 해당 메타데이터를 나타내는 단일 부모 노드와 모델에 사용되는 입력에 대한 설명 통계를 제공하는 특수 한계 통계 노드(NODE_TYPE = 24)가 있습니다.
또한 모델에는 예측 가능한 각 특성에 대한 서브네트워크(NODE_TYPE = 17)가 포함됩니다. 신경망 모델에서와 마찬가지로 각 서브네트워크에는 항상 입력 계층에 대한 분기와 네트워크에 대한 숨겨진 계층(NODE_TYPE = 19)과 출력 계층(NODE_TYPE = 20)이 포함된 다른 분기의 두 가지가 포함됩니다. 여러 특성이 예측 전용으로 지정된 경우 동일한 서브네트워크를 사용할 수 있습니다. 또한 입력인 예측 가능한 특성은 동일한 서브네트워크에 표시되지 않을 수 있습니다.
그러나 로지스틱 회귀 모델에서는 숨겨진 계층을 나타내는 노드가 비어 있고 자식이 없습니다. 따라서 모델에는 개별 출력(NODE_TYPE = 23)과 개별 입력(NODE_TYPE = 21)을 나타내는 노드가 포함되지만 개별 숨겨진 노드는 없습니다.
기본적으로 로지스틱 회귀 모델은 Microsoft 신경망 뷰어에 표시됩니다. 이 사용자 지정 뷰어를 사용하면 입력 특성 및 해당 값을 필터링하고 출력에 미치는 영향을 그래픽으로 확인할 수 있습니다. 뷰어의 도구 설명은 각 입력 및 출력 값 쌍과 연결된 확률 및 리프트를 보여 줍니다. 자세한 내용은 Microsoft 신경망 뷰어를 사용하여 모델 찾아보기를 참조하세요.
입력 및 서브네트워크의 구조를 탐색하고 자세한 통계를 보려면 Microsoft 일반 콘텐츠 트리 뷰어를 사용할 수 있습니다. 노드를 클릭하여 확장하거나 자식 노드를 보거나 노드에 포함된 가중치 및 기타 통계를 볼 수 있습니다.
로지스틱 회귀 모델에 대한 모델 콘텐츠
이 섹션에서는 로지스틱 회귀와 특별한 관련성이 있는 마이닝 모델 콘텐츠의 해당 열에 대한 세부 정보 및 예제만 제공합니다. 모델 콘텐츠는 신경망 모델의 내용과 거의 동일하지만, 편의를 위해 이 표에서 신경망 모델에 적용되는 설명을 반복할 수 있습니다.
여기에 설명되지 않은 MODEL_CATALOG 및 MODEL_NAME 같은 스키마 행 집합의 범용 열에 대한 자세한 내용은 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)를 참조하세요.
모델 카탈로그
모델이 저장되는 데이터베이스의 이름입니다.
MODEL_NAME
모델의 이름입니다.
속성_이름
이 노드에 해당하는 특성의 이름입니다.
| 노드 | 콘텐츠 |
|---|---|
| 모델 루트 | 빈 |
| 주변 통계 | 빈 |
| 입력 계층 | 빈 |
| 입력 노드 | 입력 속성 이름 |
| 숨겨진 계층 | 빈 |
| 출력 계층 | 빈 |
| 출력 노드 | 출력 특성 이름 |
노드 이름
노드의 이름입니다. 현재 이 열에는 NODE_UNIQUE_NAME 것과 동일한 값이 포함되어 있지만 이후 릴리스에서는 변경될 수 있습니다.
노드_고유_이름
노드의 고유 이름입니다.
이름과 ID가 모델에 대한 구조적 정보를 제공하는 방법에 대한 자세한 내용은 노드 이름 및 ID 사용 섹션을 참조하세요.
노드_유형
로지스틱 회귀 모델은 다음 노드 형식을 출력합니다.
| 노드 형식 ID | 설명 |
|---|---|
| 1 | 모델. |
| 17 | 서브네트워크에 대한 구성 도우미 노드입니다. |
| 18 | 입력 계층에 대한 구성 도우미 노드입니다. |
| 19 | 숨겨진 계층에 대한 구성 도우미 노드입니다. 숨겨진 계층이 비어 있습니다. |
| 20 | 출력 계층에 대한 구성 도우미 노드입니다. |
| 21 | 입력 특성 노드입니다. |
| 23 | 출력 특성 노드입니다. |
| 24 | 마진 통계 노드. |
노드 캡션
노드와 연결된 레이블 또는 캡션입니다. 로지스틱 회귀 모델에서는 항상 비어 있습니다.
자식 수
노드에 있는 자식 수의 추정값입니다.
| 노드 | 콘텐츠 |
|---|---|
| 모델 루트 | 최소 1개의 네트워크, 1개의 필수 한계 노드 및 1개의 필수 입력 계층을 포함하는 자식 노드의 수를 나타냅니다. 예를 들어 값이 5이면 3개의 서브네트워크가 있습니다. |
| 주변 통계 | 항상 0입니다. |
| 입력 계층 | 모델에서 사용한 입력 특성-값 쌍의 수를 나타냅니다. |
| 입력 노드 | 항상 0입니다. |
| 숨겨진 계층 | 로지스틱 회귀 모델에서는 항상 0입니다. |
| 출력 계층 | 출력 값의 수를 나타냅니다. |
| 출력 노드 | 항상 0입니다. |
상위_고유_이름
노드 부모의 고유 이름입니다. 루트 수준의 모든 노드에 대해 NULL이 반환됩니다.
이름과 ID가 모델에 대한 구조적 정보를 제공하는 방법에 대한 자세한 내용은 노드 이름 및 ID 사용 섹션을 참조하세요.
노드 설명
노드에 대한 사용자 친화적인 설명입니다.
| 노드 | 콘텐츠 |
|---|---|
| 모델 루트 | 빈 |
| 주변 통계 | 빈 |
| 입력 계층 | 빈 |
| 입력 노드 | 입력 속성 이름 |
| 숨겨진 계층 | 빈 |
| 출력 계층 | 빈 |
| 출력 노드 | 출력 특성이 연속적이면 출력 특성의 이름을 포함합니다. 출력 특성이 불연속적이거나 불연속화된 경우 특성의 이름과 값을 포함합니다. |
노드 규칙
노드에 포함된 규칙에 대한 XML 설명입니다.
| 노드 | 콘텐츠 |
|---|---|
| 모델 루트 | 빈 |
| 주변 통계 | 빈 |
| 입력 계층 | 빈 |
| 입력 노드 | NODE_DESCRIPTION 열과 동일한 정보를 포함하는 XML 조각입니다. |
| 숨겨진 계층 | 빈 |
| 출력 계층 | 빈 |
| 출력 노드 | NODE_DESCRIPTION 열과 동일한 정보를 포함하는 XML 조각입니다. |
주변 규칙
로지스틱 회귀 모델의 경우 항상 비어 있습니다.
노드 확률
이 노드와 연결된 확률입니다. 로지스틱 회귀 모델의 경우 항상 0입니다.
한계 확률
부모 노드에서 노드에 도달할 확률입니다. 로지스틱 회귀 모델의 경우 항상 0입니다.
노드 분포
노드에 대한 통계 정보를 포함하는 중첩 테이블입니다. 각 노드 유형에 대한 이 테이블의 내용에 대한 자세한 내용은 신경망 모델용 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)의 NODE_DISTRIBUTION 테이블 이해 섹션을 참조하세요.
노드 지원
로지스틱 회귀 모델의 경우 항상 0입니다.
비고
이 모델 형식의 출력이 확률적이지 않으므로 지원 확률은 항상 0입니다. 알고리즘에 의미 있는 유일한 것은 가중치입니다. 따라서 알고리즘은 확률, 지원 또는 분산을 계산하지 않습니다.
특정 값에 대한 학습 사례의 지원에 대한 정보를 얻으려면 한계 통계 노드를 참조하세요.
MSOLAP_MODEL_COLUMN
|노드|콘텐츠|
|----------|-------------|
|모델 루트|공백|
|한계 통계|비어 있음|
|입력 계층|비어 있음|
|입력 노드|입력 특성 이름입니다.|
|숨겨진 레이어|비어 있음|
|출력 계층|빈칸|
|출력 노드|입력 특성 이름입니다.|
MSOLAP_NODE_SCORE
로지스틱 회귀 모델에서는 항상 0입니다.
MSOLAP_NODE_SHORT_CAPTION
로지스틱 회귀 모델에서는 항상 비어 있습니다.
노드 이름 및 ID 사용
로지스틱 회귀 모델에서 노드 이름을 지정하면 모델의 노드 간 관계에 대한 추가 정보가 제공됩니다. 다음 표에서는 각 계층의 노드에 할당된 ID에 대한 규칙을 보여 줍니다.
| 노드 형식 | 노드 ID에 대한 규칙 |
|---|---|
| 모델 루트(1) | 00000000000000000. |
| 주변 통계 노드(24) | 10000000000000000 |
| 입력 계층(18) | 30000000000000000 |
| 입력 노드(21) | 60000000000000000에서 시작 |
| 서브네트워크(17) | 20000000000000000 |
| 숨겨진 레이어(19) | 40000000000000000 |
| 출력 계층(20) | 50000000000000000 |
| 출력 노드(23) | 800000000000000000에서 시작 |
이러한 ID를 사용하여 출력 노드의 NODE_DISTRIBUTION 테이블을 확인하여 출력 특성이 특정 입력 계층 특성과 어떻게 관련되는지 확인할 수 있습니다. 해당 테이블의 각 행에는 특정 입력 특성 노드를 다시 가리키는 ID가 포함되어 있습니다. NODE_DISTRIBUTION 테이블에는 해당 입력 출력 쌍에 대한 계수도 포함되어 있습니다.
또한 참조하십시오
Microsoft 로지스틱 회귀 알고리즘
신경망 모델에 대한 마이닝 모델 콘텐츠(Analysis Services - 데이터 마이닝)
로지스틱 회귀 모델 쿼리 예제
Microsoft 로지스틱 회귀 알고리즘 기술 참조