다음을 통해 공유


SQL Server 빅 데이터 클러스터에 대한 Machine Learning 가이드

적용 대상: SQL Server 2019(15.x)

이 문서에서는 Machine Learning 시나리오에 SQL Server 빅 데이터 클러스터를 사용하는 방법을 설명합니다.

Important

Microsoft SQL Server 2019 빅 데이터 클러스터는 사용 중지되었습니다. SQL Server 2019 빅 데이터 클러스터에 대한 지원은 2025년 2월 28일부터 종료되었습니다. 자세한 내용은 Microsoft SQL Server 플랫폼의 공지 블로그 게시물 및 빅 데이터 옵션을 참조하세요.

SQL Server 빅 데이터 클러스터의 Machine Learning 소개

SQL Server 빅 데이터 클러스터를 사용하면 SQL Server Machine Learning ServicesApache Spark ML과 같은 다양한 기술 스택을 사용하여 기계 학습 시나리오 및 솔루션을 사용할 수 있습니다.

SQL Server 빅 데이터 클러스터는 설정된 SQL Server Machine Learning Services 기술 스택을 사용하여 SQL Server 엔진 내에서 Machine Learning 기능을 제공합니다. 고성능 데이터베이스 내 Machine Learning 유추 및 채점 시나리오를 사용하도록 설정합니다.

빅 데이터 기반 기계 학습 시나리오의 경우 빅 데이터 호스팅 및 Apache Spark ML 기능에 HDFS를 사용하는 것이 더 비용 효율적이고 확장 가능하며 강력합니다.

Machine Learning 시나리오

기계 학습 기능을 사용하면 사기 감지, 예측, 변동, 일반 분류 및 회귀 작업과 같은 다양한 애플리케이션과 솔루션을 사용할 수 있습니다. 그러나 시나리오에 가장 적합한 기술을 사용하는 것이 중요합니다.

Aspect SQL Server Machine Learning 서비스 Apache Spark ML
Data placement SQL Server에서 테이블 형식 데이터 지역성을 활용합니다. 프리미엄 데이터 계층입니다. HDFS를 사용하는 확장 가능한 빅 데이터 계층; 구조화되지 않은, 반구조적 및 구조화된 데이터 중 하나.
Best for 짧은 대기 시간 유추 및 점수 매기기 시나리오 1. 빅 데이터 위에 분산 일괄 처리 학습 및 점수 매기기 기계 학습 모델
2. ML에 대한 ETL 싱크 및 대규모 데이터 준비 및 기능화
Feeds ML 기반 BI 대시보드, 보고서 및 애플리케이션. 짧은 대기 시간 필요 일괄 처리 점수가 매겨진 데이터를 SQL Server로 승격하여 ML 기반 시나리오를 구동할 수 있습니다.
Latency 짧은 대기 시간 필요 대기 시간이 더 높아질 수 있습니다.
Read more SQL Server 빅 데이터 클러스터에서 Machine Learning Services를 사용하여 Python 및 R 스크립트 실행 SQL Server 빅 데이터 클러스터에서 Spark Machine Learning 소개

Next steps

자세한 내용은 SQL Server 빅 데이터 클러스터 소개를 참조하세요.