적용 대상: SQL Server 2019(15.x)
이 문서에서는 Machine Learning 시나리오에 SQL Server 빅 데이터 클러스터를 사용하는 방법을 설명합니다.
Important
Microsoft SQL Server 2019 빅 데이터 클러스터는 사용 중지되었습니다. SQL Server 2019 빅 데이터 클러스터에 대한 지원은 2025년 2월 28일부터 종료되었습니다. 자세한 내용은 Microsoft SQL Server 플랫폼의 공지 블로그 게시물 및 빅 데이터 옵션을 참조하세요.
SQL Server 빅 데이터 클러스터의 Machine Learning 소개
SQL Server 빅 데이터 클러스터를 사용하면 SQL Server Machine Learning Services 및 Apache Spark ML과 같은 다양한 기술 스택을 사용하여 기계 학습 시나리오 및 솔루션을 사용할 수 있습니다.
SQL Server 빅 데이터 클러스터는 설정된 SQL Server Machine Learning Services 기술 스택을 사용하여 SQL Server 엔진 내에서 Machine Learning 기능을 제공합니다. 고성능 데이터베이스 내 Machine Learning 유추 및 채점 시나리오를 사용하도록 설정합니다.
빅 데이터 기반 기계 학습 시나리오의 경우 빅 데이터 호스팅 및 Apache Spark ML 기능에 HDFS를 사용하는 것이 더 비용 효율적이고 확장 가능하며 강력합니다.
Machine Learning 시나리오
기계 학습 기능을 사용하면 사기 감지, 예측, 변동, 일반 분류 및 회귀 작업과 같은 다양한 애플리케이션과 솔루션을 사용할 수 있습니다. 그러나 시나리오에 가장 적합한 기술을 사용하는 것이 중요합니다.
| Aspect | SQL Server Machine Learning 서비스 | Apache Spark ML |
|---|---|---|
| Data placement | SQL Server에서 테이블 형식 데이터 지역성을 활용합니다. 프리미엄 데이터 계층입니다. | HDFS를 사용하는 확장 가능한 빅 데이터 계층; 구조화되지 않은, 반구조적 및 구조화된 데이터 중 하나. |
| Best for | 짧은 대기 시간 유추 및 점수 매기기 시나리오 | 1. 빅 데이터 위에 분산 일괄 처리 학습 및 점수 매기기 기계 학습 모델 2. ML에 대한 ETL 싱크 및 대규모 데이터 준비 및 기능화 |
| Feeds | ML 기반 BI 대시보드, 보고서 및 애플리케이션. 짧은 대기 시간 필요 | 일괄 처리 점수가 매겨진 데이터를 SQL Server로 승격하여 ML 기반 시나리오를 구동할 수 있습니다. |
| Latency | 짧은 대기 시간 필요 | 대기 시간이 더 높아질 수 있습니다. |
| Read more | SQL Server 빅 데이터 클러스터에서 Machine Learning Services를 사용하여 Python 및 R 스크립트 실행 | SQL Server 빅 데이터 클러스터에서 Spark Machine Learning 소개 |
Next steps
자세한 내용은 SQL Server 빅 데이터 클러스터 소개를 참조하세요.