다음을 통해 공유


SQL Server 빅 데이터 클러스터에서 마스터 풀 소개

적용 대상: SQL Server 2019(15.x)

Important

Microsoft SQL Server 2019 빅 데이터 클러스터는 사용 중지되었습니다. SQL Server 2019 빅 데이터 클러스터에 대한 지원은 2025년 2월 28일부터 종료되었습니다. 자세한 내용은 Microsoft SQL Server 플랫폼의 공지 블로그 게시물 및 빅 데이터 옵션을 참조하세요.

이 문서에서는 SQL Server 빅 데이터 클러스터에서 SQL Server 마스터 인스턴스 의 역할을 설명합니다. 마스터 풀에는 SQL Server의 마스터 인스턴스가 포함됩니다. 마스터 인스턴스는 SQL Server 빅 데이터 클러스터에서 실행되는 SQL Server 인스턴스입니다. 마스터 인스턴스는 연결, 스케일 아웃 쿼리, 메타데이터 및 사용자 데이터베이스 및 기계 학습 서비스를 관리합니다.

SQL Server 마스터 인스턴스는 다음과 같은 기능을 제공합니다.

Connectivity

SQL Server 마스터 인스턴스는 클러스터에 대해 외부에서 액세스할 수 있는 TDS 엔드포인트를 제공합니다. 다른 SQL Server 인스턴스와 마찬가지로 애플리케이션 또는 SQL Server 도구(예: Azure Data Studio 또는 SQL Server Management Studio)를 이 엔드포인트에 연결할 수 있습니다.

확장형 쿼리 관리

SQL Server 마스터 인스턴스에는 컴퓨팅 풀의 노드에 있는 SQL Server 인스턴스 간에 쿼리를 분산하는 데 사용되는 스케일 아웃 쿼리 엔진이 포함되어 있습니다. 또한 스케일 아웃 쿼리 엔진은 더 이상 구성하지 않고 클러스터의 모든 Hive 테이블에 대한 Transact-SQL 통해 액세스를 제공합니다.

메타데이터 및 사용자 데이터베이스

표준 SQL Server 시스템 데이터베이스 외에도 SQL 마스터 인스턴스에는 다음이 포함됩니다.

  • HDFS 테이블 메타데이터를 보유하는 메타데이터 데이터베이스입니다.
  • 데이터 플레인 샤드 맵입니다.
  • 클러스터 데이터 평면에 대한 액세스를 제공하는 외부 테이블의 세부 정보입니다.
  • 사용자 데이터베이스에 정의된 PolyBase 외부 데이터 원본 및 외부 테이블.

SQL Server 마스터 인스턴스에 사용자 데이터베이스를 추가하도록 선택할 수도 있습니다.

기계 학습 서비스

SQL Server Machine Learning Services 기능은 데이터베이스 엔진에 대한 추가 기능입니다. SQL Server에서 Java, R 및 Python 코드를 실행하는 데 사용되는 기계 학습 서비스 기능입니다. 이 기능은 외부 프로세스를 핵심 엔진 프로세스에서 격리하는 SQL Server 확장성 프레임워크를 기반으로 하지만 관계형 데이터와 R 또는 Python 문을 포함하는 T-SQL 스크립트 또는 T-SQL을 포함하는 Java, R 또는 Python 코드와 같은 저장 프로시저로 완전히 통합됩니다.

SQL Server 빅 데이터 클러스터의 일부로 기계 학습 서비스는 기본적으로 SQL Server 마스터 인스턴스에서 사용할 수 있습니다. SQL Server 마스터 인스턴스에서 외부 스크립트 실행을 사용하도록 설정하면 sp_execute_external_script 사용하여 Java, R 및 Python 스크립트를 실행할 수 있습니다.

빅 데이터 클러스터의 기계 학습 서비스의 장점

SQL Server 빅 데이터 클러스터를 사용하면 일반적으로 엔터프라이즈 데이터베이스에 저장된 차원 데이터에 빅 데이터를 쉽게 조인할 수 있습니다. 빅 데이터의 가치는 조직의 일부의 손에 있을 뿐만 아니라 보고서, 대시보드 및 애플리케이션에도 포함되는 경우 크게 증가합니다. 동시에 데이터 과학자는 Spark/HDFS 에코시스템 도구를 계속 사용하고 SQL Server 마스터 인스턴스 및 SQL Server 마스터 인스턴스를 통해 액세스할 수 있는 외부 데이터 원본의 데이터에 쉽고 실시간으로 액세스할 수 있습니다.

SQL Server 빅 데이터 클러스터를 사용하면 엔터프라이즈 데이터 레이크를 사용하여 더 많은 작업을 수행할 수 있습니다. SQL Server 개발자 및 분석가는 다음을 수행할 수 있습니다.

  • 엔터프라이즈 데이터 레이크에서 데이터를 사용하는 애플리케이션을 빌드합니다.
  • Transact-SQL 쿼리가 있는 모든 데이터에 대한 이유입니다.
  • SQL Server 도구 및 애플리케이션의 기존 에코시스템을 사용하여 엔터프라이즈 데이터에 액세스하고 분석합니다.
  • 데이터 가상화 및 데이터 마트를 통한 데이터 이동의 필요성을 줄입니다.
  • 빅 데이터 시나리오에 Spark를 계속 사용합니다.
  • Spark 또는 SQL Server를 사용하여 데이터 레이크를 통해 모델을 학습하는 지능형 엔터프라이즈 애플리케이션을 빌드합니다.
  • 최상의 성능을 위해 프로덕션 데이터베이스에서 모델을 운영합니다.
  • 실시간 분석을 위해 엔터프라이즈 데이터 마트로 직접 데이터를 스트리밍합니다.
  • 대화형 분석 및 BI 도구를 사용하여 시각적으로 데이터를 탐색합니다.

Next steps

SQL Server 빅 데이터 클러스터에 대한 자세한 내용은 다음 리소스를 참조하세요.