다음을 통해 공유


Jupyter Notebook 및 Azure Data Studio를 사용하여 빅 데이터 클러스터 문제 해결

이 페이지는 SQL Server 빅 데이터 클러스터용 Notebook의 인덱스입니다. 이러한 실행 가능한 Notebook(.ipynb)은 빅 데이터 클러스터 문제를 해결하는 데 도움이 되도록 SQL Server 2019용으로 설계되었습니다.

Important

Microsoft SQL Server 2019 빅 데이터 클러스터는 사용 중지되었습니다. SQL Server 2019 빅 데이터 클러스터에 대한 지원은 2025년 2월 28일부터 종료되었습니다. 자세한 내용은 Microsoft SQL Server 플랫폼의 공지 블로그 게시물 및 빅 데이터 옵션을 참조하세요.

각 Notebook은 자체 종속성을 확인하도록 설계되었습니다. 모든 셀 실행 옵션은 성공적으로 완료되거나, 누락된 의존성을 해결하기 위한 다른 노트북으로의 하이퍼링크된 힌트와 함께 예외를 발생시킵니다. 대상 노트북의 힌트 하이퍼링크를 통해 모든 셀 실행을 클릭합니다. 성공하면 원래 전자 필기장으로 돌아가서 모든 셀 실행을 클릭합니다.

모든 종속성이 설치되었지만 모든 셀 실행 이 실패하면 각 Notebook에서 결과를 분석하고 가능한 경우 다른 Notebook에 대한 하이퍼링크 힌트를 생성하여 문제를 해결하는 데 도움이 됩니다.

빅 데이터 클러스터 문제 해결

이 섹션에는 SQL Server 빅 데이터 클러스터에서 로그를 가져오기 위한 Notebook 집합이 포함되어 있습니다.

Name Description
TSG100 - 빅 데이터 클러스터 문제 해결사 빅 데이터 클러스터 문제 해결 방법과 사용 시기에 대한 사용 가능한 모든 노트북 개요.
TSG101 - SQL Server 문제 해결사 SQL Server 문제 해결 및 사용 시기에 대한 사용 가능한 모든 Notebook 개요
TSG102 - HDFS 문제 해결사 HDFS 문제 해결 및 사용 시기에 대한 사용 가능한 모든 Notebook 개요
TSG103 - Spark 문제 해결사 Spark 문제 해결 및 사용 시기에 대한 사용 가능한 모든 Notebook 개요
TSG104 - 제어 문제 해결사 컨트롤러 문제 해결 및 사용 시기에 대한 사용 가능한 모든 Notebook 개요
TSG105 - 게이트웨이 문제 해결사 Knox Gateway 문제 해결 및 사용 시기에 대한 사용 가능한 모든 Notebook 개요
TSG106 - 앱 문제 해결사 App-Deploy 문제 해결 및 사용 시기에 대한 사용 가능한 모든 Notebook 개요

빅 데이터 클러스터에서 문제 진단

빅 데이터 클러스터를 사용하여 상황 및 상태를 진단하기 위한 Notebook 세트입니다.

Name Description
TSG002 - 충돌 반복 대기 (CrashLoopBackoff) 이 TSG는 '실행 중' 상태로 전환하려는 마지막 시도가 실패한 각 컨테이너에 연결하고 현재 및 이전 컨테이너 로그를 가져옵니다. 이는 kubectl get Pod에 보고된 CrashLoopBackOff 문제를 디버깅하는 데 유용합니다.
TSG025 - FSM 브라우저 - 쿼리 제어기 FSM 상태 이 노트북을 사용하여 컨트롤러 데이터베이스에 연결하고 유한 상태 기계(FSM)의 상태를 탐색합니다. 이 Notebook을 사용하여 활성 상태 컴퓨터를 나열하고 중단된 워크플로를 식별합니다.
TSG026 - 데이터 풀 노드에 연결(T-SQL 실행) 이 Notebook을 사용하여 데이터 풀 노드에 연결(T-SQL 실행)
TSG027 - 클러스터 배포 관찰 이 Notebook을 사용하여 클러스터 배포를 관찰하고 SQL Server 빅 데이터 클러스터 만들기 문제를 해결하는 지침을 제공합니다. 다음 명령은 종종 기본 원인을 파악하는 데 유용합니다.
TSG029 - 클러스터에서 덤프 찾기 이 Notebook을 사용하여 빅 데이터 클러스터의 SQL Server 또는 컨트롤러와 같은 프로세스에서 coredump 및 미니덤프를 찾습니다.
TSG032 - 모든 컨테이너에 대한 CPU 및 메모리 사용량 이 Notebook을 사용하여 모든 컨테이너의 CPU 및 메모리 사용량을 확인합니다.
TSG037 - 주 복제본을 호스팅하는 마스터 풀 Pod 확인 마스터 풀 고가용성이 활성화된 경우 빅 데이터 클러스터의 주 복제본을 호스팅할 마스터 풀 포드를 결정하기 위해 이 연습장을 사용하세요.
TSG044 - 마스터 풀 컨테이너에서 sqlcmd 실행 이 Notebook을 사용하여 T-SQL을 통해 직접 마스터 풀 노드에 연결합니다.
TSG055 - Sparkhead로 향하는 시간 Curl 이 노트북을 사용하여 컨트롤러 Pod에서 sparkhead Pod로의 Curl 응답 시간을 파악하기 위한 단계를 진단합니다.
TSG060 - 모든 빅 데이터 클러스터 PVC에 대한 영구 볼륨 디스크 공간 이 Notebook을 사용하여 각 컨테이너에 연결하고 빅 데이터 클러스터의 각 PVC(지속 볼륨 클레임)에 매핑된 각 PV(지속형 볼륨)에 사용/사용할 수 있는 디스크 공간을 가져옵니다.
TSG078 - 클러스터가 정상인가요? 이 Notebook을 사용하여 빅 데이터 클러스터가 정상 상태인지 확인합니다.
TSG079 - 컨트롤러 코어 덤프 생성 이 노트북을 사용하여 컨트롤러 코어 덤프를 생성합니다.
TSG086 - 모든 컨테이너에서 상위 실행 이 Notebook을 사용하여 모든 컨테이너에서 맨 위로 실행합니다.
TSG087 - namenode Pod에서 hadoop fs CLI 사용 이 Notebook을 사용하여 namenode Pod에서 hadoop fs CLI를 사용합니다.
TSG108 - 컨트롤러 업그레이드 구성 맵 보기 이 Notebook을 이용하여 azdata bdc upgrade 명령어를 실행하여 빅 데이터 클러스터 업그레이드를 수행할 때 발생하는 실패를 해결합니다.
TSG112 - Active Directory 배포 전 검사 이 Notebook을 사용하여 빅 데이터 클러스터 구성이 Active Directory 배포에 유효한지 확인합니다.
TSG115 - SQL Server on Linux 보안 로그 번역기 이 Notebook을 사용하여 SQL Server on Linux용 security.ldap 및 security.kerberos 로거에서 생성된 로그를 구문 분석합니다. 이러한 로거를 사용하도록 설정하려면 Linux에서 SQL Server를 실행하는 컴퓨터의 /var/opt/mssql/logger.ini 아래 줄을 배치합니다. 참고: 이 파일은 대/소문자를 구분합니다.
TSG116 - SQL BDC 보안 지원 로그 번역기 이 Notebook을 사용하여 SQL BDC의 보안 지원 서비스에서 생성된 로그를 구문 분석합니다. 로그를 가져오기 위해 클러스터에서 디버그 로그를 복사하고 추출합니다. 아래 단계에 따라 "azdata bdc debug copy-logs -n <네임스페이스>"를 실행합니다. 그러면 여러 .tar.gz 파일이 생성됩니다. debuglogs-<네임스페이스>-<date>-<time>.tar.gz의 내용을 추출하십시오. ./<네임스페이스>/control-<…>/security-support/supervisol/log/secsupp-stderr---<…>.log에 저장된 보안 지원 로그를 찾으십시오.
TSG119 - Active Directory 배포 후 검사 이 Notebook은 AD 배포 후 BDC 구성의 유효성을 검사하도록 설계되었습니다. dnsName 특성이 있는 모든 엔드포인트에 대한 DNS 항목이 있는지 확인하고 이러한 DNS 항목은 별칭이 아닌 호스트 레코드(예: CNAME 레코드가 아닌 레코드)여야 합니다. 또한 잘 알려진 AD 계정의 존재 및 사용 여부 및 예상된 SPN의 존재 여부

빅 데이터 클러스터에서 문제 복구

SQL Server 빅 데이터 클러스터의 알려진 상황 및 상태를 복구하기 위한 Notebook 집합입니다.

Name Description
TSG005 - 전달 루프가 검색됨 유틸리티 dnsmasq가 resolv.conf에 로컬 루프백을 배치할 수 있기 때문에 이 노트북을 사용하여 전달 루프를 처리합니다. 이는 초기 클러스터 배포 중에 컨트롤러 Pod가 CrashLoopBackOff 상태로 전환될 수 있는 원인이 됩니다. https://askubuntu.com/questions/627899/nameserver-127-0-1-1-in-resolv-conf-wont-go-away
TSG011 - sparkhistory 서버 다시 시작 sparkhistory java 프로세스가 시작 중에 응답을 중지할 수 있으므로 이 Notebook을 사용하여 sparkhistory 서버를 다시 시작합니다. sparkhistory 서버를 다시 시작하면(supervisorctl restart sparkhistory) 이 문제를 해결할 수 있습니다.
TSG018 - 마스터 풀에서 sqlservr 프로세스 종료 T-SQL SHUTDOWN이 ./sqlservr 프로세스를 다시 순환하지 못하는 경우 이 Notebook을 사용합니다. 이 Notebook을 사용하여 기본 sqlservr 프로세스를 종료합니다. 이 프로세스는 ./sqlservr 프런트 엔드 프로세스에 의해 자동으로 다시 시작됩니다.
TSG024 - Namenode가 안전 모드에 있습니다. HDFS가 안전 모드로 전환되면 이 Notebook을 사용합니다. 예를 들어 스토리지 풀에서 너무 많은 Pod가 너무 빨리 다시 순환되면 안전 모드가 자동으로 사용하도록 설정될 수 있습니다.
TSG028 - 모든 스토리지 풀 노드에서 노드 관리자 다시 시작 모든 스토리지 풀 노드에서 노드 관리자를 다시 시작해야 하는 경우 이 Notebook을 사용합니다.
TSG038 - BDC 생성 실패 - 문서에서 키가 누락되었습니다. BDC에서 키를 누락하여 실패를 만들 때 이 Notebook을 사용합니다.
TSG039 - 잘못된 개체 이름 'role_permissions'입니다. 역할 권한으로 인해 Knox gateway.log에서 잘못된 개체 문제가 있을 때 이 노트를 사용하십시오.
TSG040 - 오류가 있는 컨트롤러에서 파일 이름을 가져오는 데 실패했습니다. 컨트롤러에서 파일 이름을 가져오는 동안 504 게이트웨이 타임아웃이 발생하면 이 노트북을 사용하십시오.
TSG041 - 새 비동기 입출력 컨텍스트를 만들 수 없습니다. sysctl fs.aio-max-nr를 증가시키세요. 새 비동기 I/O 컨텍스트를 만들 수 없는 경우, sysctl fs.aio-max-nr을 증가시켜 이 notebook을 사용하세요.
TSG045 - 이 크기의 VM에 연결할 수 있는 최대 데이터 디스크 수(AKS) AKS(이 크기의 VM)에 연결할 수 있는 최대 데이터 디스크 수를 허용하는 경우 이 Notebook을 사용합니다.
TSG047 - ConfigException - 이름이 있는 개체가 하나만 필요합니다. 이름이 있는 개체가 하나만 필요한 ConfigException이 있는 경우 이 Notebook을 사용합니다.
TSG048 - 배포가 "컨트롤러 Pod가 작동 대기 중"에 중단됨 배포가 "컨트롤러 Pod가 작동 대기 중"에 중단된 경우 이 Notebook을 사용합니다.
TSG050 - 클러스터 만들기가 "볼륨이 Pod에 연결되거나 탑재되기를 기다리는 시간 제한 만료"와 함께 중단됩니다. 클러스터 생성이 "Pod에 볼륨을 연결하거나 마운트하는 데 시간이 초과되었습니다" 오류와 함께 중단되는 경우, 이 노트북을 사용하십시오.
TSG052 - master-svc DNS를 가져오는 데 실패하고 다시 시도합니다. 클러스터 생성이 "Pod에 볼륨을 연결하거나 마운트하는 데 시간이 초과되었습니다" 오류와 함께 중단되는 경우, 이 노트북을 사용하십시오.
TSG057 - 컨트롤러 서비스를 시작할 때 실패했습니다. System.TimeoutException 컨트롤러 서비스를 시작하거나 System.TimeoutException이 발생할 때 이 노트북을 사용하세요.
TSG067 - kube 구성 설정을 완료하지 못했습니다. kube 설정 구성이 실패하는 경우 이 Notebook을 사용합니다.
TSG074 - App-Deploys 삭제 빅 데이터 클러스터에서 앱을 삭제하는 데 문제가 있는 경우 이 Notebook을 사용합니다.
TSG075 - NetworkPlugin cni로 인해 FailedCreatePodSandBox가 Pod를 설정하지 못함 NetworkPlugin cni가 Pod를 설정하지 못하여 'FailedCreatePodSandBox' 예외가 발생할 때 이 노트북을 사용하세요.
TSG080 - azdata를 사용하여 Spark 세션 삭제 Spark 세션을 삭제하는 동안 문제가 발생할 때 이 Notebook을 사용합니다.
TSG109 - 업그레이드 시간 제한 설정 BDC 업그레이드 문제를 겪을 때 이 노트북을 사용하세요.
TSG110 - Azdata가 ApiError를 반환합니다. Azdata가 ApiError를 반환할 때 이 Notebook을 사용합니다.

Next steps

빅 데이터 클러스터에 대한 자세한 내용은 SQL Server 빅 데이터 클러스터란?을 참조하세요.