소개
기계 학습에서 모델은 학습 데이터에 있는 알려진 레이블과 기능 간의 상관 관계를 기반으로 새 데이터에 대해 알 수 없는 레이블을 예측하도록 학습됩니다. 사용된 알고리즘에 따라 모델을 학습하는 방법을 구성하기 위해 하이퍼 매개 변수 지정해야 할 수 있습니다.
예를 들어 로지스틱 회귀 알고리즘은 정규화 속도 하이퍼 매개 변수를 사용하여 과잉 맞춤을 중화합니다. 나선형 신경망(CNN)에 대한 심층 학습 기술은 학습 속도 같은 하이퍼 매개 변수를 사용하여 학습 중에 가중치가 조정되는 방식을 제어하고, 배치 크기를 각 학습 일괄 처리에 포함되는 데이터 항목 수를 결정합니다.
메모
Machine Learning은 고유한 특정 용어를 가진 학술 분야입니다. 데이터 과학자는 학습 기능에서 결정된 값을 매개 변수로 참조하므로 학습 동작을 구성하는 데 사용되는 값에는 다른 용어가 필요하지만 학습 데이터에서 파생되지 않습니다. 따라서 이 용어는 hyperparameter입니다.
하이퍼 매개 변수 값을 선택하면 결과 모델에 큰 영향을 줄 수 있으므로 특정 데이터 및 예측 성능 목표에 가장 적합한 값을 선택하는 것이 중요합니다.
하이퍼 매개 변수 튜닝
하이퍼 매개 변수 튜닝 동일한 알고리즘과 학습 데이터를 사용하지만 다른 하이퍼 매개 변수 값을 사용하여 여러 모델을 학습하여 수행됩니다. 그런 다음 각 학습 실행의 결과 모델을 평가하여 최적화하려는 성능 메트릭(예: 정확도)을 결정하고 가장 성능이 뛰어난 모델을 선택합니다.
Azure Machine Learning에서 스크립트를 스윕 작업으로제출함으로써 하이퍼 매개 변수를 조정할 수 있습니다. 스윕 작업은 테스트할 각 하이퍼 매개 변수 조합에 대해 평가판을 실행합니다. 각 평가판은 매개 변수가 있는 하이퍼 매개 변수 값이 있는 학습 스크립트를 사용하여 모델을 학습시키고 학습된 모델에서 달성한 대상 성능 메트릭을 기록합니다.
학습 목표
이 모듈에서는 다음 방법을 알아봅니다.
- 하이퍼 매개 변수 검색 공간을 정의합니다.
- 하이퍼 매개 변수 샘플링을 구성합니다.
- 조기 종료 정책을 선택합니다.
- 스윕 작업을 실행합니다.