미세 조정을 사용하면 미리 학습된 AI 모델을 조정하여 특정 데이터 및 사용 사례를 더 잘 사용할 수 있습니다. 이 기술은 모델을 처음부터 빌드하는 것보다 학습 데이터가 덜 필요하면서 모델 성능을 향상시킬 수 있습니다.
이 문서에서 다루는 내용:
- 미세 조정이란 무엇이며 작동 방식
- 미세 조정과 다른 방법을 사용하는 경우
- 미세 조정을 위해 모델을 선택하고 준비하는 방법
- 결과를 반복하고 개선하기 위한 모범 사례
필수 조건
시작하기 전에 갖추어야 할 것들:
- 기계 학습 개념에 대한 기본적인 이해
- 특정 사용 사례 및 데이터 요구 사항에 대한 숙지
- 학습 및 유효성 검사를 위한 샘플 데이터에 대한 액세스
미세 조정이란?
미세 조정은 미리 학습된 모델을 조정하여 특정 작업에서 더 나은 성능을 발휘하는 기계 학습 기술입니다. 모델을 처음부터 학습하는 대신 이미 일반적인 패턴을 이해하고 데이터 작업을 위해 조정하는 모델로 시작합니다.
이 방법은 한 작업에서 얻은 지식을 사용하여 관련 작업의 성능을 향상시키는 전이 학습을 활용합니다. 미세 조정은 학습 데이터가 제한되거나 기존 모델 기능을 기반으로 빌드하려는 경우에 특히 효과적입니다.
미세 조정 시기
미세 조정은 적은 양의 데이터가 있고 모델의 성능을 향상시키려 할 때 잘 작동합니다. 미리 학습된 모델로 시작하여 모델이 이미 학습한 지식을 사용하고 데이터에 더 잘 맞도록 조정할 수 있습니다. 이 방법을 사용하면 모델의 성능을 개선하고 학습에 필요한 데이터의 양을 줄일 수 있습니다.
많은 양의 데이터가 있는 경우 일반적으로 모델을 미세 조정할 필요가 없습니다. 모델을 처음부터 학습시키고 미세 조정 없이도 좋은 결과를 얻을 수 있습니다. 그러나 모델의 성능을 향상시키려면 미세 조정이 여전히 도움이 될 수 있습니다. 미리 학습된 모델이 원래 학습된 작업과 다른 특정 작업이 있는 경우 모델을 미세 조정할 수도 있습니다.
프롬프트 엔지니어링 또는 프롬프트 체인을 사용하여 비용이 많이 드는 미세 조정을 방지할 수 있습니다. 이러한 기술은 미세 조정 없이 고품질 텍스트를 생성하는 데 도움이 됩니다.
미리 학습된 모델 선택
작업 요구 사항에 맞는 미리 학습된 모델을 선택합니다. 미리 학습된 많은 모델을 사용할 수 있으며 각 모델은 서로 다른 작업에 대해 학습됩니다. 비슷한 작업에 대해 학습된 모델을 선택하세요. 이 선택은 모델이 이미 학습한 지식을 사용하고 데이터에 맞게 조정하는 데 도움이 됩니다.
HuggingFace 모델은 미리 학습된 모델을 검색할 때 시작하는 데 적합합니다. HuggingFace 모델은 학습된 작업에 따라 범주로 그룹화되므로 작업에 맞는 모델을 쉽게 찾을 수 있습니다.
이러한 범주는 다음과 같습니다.
- 멀티모달
- 컴퓨터 비전
- 자연어 처리
- 오디오
- 표 형식의
- 보충 학습
모델이 사용자 환경 및 도구와 함께 작동하는지 확인합니다. 예를 들어, Visual Studio Code(VS Code)를 사용하는 경우 Azure Machine Learning 확장을 VS Code에 사용하여 모델을 미세 조정할 수 있습니다.
모델의 상태 및 라이선스를 확인합니다. 일부 미리 학습된 모델은 오픈 소스 라이선스에서 사용할 수 있지만 다른 모델은 상업용 또는 개인 라이선스가 필요합니다. 모든 HuggingFace 모델에는 라이선스 정보가 포함되어 있습니다. 모델을 미세 조정하기 전에 모델을 사용하는 데 필요한 권한이 있는지 확인합니다.
샘플 데이터 준비
샘플 데이터를 준비하려면 학습에 적합하도록 데이터를 정리하고 전처리해야 합니다. 또한 모델의 성능을 평가하려면 데이터를 학습 및 유효성 검사 집합으로 분할해야 합니다. 데이터 형식은 미리 학습된 모델에서 사용하는 형식과 일치해야 합니다. 모델 카드의 HuggingFace 섹션에서 모델과 함께 이 정보를 찾을 수 있습니다. 대부분의 모델 카드에는 모델에 대한 프롬프트를 작성하기 위한 템플릿과 시작하는 데 도움이 되는 의사 코드가 포함되어 있습니다.
모델을 반복적으로 개선하라
모델을 미세 조정한 후 유효성 검사 집합에서 해당 성능을 평가합니다. 정확도, 정밀도, 재현율 및 F1 점수와 같은 메트릭을 사용하여 모델의 성능을 평가합니다. 모델의 성능이 만족스럽지 않은 경우 하이퍼 매개 변수를 조정하거나 아키텍처를 변경하거나 더 많은 데이터에 대해 모델을 미세 조정합니다. 데이터의 품질 및 다양성을 검사하여 해결해야 하는 문제가 있는지 확인할 수도 있습니다. 일반적으로 더 작은 고품질 데이터 집합은 더 큰 저품질 데이터 집합보다 더 가치가 있습니다.
또한 참조
AI 모델 미세 조정에 대해 자세히 알아보려면 다음 리소스를 확인하세요.
- Microsoft Foundry 포털에서 2개 모델 미세 조정 Llama
- 미리 학습된 모델을 HuggingFace에서 미세 조정
- 미리 학습된 모델을
사용하여 미세 조정하는
AI 기능을 활용할 때 참조하십시오: Windows에서 책임 있는 생성 AI 애플리케이션 및 기능 개발.