다음을 통해 공유


사용자 지정 텍스트 분류에 대한 사용 사례

중요합니다

영어가 아닌 번역은 편의를 위해서만 제공됩니다. 최종 버전은 이 문서의 EN-US 버전을 참조하세요.

투명성 고지란?

AI 시스템에는 기술뿐만 아니라 기술을 사용하는 사람, 영향을 받는 사람, 배포되는 환경이 포함됩니다. 의도한 목적에 맞는 시스템을 만들려면 기술의 작동 방식, 기능 및 제한 사항, 최상의 성능을 달성하는 방법에 대한 이해가 필요합니다. Microsoft의 투명성 고지는 Microsoft의 AI 기술의 작동 방식, 시스템 소유자가 시스템 성능과 동작에 영향을 줄 수 있는 선택 사항 그리고 기술, 사람, 환경을 포함한 전체 시스템에 대한 사고의 중요성을 이해하는 데 도움을 주기 위한 것입니다. 투명성 고지는 자체 시스템을 개발 또는 배포할 때 사용하거나 시스템을 사용하거나 시스템의 영향을 받을 사람들과 공유할 수 있습니다.

Microsoft의 투명성 메모는 Microsoft에서 AI 원칙을 실천하기 위한 광범위한 노력의 일환입니다. 자세한 내용은 Microsoft AI 원칙을 참조하세요.

사용자 지정 텍스트 분류 소개

사용자 지정 텍스트 분류 는 텍스트 분류 작업에 대한 사용자 지정 모델을 빌드할 수 있도록 기계 학습 인텔리전스를 적용하는 클라우드 기반 API 서비스입니다.

사용자 지정 텍스트 분류는 두 가지 유형의 프로젝트를 지원합니다.

  • 단일 레이블 분류: 데이터 세트의 각 파일에 대해 하나의 레이블만 할당합니다. 예를 들어 파일이 영화 스크립트인 경우 "액션", "스릴러" 또는 "로맨스"로만 분류할 수 있습니다.
  • 여러 레이블 분류: 데이터 세트의 각 파일에 대해 여러 레이블을 할당합니다. 예를 들어 파일이 영화 스크립트인 경우 "Action" 또는 "Action" 및 "Thriller"로 분류될 수 있습니다.

사용자 지정 텍스트 분류의 기본 사항

사용자 지정 텍스트 분류는 Foundry Tools의 Azure 언어 내에서 사용자 지정 기능의 일부로 제공됩니다. 이 기능을 사용하면 사용자가 사용자 지정 AI 모델을 빌드하여 사용자가 미리 정의한 사용자 지정 범주로 텍스트를 분류할 수 있습니다. 개발자는 사용자 지정 텍스트 분류 프로젝트를 만들어 반복적으로 데이터에 태그를 지정하고 모델 성능을 학습, 평가 및 개선할 수 있습니다. 태그가 지정된 데이터의 품질은 모델 성능에 큰 영향을 줍니다.

모델 빌드 및 사용자 지정을 간소화하기 위해 서비스는 Language Studio를 통해 액세스할 수 있는 사용자 지정 웹 포털을 제공합니다. 이 빠른 시작의 단계를 수행하여 서비스를 쉽게 시작할 수 있습니다.

사용자 지정 텍스트 분류 용어

다음 용어는 일반적으로 사용자 지정 텍스트 분류 내에서 사용됩니다.

기간 정의
프로젝트 프로젝트는 데이터를 기반으로 하는 사용자 지정 AI 모델을 빌드하기 위한 작업 영역입니다. 사용 중인 Azure 리소스에 대한 기여자 액세스 권한이 있는 사용자와 다른 사용자만 프로젝트에 액세스할 수 있습니다. 프로젝트 내에서 데이터에 태그를 지정하고, 모델을 빌드하고, 필요한 경우 모델을 평가 및 개선하고, 결국 사용할 수 있도록 모델을 배포할 수 있습니다. 동일한 데이터 세트에서 프로젝트 내에서 여러 모델을 빌드할 수 있습니다.
모델 모델은 특정 작업을 수행하도록 학습된 개체입니다. 이 시스템의 경우 모델은 텍스트를 분류합니다. 모델은 태그가 지정된 데이터를 학습하여 학습됩니다.
클래스 클래스는 텍스트의 전체 분류를 나타내는 사용자 정의 범주입니다. 개발자는 학습을 위해 모델에 전달하기 전에 할당된 클래스를 사용하여 데이터에 태그를 지정합니다.

사용자 지정 텍스트 분류에 대한 예제 사용 사례

사용자 지정 텍스트 분류는 다양한 산업의 여러 시나리오에서 사용할 수 있습니다. 몇 가지 예는 다음과 같습니다.

  • 자동 전자 메일 또는 티켓 심사: 모든 유형의 지원 센터는 구조화되지 않은 자유형 텍스트 및 첨부 파일이 포함된 대량의 전자 메일 또는 티켓을 받습니다. 내부 팀 내의 실무 전문가에게 시기 적절하게 검토, 승인 및 라우팅하는 것이 중요합니다. 이 규모에서 전자 메일 심사를 수행하려면 사람들이 적절한 부서를 검토하고 라우팅해야 하며, 여기에는 시간과 리소스가 필요합니다. 사용자 지정 텍스트 분류를 사용하여 들어오는 텍스트를 분석하고 추가 작업을 위해 관련 부서로 자동으로 라우팅되도록 콘텐츠를 심사하고 분류할 수 있습니다.

  • 의미 체계 검색을 향상시키고 보강하는 기술 마이닝: 검색은 사용자에게 텍스트 콘텐츠를 표시하는 모든 앱의 기본입니다. 일반적인 시나리오에는 카탈로그 또는 문서 검색, 소매 제품 검색 또는 데이터 과학에 대한 지식 마이닝이 포함됩니다. 다양한 산업 분야의 많은 기업들이 구조화된 문서와 구조화되지 않은 문서를 모두 포함하는 이질적인 개인 콘텐츠보다 풍부한 검색 환경을 구축하려고 합니다. 개발자는 파이프라인의 일부로 사용자 지정 텍스트 분류를 사용하여 해당 텍스트를 해당 산업과 관련된 클래스로 분류할 수 있습니다. 예측 클래스를 사용하여 보다 사용자 지정된 검색 환경을 위해 파일의 인덱싱을 보강할 수 있습니다.

사용 사례를 선택할 때 고려 사항

  • 심각한 부정적인 영향을 줄 수 있는 의사 결정에는 사용자 지정 텍스트 분류를 사용하지 마십시오. 개인에 심각한 영향을 미칠 가능성이 있는 결정에 대한 인간의 검토를 포함합니다. 예를 들어 인시던트에 대한 사용자의 설명에 따라 보험 청구를 수락하거나 거부할지 여부를 식별합니다.

  • 모호하고 대표적이지 않은 클래스를 만들지 않습니다. 스키마를 디자인할 때 서로 너무 유사한 클래스를 사용하지 않도록 하여 서로 구분하는 데 어려움이 있을 수 있습니다. 예를 들어 영화 스크립트를 분류하는 경우 로맨스, 코미디 및 rom-com 클래스를 만들지 마세요. 대신 로맨스 및 코미디 클래스와 함께 다중 레이블 분류 모델을 사용하는 것이 좋습니다. 그런 다음 rom-com 영화의 경우 두 클래스를 모두 할당합니다.

  • 법률 및 규제 고려 사항: 조직은 모든 산업 또는 시나리오에서 사용하기에 적합하지 않을 수 있는 Foundry 도구 및 솔루션을 사용할 때 잠재적인 특정 법률 및 규제 의무를 평가해야 합니다. 또한 Foundry 도구 또는 솔루션은 해당 서비스 약관 및 관련 행동 강령에서 금지된 방식으로 설계되지 않았으며 사용할 수 없습니다.

다음 단계