다음을 통해 공유


광학 문자 인식에 대한 투명도 메모 및 사용 사례

중요합니다

영어가 아닌 번역은 편의를 위해서만 제공됩니다. 최종 버전은 이 문서의 EN-US 버전을 참조하세요.

이 문서에서는 OCR(광학 문자 인식)의 사용 사례에 대한 정보를 제공합니다.

투명성 고지란?

AI 시스템에는 기술뿐만 아니라 기술을 사용하는 사람, 영향을 받는 사람, 배포되는 환경이 포함됩니다. 의도한 목적에 맞는 시스템을 만들려면 기술의 작동 방식, 기능 및 제한 사항, 최상의 성능을 달성하는 방법에 대한 이해가 필요합니다.

Microsoft는 AI 기술의 작동 방식을 이해하는 데 도움이 되는 투명성 정보를 제공합니다. 여기에는 시스템 성능 및 동작, 기술, 사람, 환경을 포함하는 전체 시스템에 대한 사고의 중요성에 영향을 줄 수 있는 시스템 소유자가 할 수 있는 선택이 포함됩니다. 자신의 시스템을 개발하거나 배포할 때 투명성 메모를 사용하거나, 시스템을 사용하거나 시스템의 영향을 받는 사람들과 공유할 수 있습니다.

투명성 메모는 Microsoft에서 AI 원칙을 실천하기 위한 광범위한 노력의 일환입니다. 자세한 내용은 Microsoft의 AI 원칙을 참조하세요.

OCR(광학 문자 인식) 소개

오늘날 기업은 이미지, 스캔한 종이 문서 및 디지털 파일의 텍스트를 실행 가능한 인사이트로 변환해야 하는 경우가 많습니다. 이러한 인사이트는 모든 사용자를 위한 지식 마이닝, 비즈니스 프로세스 자동화 및 콘텐츠의 접근성을 강화합니다. OCR(광학 문자 인식)은 이미지 및 문서와 같은 시각적 콘텐츠에서 텍스트를 추출하는 데 사용되는 AI 서비스입니다. OCR은 현재 인쇄 텍스트 추출을 위해 여러 언어를 지원합니다(OCR 지원 언어 참조). 필기 OCR은 현재 영어로만 지원됩니다.

OCR의 기본 사항

Microsoft의 OCR 기술은 Foundry Tools Read API의 Azure Vision을 통해 제공됩니다. 고객은 콘텐츠로 Read API를 호출하여 컴퓨터에서 읽을 수 있는 텍스트 출력에서 추출된 텍스트, 위치 및 기타 인사이트를 가져옵니다. 비즈니스 애플리케이션 내에서 출력을 처리하여 사용자에 대한 콘텐츠 인텔리전스, 비즈니스 프로세스 자동화 및 기타 시나리오를 구현합니다.

기간 정의
비동기 비동기 서비스는 추출된 텍스트를 즉시 반환하지 않습니다. 대신 프로세스가 백그라운드에서 시작됩니다. 고객 애플리케이션은 나중에 추출된 텍스트를 얻기 위해 다시 확인해야 합니다.
읽다 읽기 작업은 다른 호출을 통해 반환되는 분석 및 텍스트 추출을 시작하기 위해 이미지와 문서를 수락하는 비동기 호출입니다.
읽기 결과 가져오기 분석 및 추출 프로세스가 활성화되어 있는 동안 읽기 결과 가져오기 작업은 진행 상태를 출력합니다. 프로세스가 완료되면 결과 가져오기 작업은 추출된 텍스트(텍스트 줄 및 단어 형식) 및 신뢰도 값을 출력합니다.
신뢰도 값 읽기 결과 가져오기 작업은 추출된 모든 단어에 대해 0에서 1 사이의 범위에서 신뢰도 값을 반환합니다. 이 값은 100에서 단어를 올바르게 추출하는 횟수에 대한 서비스의 예상값을 나타냅니다. 예를 들어, 82%의 확률로 올바르게 추출된 것으로 예상되는 단어의 신뢰도 값은 0.82가 됩니다.

사용 사례 예

다음 사용 사례는 OCR 기술에 널리 사용되는 예제입니다.

  • 이미지 및 문서 검색 및 보관: 법적 계약, 기술 문서 및 뉴스 콘텐츠와 같은 구조화되지 않은 문서에는 자동화된 태그 지정, 분류 및 검색과 같은 프로세스에 사용할 수 없는 풍부한 정보와 메타데이터가 포함되어 있습니다. OCR을 사용하면 분석, 검색 및 검색을 위해 이러한 문서의 텍스트를 컴퓨터에서 읽을 수 있습니다.
  • 이미지 콘텐츠 조정 및 지역화: 전자 상거래 회사, 사용자 생성 콘텐츠 게시자 및 온라인 게임 및 소셜 미디어 커뮤니티는 온라인 안전 규정을 준수하기 위해 이미지를 조정해야 합니다. 경우에 따라 전 세계 사용자를 위한 콘텐츠를 지역화해야 합니다. OCR을 사용하면 이미지에서 텍스트를 추출하여 다운스트림 처리를 적용할 수 있습니다.
  • 비즈니스 프로세스 자동화: 비즈니스 프로세스 자동화를 사용하려면 문서 및 애플리케이션 화면에서 사용자가 입력한 데이터와 기본 설정을 복잡한 비즈니스 프로세스와 통합해야 합니다. OCR은 문서 및 이미지에 포함된 텍스트의 잠금을 해제하고 비즈니스 워크플로 단계에서 사용할 수 있도록 합니다.
  • 재무 및 의료 문서 처리: 재무 및 보험 응용 프로그램 양식의 백오피스 처리에 사용되는 경우 OCR을 사용하면 문서 처리에 시간과 노력을 절약할 수 있습니다. 마찬가지로, 의료 청구 상환 및 의료 정보 양식에 적용되는 OCR은 서비스 및 혜택에 대한 상환 및 자격을 가속화합니다.

다른 사용 사례를 선택할 때의 고려 사항

사용 사례를 선택할 때 다음 요소를 고려합니다.

  • 혜택의 수여 또는 거부에 사용할 때 신중하게 고려합니다. OCR 출력을 사용하여 혜택을 부여하거나 거부하면 잘못되거나 불완전한 정보를 기반으로 하는 경우 오류가 발생할 수 있습니다. 예를 들어 의료 양식을 작성할 때 사용자가 오류를 발생하거나 중요한 정보를 포함하지 못할 수 있습니다. 또한 OCR은 양식의 일부를 잘못 읽거나 감지하지 못할 수 있습니다. 소비자에게 공정하고 고품질의 의사 결정을 보장하려면 OCR 기반 자동화를 사용자 감독과 결합합니다.

  • 서명 식별에는 사용하지 마십시오. 필기 텍스트를 추출하는 경우 서명에 OCR 결과를 사용하여 개인을 식별하지 마십시오. 서명은 인간과 컴퓨터 모두 읽기 어렵습니다. OCR을 사용하는 더 좋은 방법은 추가 분석을 위해 서명의 존재를 감지하는 데 사용하는 것입니다.

  • 심각한 부정적인 영향을 미칠 수 있는 결정에 대 한 OCR을 사용 하지 마십시오: 이러한 사용 사례의 예는 의료 처방전을 처리 하 고 약물을 분배 포함. 처방전에서 텍스트를 추출하는 기계 학습 모델은 검색되지 않거나 잘못된 텍스트 출력을 초래할 수 있습니다. 잘못된 출력에 기반한 결정은 심각한 역효과를 초래할 수 있습니다. 또한, 개인에 심각한 영향을 미칠 가능성이 있는 결정의 인간의 검토를 포함 하는 것이 좋습니다.

  • 법률 및 규제 고려 사항: 조직은 모든 산업 또는 시나리오에서 사용하기에 적합하지 않을 수 있는 Foundry 도구 및 솔루션을 사용할 때 잠재적인 특정 법률 및 규제 의무를 평가해야 합니다. 또한 Foundry 도구 또는 솔루션은 해당 서비스 약관 및 관련 행동 강령에서 금지된 방식으로 설계되지 않았으며 사용할 수 없습니다.