다음을 통해 공유


영양소 - PDF OCR

영양 문서 변환기 OCR 작업을 사용하여 스캔한 문서 및 이미지를 검색 가능하고 편집 가능한 PDF로 변환합니다. 인덱싱, 자동화 및 콘텐츠 분석을 위해 고급 OCR(광학 인식) 기술을 사용하여 PDF에서 텍스트를 원활하게 추출합니다.

이 커넥터는 다음 제품 및 지역에서 사용할 수 있습니다.

서비스 클래스 Regions
Copilot Studio Premium 다음을 제외한 모든 Power Automate 지역 :
     - 미국 정부(GCC)
     - 미국 정부(GCC High)
     - 21Vianet에서 운영하는 중국 클라우드
     - 미국 국방부(DoD)
논리 앱 스탠다드 다음을 제외한 모든 Logic Apps 지역 :
     - Azure Government 지역
     - Azure 중국 지역
     - 미국 국방부(DoD)
Power Apps Premium 다음을 제외한 모든 Power Apps 지역 :
     - 미국 정부(GCC)
     - 미국 정부(GCC High)
     - 21Vianet에서 운영하는 중국 클라우드
     - 미국 국방부(DoD)
Power Automate (파워 오토메이트) Premium 다음을 제외한 모든 Power Automate 지역 :
     - 미국 정부(GCC)
     - 미국 정부(GCC High)
     - 21Vianet에서 운영하는 중국 클라우드
     - 미국 국방부(DoD)
연락처
이름 영양소(이전의 무힘비) 지원
URL https://support.nutrient.io/hc/en-us/requests/new
전자 메일 support+low-code@nutrient.io
커넥터 메타데이터
게시자 영양으로 무힘비 거래
웹 사이트 https://www.nutrient.io/low-code/
개인 정보 보호 정책 https://www.nutrient.io/legal/privacy/
카테고리 합작; 콘텐츠 및 파일

이미지 및 스캔한 문서에 대해 OCR 수행

Nutrient Document Converter를 사용하여 REST API 또는 자체 호스팅 서버 라이브러리를 통해 이미지 및 스캔된 파일에서 OCR(광학 인식)을 실행합니다.

OCR 기능

  • 이미지, 스캔 및 팩스를 검색 가능한 PDF로 변환합니다.
  • 텍스트 추출 및 PDF 검색 기능을 위한 자동화된 문서 워크플로를 빌드합니다.

통합 옵션

기본 설정 언어의 코드 샘플과 OCR 기능을 통합합니다.

필수 조건

영양 문서 변환기를 사용하려면 무료 또는 평가판 계정이 필요합니다. 이러한 계정 유형 간의 차이점을 이해하려면 비교 가이드 를 참조하세요.

시작하기

다음 단계에 따라 Nutrient Document Converter 커넥터 사용을 시작합니다.

알려진 문제 및 제한 사항

IRM, DRM, RMS 또는 AIP 솔루션으로 보호되는 문서는 보안 제한으로 인해 처리할 수 없습니다.

질문이나 지원을 받으려면 지원 팀에 문의하세요.

제한 한도

Name 호출 갱신 기간
연결당 API 호출 100 60초

동작

OCRed PDF로 변환

기존 PDF 문서 또는 이미지에서 OCR을 수행하여 검색 가능한 PDF 만들기

OCR을 사용하여 텍스트 추출

OCR을 사용하여 PDF 파일에서 텍스트 추출

OCRed PDF로 변환

기존 PDF 문서 또는 이미지에서 OCR을 수행하여 검색 가능한 PDF 만들기

매개 변수

Name 필수 형식 Description
원본 파일 이름
source_file_name True string

확장명을 포함한 원본 파일의 이름

원본 파일 콘텐츠
source_file_content True byte

OCR에 대한 파일의 내용

Language
language enum

Language

Performance
performance enum

Performance

블랙리스트/허용 목록
characters_option enum

문자 옵션

문자
characters string

블랙리스트 또는 허용 목록에 추가할 문자

페이지 매김 사용
paginate boolean

페이지 매김

Regions
regions string

영역을 하나 이상의 특정 영역으로 OCR로 제한

오류 발생
fail_on_error boolean

오류 발생

반환

모든 작업에 대한 응답 데이터

OCR을 사용하여 텍스트 추출

OCR을 사용하여 PDF 파일에서 텍스트 추출

매개 변수

Name 필수 형식 Description
원본 파일 이름
source_file_name True string

확장명을 포함한 원본 파일의 이름

원본 파일 콘텐츠
source_file_content True byte

OCR에 대한 파일의 내용

Language
language enum

Language

X 좌표
x string

X 좌표(Pts, 1/72인치)

Y 좌표
y string

Y 좌표(Pts, 1/72인치)

너비
width string

OCR 영역의 너비(Pts, 1/72인치)

높이
height string

OCR 영역의 높이(Pts, 1/72인치)

페이지 번호
page_number string

페이지 번호(OCR 모든 페이지에 비워 두기)

Performance
performance enum

성능()

블랙리스트/허용 목록
characters_option enum

문자 옵션

문자
characters string

블랙리스트 또는 허용 목록에 추가할 문자

페이지 매김 사용
paginate boolean

페이지 매김

오류 발생
fail_on_error boolean

오류 발생

반환

OCRText 작업에 대한 응답 데이터

정의

ocr_operation_response

OCRText 작업에 대한 응답 데이터

Name 경로 형식 Description
텍스트 나가기
out_text string

일반 텍스트로 추출된OCRed 텍스트입니다.

기본 파일 이름
base_file_name string

확장명을 사용하지 않는 입력 파일의 이름입니다.

결과 코드
result_code enum

작업 결과 코드입니다.

결과 세부 정보
result_details string

작업 결과 세부 정보입니다.

operation_response

모든 작업에 대한 응답 데이터

Name 경로 형식 Description
처리된 파일 콘텐츠
processed_file_content byte

Muhimbi 변환기에서 생성된 파일입니다.

기본 파일 이름
base_file_name string

확장명을 사용하지 않는 입력 파일의 이름입니다.

결과 코드
result_code enum

작업 결과 코드입니다.

결과 세부 정보
result_details string

작업 결과 세부 정보입니다.