다음을 통해 공유


아쿠아포레스트 PDF

Aquaforest PDF 커넥터에는 Office 365 및 Power Automate에 대한 분할, 텍스트 추출, 바코드 추출 및 OCR 작업과 같은 다양한 PDF 작업을 수행하는 작업 그룹이 포함되어 있습니다.

이 커넥터는 다음 제품 및 지역에서 사용할 수 있습니다.

서비스 클래스 Regions
Copilot Studio Premium 다음을 제외한 모든 Power Automate 지역 :
     - 미국 정부(GCC)
     - 미국 정부(GCC High)
     - 21Vianet에서 운영하는 중국 클라우드
     - 미국 국방부(DoD)
논리 앱 스탠다드 다음을 제외한 모든 Logic Apps 지역 :
     - Azure Government 지역
     - Azure 중국 지역
     - 미국 국방부(DoD)
Power Apps Premium 다음을 제외한 모든 Power Apps 지역 :
     - 미국 정부(GCC)
     - 미국 정부(GCC High)
     - 21Vianet에서 운영하는 중국 클라우드
     - 미국 국방부(DoD)
Power Automate Premium 다음을 제외한 모든 Power Automate 지역 :
     - 미국 정부(GCC)
     - 미국 정부(GCC High)
     - 21Vianet에서 운영하는 중국 클라우드
     - 미국 국방부(DoD)
연락처
이름 아쿠아포레스트 지원
URL https://www.aquaforest.com/en/aquaforest-flow-doc.asp
전자 메일 support@aquaforest.com
커넥터 메타데이터
게시자 아쿠아포레스트 제한
웹 사이트 https://www.aquaforest.com/en/aquaforest-connector.asp
개인 정보 보호 정책 https://www.aquaforest.com/en/privacy policy.pdf
카테고리 콘텐츠 및 파일; 데이터

Aquaforest PDF 커넥터에는 Office 365 및 Flow에 대한 분할, 텍스트 추출, 바코드 추출 및 OCR 작업과 같은 다양한 PDF 작업을 수행하는 작업 그룹이 포함되어 있습니다.

필수 조건

우선 Aquaforest PDF API 계정을 만들어야 합니다. 이 계정은 Aquaforest PDF 작업 및 Aquaforest PDF API를 관리하는 데 사용됩니다. 구독이 이 주소에 연결되므로 활성 전자 메일 주소를 사용합니다. 계정이 이미 있는 경우 여기에 로그인하기만 하면 됩니다.

자격 증명을 가져오는 방법

  1. 개발자 포털에 로그인하고 제품 페이지로 이동하여 구독하려는 제품을 선택합니다.

  2. 구독 단추를 클릭합니다.

  3. 확인 단추를 클릭하여 구독 요청 확인

  4. 프로필 페이지에서 API 키에 액세스할 수 있습니다.

연결을 만드는 중

커넥터는 다음 인증 유형을 지원합니다.

기본값 연결을 만들기 위한 매개 변수입니다. 모든 지역 공유할 수 없음

기본값

적용 가능: 모든 지역

연결을 만들기 위한 매개 변수입니다.

공유 가능한 연결이 아닙니다. 전원 앱이 다른 사용자와 공유되면 다른 사용자에게 새 연결을 명시적으로 만들라는 메시지가 표시됩니다.

이름 유형 Description 필수
API 키 시큐어스트링 (보안 문자열) 이 API의 API 키 진실

제한 한도

Name 호출 갱신 기간
연결당 API 호출 100 60초

동작

OCR PDF 또는 이미지

이미지 PDF 또는 스캔한 이미지에서 검색 가능한 PDF를 생성합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

PDF 속성 가져오기

PDF 파일에 대한 정보를 가져옵니다.

PDF에서 데이터 가져오기

이 작업은 키/값 쌍의 형태로 PDF 파일에서 중요한 데이터를 추출합니다.

PDF에서 텍스트 가져오기

텍스트 위치 및 정규식을 기반으로 PDF 파일에서 텍스트를 가져옵니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

바코드 값 가져오기

PDF에서 바코드를 가져옵니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

바코드로 PDF 분할

사용자가 정의한 바코드 일치 항목에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. 또한 아쿠아포레스트 영역 추출 도구는 [https://www.aquaforest.com/en/zone/get-pdf-zone.html]에서 사용할 수 있습니다.

바코드로 PDF 페이지 추출

사용자가 정의한 바코드 일치 항목을 기반으로 PDF 파일을 추출합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

텍스트 일치로 PDF 분할

사용자가 정의한 텍스트 일치 항목에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. 또한 아쿠아포레스트 영역 추출 도구는 [https://www.aquaforest.com/en/zone/get-pdf-zone.html]에서 사용할 수 있습니다.

텍스트로 PDF 페이지 추출

사용자가 정의한 텍스트 일치 항목에 따라 PDF 파일을 추출합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

페이지별로 PDF 분할

사용자가 정의한 분할 옵션에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

OCR PDF 또는 이미지

이미지 PDF 또는 스캔한 이미지에서 검색 가능한 PDF를 생성합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

매개 변수

Name 필수 형식 Description
AquaforestImageTimeout
aquaforestImageTimeout integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

작성자
author string

출력 PDF 문서 속성에서 사용자 지정 작성자를 설정합니다.

자동 회전
autorotate boolean

이미지를 자동으로 회전합니다. 이렇게 하면 모든 텍스트가 정상적으로 지향됩니다.

이진
binarize integer

이 값은 일반적으로 기술 지원의 지침에 따라 사용해야 합니다. 색 이미지가 처리되는 방식을 제어하고 특정 임계값으로 이진화를 강제 적용할 수 있습니다. 일반적으로 테스트에 좋은 결과를 제공하기 위해 값 200이 표시되었지만 이는 "일반적인" 고객 문서로 확인되어야 합니다. 이를 -1 설정하면 텍스트를 배경 이미지나 색과 구분하는 대체 메서드가 사용됩니다. 이렇게 하면 신문 및 잡지 페이지와 같은 특정 문서에 대해 향상된 OCR 결과를 제공할 수 있습니다.

검정 픽셀 제한
blackPixelLimit float

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

빈 페이지 임계값
blankPageThreshold integer

빈 페이지로 간주되지 않도록 이미지에 있어야 하는 "On Pixels"의 최소 수를 설정하려면 이 값을 사용합니다. -1 값은 빈 페이지 검색을 해제합니다.

상자 크기
boxSize integer

이 옵션은 텍스트 주위의 상자가 그래픽으로 식별될 수 있는 양식에 적합합니다. 이 옵션은 OCR 엔진에서 사용하는 이미지의 임시 복사본에서 상자를 제거합니다. 최종 이미지에서 상자를 제거하지 않습니다. 기술적으로 이 옵션은 최소 영역(픽셀 단위 및 이 속성에 의해 정의됨)으로 연결된 요소를 제거합니다. 이 옵션은 현재 이중 색조 이미지에만 적용됩니다.

ConvertToTiff
convertToTiff boolean

PDF 문서의 각 페이지는 TIFF 이미지로 래스터화됩니다.

CreateProcess
createProcess boolean

pinvoke를 통해 프로세스를 시작하려면 이 값을 true로 설정합니다.

만든 날짜
creationDate string

출력 PDF 문서 속성에서 사용자 지정 만들기 날짜를 설정합니다. 날짜 문자열은 'yyyy-MM-dd HH:mm:ss' 형식이어야 합니다.

Deskew
deskew boolean

Deskew(곧게) 이미지를 만듭니다.

Despeckle
despeckle integer

이렇게 하면 이미지 내의 연결이 끊긴 모든 요소가 지정된 그림보다 작은 픽셀 단위로 높이 또는 너비가 제거됩니다. 최대값은 9이고 기본값은 0입니다.

DictionaryLookup
dictionaryLookup integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

Dotmatrix
dotmatrix boolean

점 행렬 글꼴의 인식을 향상 하려면이 true로 설정 합니다. 기본값은 거짓입니다. 점 행렬이 아닌 글꼴에 대해 true로 설정하면 인식이 저하될 수 있습니다.

디버그 출력 사용
enableDebugOutput boolean

디버그 출력을 사용하도록 설정합니다.

PDF 압축(MRC)
enableMrc boolean

이를 통해 혼합 래스터 압축을 사용하면 색 스캔으로 구성된 PDF의 출력 크기를 크게 줄일 수 있습니다. 이 옵션은 원본이 PDF가 아니거나 ConvertToTiff를 사용하는 경우에만 적합합니다.

PDF/A 출력
enablePDFAOutput boolean

PDF/A로 출력할지 여부입니다.

오류 모드
errorMode integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

원본 파일 콘텐츠
fileContent True byte

OCR에 대한 파일의 내용

확장명을 가진 원본 파일 이름
fileNameWithExtension True string

확장명 또는 확장명만 있는 원본 파일 이름(선행 기간 '.')

대칭 이동 감지
flipDetect integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

회색조 품질
grayscaleQuality integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

경험적 학습
heuristics integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

Jbig2EncFlags
jbig2EncFlags string

이러한 플래그는 PDF 생성에 사용되는 JBIG2 버전의 이미지를 생성하는 데 사용되는 애플리케이션에 전달됩니다(이 압축을 사용하도록 설정되었다고 가정). 이 옵션은 일반적으로 기술 지원의 지침에 따라 사용해야 합니다.

Language
language enum

아래 옵션 중 하나를 선택하면 OCR 처리에 사용할 언어가 설정됩니다. 기본 언어는 한국어(Korean)입니다.

LibTiffSavePageAsBmp
libTiffSavePageAsBmp boolean

경우에 따라 1bpp이고 LZW 압축이 있는 이미지가 있는 경우 사전 처리로 인해 이미지의 색상이 반전될 수 있습니다(검은색에서 흰색, 흰색에서 검은색으로). 이를 방지하려면 true로 설정합니다.

최대 책상
maxDeskew float

페이지를 책상에 배치할 최대 각도입니다. 이 옵션은 일반적으로 기술 지원(support@aquaforest.com)의 지침에 따라만 사용해야 합니다.

최소 데스크슈 신뢰도
minDeskewConfidence float

이 옵션은 일반적으로 기술 지원(support@aquaforest.com)의 지침에 따라만 사용해야 합니다.

수정된 날짜
modifiedDate string

출력 PDF 문서 속성에서 사용자 지정 수정 날짜를 설정합니다. 날짜 문자열은 'yyyy-MM-dd HH:mm:ss' 형식이어야 합니다.

모핑 (Morph)
morph string

OCR 전에 이진화된 이미지에 적용할 형태학적 옵션입니다. 빈 값으로 설정하면 아무 것도 적용되지 않습니다. 일반적인 옵션에는 아래에 나열된 옵션이 포함되어 있지만 더 많은 옵션은 문의 support@aquaforest.com하세요.

MrcBackgroundFactor
mrcBackgroundFactor integer

이미지의 배경 부분에 대한 샘플링 크기입니다. 숫자가 높을수록 평균에 사용되는 이미지 블록의 크기가 클수록 크기가 감소하고 품질도 저하됩니다. 기본값은 3입니다.

MrcForegroundFactor
mrcForegroundFactor integer

이미지의 전경 부분에 대한 샘플링 크기입니다. 숫자가 높을수록 평균에 사용되는 이미지 블록의 크기가 클수록 크기가 감소하고 품질도 저하됩니다. 기본값은 3입니다.

MrcQuality
mrcQuality integer

배경 및 전경 이미지를 저장하는 데 사용할 JPEG 품질 설정(백분율 값 1 - 100)입니다. 기본값은 75입니다.

MrcTimeout
mrcTimeout integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

NoPictures
noPictures boolean

기본적으로 문서의 영역이 그래픽 영역으로 식별되면 해당 영역에서 OCR 처리가 실행되지 않습니다. 그러나 특정 문서에는 "그래픽" 또는 "그림" 영역으로 식별되지만 실제로 유용한 텍스트가 포함된 영역이나 상자가 포함될 수 있습니다. NoPictures를 True로 설정하면 그림으로 식별된 영역이 무시되고 False로 설정하면 그림으로 식별된 영역의 OCR이 강제로 적용됩니다.

OcrProcessSetupTimeout
ocrProcessSetupTimeout integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

OcrTimeout
ocrTimeout integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

암호
password string

원본 PDF 파일을 여는 암호입니다.

PdfToImageBpp
pdfToImageBpp enum

엔진 1을 사용할 때 래스터화된 PDF 페이지에 사용할 픽셀당 비트입니다. ConvertToTiff를 사용하여 처리되는 문서에만 적용됩니다. 이 속성의 기본값은 PDF 페이지에서 가져옵니다.

PdfToImageCompression
pdfToImageCompression enum

원본 PDF 파일의 각 페이지에서 추출되거나 래스터화된 이미지로 설정할 압축입니다. 그런 다음 이러한 이미지를OCRed하여 검색 가능한 PDF를 만듭니다. 이 속성의 기본값은 원본 PDF 파일의 각 페이지에서 가져옵니다.

PdfToImageDpi
pdfToImageDpi enum

원본 PDF 파일의 각 페이지에서 래스터화된 이미지로 설정할 DPI입니다. 그런 다음 이러한 이미지를OCRed하여 검색 가능한 PDF를 만듭니다. 이 속성의 기본값은 원본 PDF 파일의 각 페이지에서 가져옵니다.

PdfToImageForceVectorCheck
pdfToImageForceVectorCheck boolean

이 설정은 벡터 개체가 포함된 문서(예: CAD 드로잉)를 처리할 때 유용합니다. 기본적으로 벡터 개체만 포함된 페이지는 래스터화됩니다. 이미지가 없지만 벡터 개체와 전자 텍스트를 포함하는 페이지는 래스터화에서 건너뜁습니다. 그러나 경우에 따라 벡터 개체(CAD 드로잉)를 포함하는 페이지가 있을 수 있지만 제목은 전자 텍스트에 있을 수 있습니다. 이와 같이 페이지를 강제로 래스터화하려면 이 속성을 true로 설정합니다.

PdfToImageIncludeText
pdfToImageIncludeText boolean

False로 설정하면 실제 텍스트(즉, 스캔된 이미지의 일부인 텍스트가 아닌 전자적으로 생성됨)의 변환이 PDF에서 추출된 페이지 이미지에 렌더링되지 않습니다. 텍스트가 이미 검색 가능하므로 일반적으로 OCR이 필요하지 않기 때문입니다. 그러나 이 실제 텍스트에 OCR이 필요한 경우 값을 True로 설정할 수 있습니다.

PdfToImageMaxRes
pdfToImageMaxRes integer

래스터화된 이미지의 최대 해상도입니다. PDF 페이지에서 검색된 해상도가 이 값보다 크면 이 값으로 설정됩니다. 이 속성의 기본값은 600입니다.

PdfToImageMinRes
pdfToImageMinRes integer

래스터화된 이미지의 최소 해상도입니다. PDF 페이지에서 검색된 해상도가 이 값보다 낮으면 이 값으로 설정됩니다. 이 속성의 기본값은 200입니다.

PDF/A 버전
pdfaVersion enum

PDF/A 버전입니다.

PipeClientConnectionTimeout
pipeClientConnectionTimeout integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

RemoveBlankPage
removeBlankPage boolean

BlankPageThreshold가 -1보다 크고 ConvertToTiff가 true인 경우 빈 페이지를 제거합니다.

RemoveLines
removeLines boolean

이미지에서 선 제거 fpr 더 나은 인식.

RestartEngineEvery
restartEngineEvery integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

책갈피 유지
retainBookmarks boolean

ConvertToTiff를 사용할 때 출력의 원본 파일에서 책갈피를 유지합니다.

생성 날짜 유지
retainCreationDate boolean

출력 PDF 문서 속성에서 원본 파일의 생성 날짜를 유지합니다.

메타데이터 보존
retainMetadata boolean

ConvertToTiff를 사용할 때 출력의 원본 파일에서 메타데이터를 유지합니다.

수정된 날짜 유지
retainModifiedDate boolean

원본 파일의 수정된 날짜를 출력 PDF 문서 속성에 유지합니다.

뷰어 기본 설정 유지
retainViewerPreferences boolean

ConvertToTiff를 사용할 때 출력의 원본 파일에서 PDF 뷰어 기본 설정, 페이지 모드 및 페이지 레이아웃을 유지합니다.

SavePredespeckle
savePredespeckle boolean

출력 PDF에서 원본 이미지(예: 사전 처리를 적용하기 전)를 사용합니다.

Tables
tables boolean

true로 설정하면 표 셀 내에서 OCR을 시도합니다.

TextLayerFilterHeight
textLayerFilterHeight integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

TextLayerFilterHeightInverted
textLayerFilterHeightInverted integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

TextLayerFilterPercentage
textLayerFilterPercentage float

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

TextLayerFilterPercentageInverted
textLayerFilterPercentageInverted float

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

TextLayerFilterRatio
textLayerFilterRatio float

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

TextLayerFilterRatioInverted
textLayerFilterRatioInverted float

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

TextLayerFilterWidth
textLayerFilterWidth integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

TextLayerFilterWidthInverted
textLayerFilterWidthInverted integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

TextLayerMaxBoxes
textLayerMaxBoxes integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

정리 모드
tidyUpMode integer

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

PDF/A 유효성 검사
validatePDFA boolean

변환 후 PDF/A 문서의 유효성을 검사할지 여부

Word 일치 임계값
wordMatchThreshold float

이 속성 사용에 대한 지침은 기술 지원(support@aquaforest.com)에 문의하세요.

반환

OCR 작업에 대한 응답 데이터

PDF 속성 가져오기

PDF 파일에 대한 정보를 가져옵니다.

매개 변수

Name 필수 형식 Description
File Content(파일 내용)
fileContent True byte

원본 파일의 내용

페이지 제한
pageLimit integer

처리할 최대 페이지 수이며, 페이지에 숨겨진 텍스트가 포함되어 있는지 확인하거나 PDF를 검색할 수 있는지 확인하는 데만 사용됩니다.

반환

PDF에서 데이터 가져오기

이 작업은 키/값 쌍의 형태로 PDF 파일에서 중요한 데이터를 추출합니다.

매개 변수

Name 필수 형식 Description
이름
settingName True string

여기에 설정의 이름을 입력합니다.

가치
settingValue True string

여기에 설정 값을 입력합니다.

신뢰도 점수
confidenceScore number

신뢰도가 낮은 값을 필터링하려면 더 높은 신뢰도 점수를 설정합니다. 0에서 1 사이의 값을 설정할 수 있습니다. 0.5부터 시작하는 것이 좋습니다.

날짜 변환
dateAsISO string

날짜 값을 반환할 형식 선택

필요한 키
expectedKeys string

JSON을 구문 분석하지 않고 이후 작업에서 값을 사용할 수 있도록 줄당 하나의 키 이름을 제공합니다.

File Content(파일 내용)
fileContent True byte

원본 파일의 내용

페이지 제한
pageLimit integer

처리할 최대 페이지 수

페이지 범위
pageRange string

처리하려는 페이지 번호의 문자열 표현입니다. 예: 1,3-4

통화 기호 제거
stripCurrencySymbol boolean

통화 값을 반환하기 전에 기호와 문자열을 제거하려면 이 값을 true로 설정합니다.

일치 동의어
synonym boolean

동의어인 모든 키를 예상 키로 반환하려면 이 값을 true로 설정합니다.

동의어 사전
synonymDictionary string

각 개체에 배열의 동의어 목록이 포함된 "entry" 개체의 JSON 배열을 제공할 수 있습니다. 예를 들어 "청구서 번호" 및 "청구서 번호"(대/소문자를 구분하지 않음)를 동일한 키로 해석하려면 [{'entry': [ 'Invoice No', 'invoice number' ]}] JSON을 사용합니다.

기호 자르기
trimSymbols boolean

필요한 키와 일치하기 전에 찾은 키에서 선행 기호와 후행 기호를 모두 제거하려면 이 값을 true로 설정합니다.

반환

이 작업의 출력은 동적입니다.

PDF에서 텍스트 가져오기

텍스트 위치 및 정규식을 기반으로 PDF 파일에서 텍스트를 가져옵니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

매개 변수

Name 필수 형식 Description
File Content(파일 내용)
fileContent True byte

원본 파일의 내용

텍스트 일치 서식 파일 없음
noTextTemplate True string

일치하는 항목을 찾을 수 없는 경우 반환할 텍스트에 대한 템플릿

페이지 구분 기호
pageSeparator string

페이지 나누기가 있는 위치를 알 수 있도록 페이지 구분 기호를 제공합니다.

페이지
pagerange string

텍스트를 추출할 페이지 범위를 제공합니다. 단일 페이지 번호(1), 쉼표로 구분된 여러 페이지 번호(1,2,3), 페이지 범위(1-4) 또는 모두의 혼합(1,2,4-7)일 수 있습니다.

파일 이름
sourceFileName True string

원본 파일의 이름입니다.

텍스트 결과 템플릿
textResultTemplate True string

일치하는 항목이 발견되면 반환할 텍스트에 대한 템플릿

가치
expression array of string

위의 속성과 함께 사용할 값을 하나 이상 입력합니다. 위에 명시된 규칙과 일치하는 첫 번째 텍스트 값을 반환합니다.

위치
location True string

페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

페이지(사용되지 않음)
pagenumber integer

이 속성은 사용되지 않습니다. Pages 속성을 사용하는 것이 좋습니다. Pages 속성은 모든 영역에 적용되며 처리할 페이지를 선택할 수 있습니다.

선택
position string

이를 사용하여 더 많은 추출 텍스트를 구체화하고 요구 사항과 일치하는 옵션을 선택합니다.

패턴
regex string

여기에 정규식이 제공되면 추출된 텍스트를 일치시키고 일치 항목을 반환합니다.

반환

바코드 값 가져오기

PDF에서 바코드를 가져옵니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

매개 변수

Name 필수 형식 Description
바코드 결과 템플릿
barcodeResultTemplate True string

바코드를 찾은 경우 출력 텍스트 결과에 대한 템플릿

File Content(파일 내용)
fileContent True byte

원본 파일의 내용

바코드 템플릿 없음
noBarcodeTemplate True string

바코드를 찾을 수 없는 경우 출력 텍스트 결과에 대한 템플릿

페이지 구분 기호
pageSeparator string

페이지 나누기가 있는 위치를 알 수 있도록 페이지 구분 기호를 제공합니다.

페이지
pagerange string

텍스트를 추출할 페이지 범위를 제공합니다. 단일 페이지 번호(1), 쉼표로 구분된 여러 페이지 번호(1,2,3), 페이지 범위(1-4) 또는 모두의 혼합(1,2,4-7)일 수 있습니다.

파일 이름
sourceFileName True string

원본 파일의 이름입니다.

유형
barcodeFormats array of string

식별할 바코드 유형 지정

위치
location True string

페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

페이지(사용되지 않음)
pagenumber integer

이 속성은 사용되지 않습니다. Pages 속성을 사용하는 것이 좋습니다. Pages 속성은 모든 영역에 적용되며 처리할 페이지를 선택할 수 있습니다.

패턴
regex string

여기에 정규식이 제공되면 추출된 텍스트를 일치시키고 일치 항목을 반환합니다.

반환

바코드로 PDF 분할

사용자가 정의한 바코드 일치 항목에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. 또한 아쿠아포레스트 영역 추출 도구는 [https://www.aquaforest.com/en/zone/get-pdf-zone.html]에서 사용할 수 있습니다.

매개 변수

Name 필수 형식 Description
File Content(파일 내용)
fileContent True byte

원본 파일의 내용

파일 이름 템플릿
fileNameTemplate True string

바코드가 있는 경우 출력 파일에 대한 템플릿

일치하는 항목이 없는 페이지
noMatch string

위에서 선택한 분할 옵션에 따라 일부 페이지에는 바코드 값이 없습니다. 이러한 페이지를 수행할 작업을 선택합니다.

바코드 일치 템플릿 없음
noTextFileName True string

바코드를 찾을 수 없는 경우 출력 파일에 대한 템플릿

파일 이름
sourceFileName True string

원본 파일의 이름입니다.

출력 파일 옵션
splitOption string

이를 사용하여 더 많은 추출 텍스트를 구체화하고 요구 사항과 일치하는 옵션을 선택합니다.

유형
barcodeFormats array of string

식별할 바코드 유형 지정

위치
location True string

페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

패턴
regex string

여기에 정규식이 제공되면 추출된 바코드를 일치시키고 일치 항목을 반환합니다.

반환

바코드로 PDF 페이지 추출

사용자가 정의한 바코드 일치 항목을 기반으로 PDF 파일을 추출합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

매개 변수

Name 필수 형식 Description
File Content(파일 내용)
fileContent True byte

원본 파일의 내용

파일 이름 템플릿
fileNameTemplate True string

바코드가 있는 경우 출력 파일에 대한 템플릿

파일 템플릿 없음
noTextFileName True string

바코드를 찾을 수 없는 경우 출력 파일에 대한 템플릿

파일 이름
sourceFileName True string

원본 파일의 이름입니다.

유형
barcodeFormats array of string

식별할 바코드 유형 지정

위치
location True string

페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

패턴
regex string

여기에 정규식이 제공되면 추출된 바코드를 일치시키고 일치 항목을 반환합니다.

반환

텍스트 일치로 PDF 분할

사용자가 정의한 텍스트 일치 항목에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요. 또한 아쿠아포레스트 영역 추출 도구는 [https://www.aquaforest.com/en/zone/get-pdf-zone.html]에서 사용할 수 있습니다.

매개 변수

Name 필수 형식 Description
File Content(파일 내용)
fileContent True byte

원본 파일의 내용

파일 이름 템플릿
fileNameTemplate True string

텍스트가 일치하는 경우 출력 파일에 대한 템플릿

일치하는 항목이 없는 페이지
noMatch string

위에서 선택한 분할 옵션에 따라 일부 페이지에는 추출된 텍스트 값이 없습니다. 이러한 페이지를 수행할 작업을 선택합니다.

파일 템플릿 없음
noTextFileName True string

텍스트 일치 항목이 없는 경우 출력 파일에 대한 템플릿

파일 이름
sourceFileName True string

원본 파일의 이름입니다.

출력 파일 옵션
splitOption string

분할 작업에서 출력 파일의 바코드가 있는 페이지의 위치를 선택합니다.

가치
expression array of string

위의 속성과 함께 사용할 값을 하나 이상 입력합니다. 위에 명시된 규칙과 일치하는 첫 번째 텍스트 값을 반환합니다.

위치
location True string

페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

선택
position string

이를 사용하여 더 많은 추출 텍스트를 구체화하고 요구 사항과 일치하는 옵션을 선택합니다.

패턴
regex string

여기에 정규식이 제공되면 추출된 텍스트를 일치시키고 일치 항목을 반환합니다.

반환

텍스트로 PDF 페이지 추출

사용자가 정의한 텍스트 일치 항목에 따라 PDF 파일을 추출합니다. 자세한 내용은 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

매개 변수

Name 필수 형식 Description
File Content(파일 내용)
fileContent True byte

원본 파일의 내용

파일 이름 템플릿
fileNameTemplate True string

텍스트가 일치하는 경우 출력 파일에 대한 템플릿

파일 템플릿 없음
noTextFileName True string

텍스트 일치 항목이 없는 경우 출력 파일에 대한 템플릿

파일 이름
sourceFileName True string

원본 파일의 이름입니다.

가치
expression array of string

위의 속성과 함께 사용할 값을 하나 이상 입력합니다. 위에 명시된 규칙과 일치하는 첫 번째 텍스트 값을 반환합니다.

위치
location True string

페이지의 영역 - 영역 도구를 사용하여 좌표를 가져옵니다. [https://www.aquaforest.com/en/zone/get-pdf-zone.html]

선택
position string

이를 사용하여 더 많은 추출 텍스트를 구체화하고 요구 사항과 일치하는 옵션을 선택합니다.

패턴
regex string

여기에 정규식이 제공되면 추출된 텍스트를 일치시키고 일치 항목을 반환합니다.

반환

페이지별로 PDF 분할

사용자가 정의한 분할 옵션에 따라 PDF 파일을 분할합니다. 설명서를 보려면 [https://www.aquaforest.com/en/aquaforest-flow-doc.asp]를 방문하세요.

매개 변수

Name 필수 형식 Description
File Content(파일 내용)
fileContent True byte

원본 파일의 내용입니다.

출력 파일 이름
fileNameTemplate True string

%UNIQUEn(1부터 시작하여 n자리로 채워진 고유 번호) 및 %FILENAME(확장명 없는 원래 파일 이름)을 포함할 수 있는 대상 파일 템플릿입니다.

파일 이름
sourceFileName True string

원본 파일의 이름입니다.

분할 형식
splitOption True string

각 파일에 사용할 분할 작업을 선택합니다.

페이지 범위
pageRange string

원본에서 추출할 페이지를 정의하는 쉼표로 구분된 페이지 범위 집합입니다.

모든 반복
repeatEvery integer

문서 내의 각 페이지 범위 페이지에 페이지 범위를 적용합니다. 예를 들어 페이지 범위에 대해 2-4를 지정하고 4를 반복 범위로 지정하면 4페이지마다 범위가 다시 적용됩니다.

책갈피 유지
retainBookmarks boolean

생성된 파일에는 원래 파일의 책갈피가 포함됩니다.

메타데이터 보존
retainMetadata boolean

생성된 파일에는 원본 파일의 메타데이터(예: 작성자 및 제목)가 포함됩니다.

반환

정의

ApiExtractPost200ApplicationJsonResponse

Name 경로 형식 Description
오류
ErrorMessage string

Is Successful 값이 false이면 오류 메시지가 반환됩니다.

성공
IsSuccessful boolean

하나 이상의 페이지가 추출된 경우 true가 반환됩니다.

라이선스 정보
LicenceInfo string

API 구독 키에 대한 정보

출력 파일 추출
SplittedFile array of object

추출된 파일의 배열

(파일 콘텐츠)
SplittedFile.SplitFileContent byte

파일 콘텐츠를 나타내는 base 64 문자열

(파일 이름)
SplittedFile.SplitFileName string

생성된 파일 이름을 포함하는 문자열

(페이지 번호)
SplittedFile.pageNumber string

추출이 발생한 페이지 번호를 포함하는 페이지 범위입니다.

ApiGetTextValueJsonResponse

Name 경로 형식 Description
오류 메시지
ErrorMessage string

Is Successful 값이 false이면 오류 메시지가 반환됩니다.

성공
IsSuccessful boolean

텍스트가 성공적으로 일치하는 경우

라이선스 정보
LicenceInfo string

API 구독 키에 대한 정보

텍스트 결과
TextResult string

추출된 텍스트를 제공된 텍스트 결과 템플릿에 적용하여 생성된 문자열입니다. 페이지 수가 1보다 큰 경우 페이지 구분 기호를 사용하여 모든 페이지를 연결합니다.

Results
TextResults array of object

페이지 목록 및 추출된 텍스트 값이 포함된 배열

(페이지 번호)
TextResults.pageNumber string

텍스트가 발견된 페이지

(페이지 텍스트)
TextResults.valueExtracted string

추출된 텍스트를 제공된 텍스트 결과 템플릿에 적용하여 생성된 문자열입니다.

(영역 값)
TextResults.zoneValues array of string

각 영역에서 추출된 텍스트를 포함하는 배열입니다.

ApiRenameByBarcodePost200ApplicationJsonResponse

Name 경로 형식 Description
바코드
BarcodeResult string

추출된 텍스트를 제공된 바코드 결과 템플릿에 적용하여 생성된 문자열입니다. 페이지 수가 1보다 큰 경우 페이지 구분 기호를 사용하여 모든 페이지를 연결합니다.

Results
BarcodeResults array of object

페이지 목록 및 추출된 바코드 값이 포함된 배열

(페이지 번호)
BarcodeResults.pageNumber string

바코드가 발견된 페이지

(페이지 바코드)
BarcodeResults.valueExtracted string

추출된 바코드 값을 제공된 바코드 결과 템플릿에 적용하여 생성된 문자열입니다.

(영역 값)
BarcodeResults.zoneValues array of string

각 영역에서 추출된 바코드를 포함하는 배열입니다.

오류 메시지
ErrorMessage string

Is Successful 값이 false이면 오류 메시지가 반환됩니다.

성공
IsSuccessful boolean

바코드가 검색된 경우

라이선스 정보
LicenceInfo string

API 구독 키에 대한 정보

ApiSplitPost200ApplicationJsonResponse

Name 경로 형식 Description
오류 메시지
ErrorMessage string

Is Successful 값이 false이면 오류 메시지가 반환됩니다.

성공
IsSuccessful boolean

하나 이상의 분할 페이지가 일치하는 경우 true가 반환됩니다.

라이선스 정보
LicenceInfo string

API 구독 키에 대한 정보

출력 파일 분할
SplittedFile array of object

생성된 파일 이름 및 페이지 번호와 같은 세부 정보와 함께 각 분할 파일을 포함하는 배열입니다.

(파일 콘텐츠)
SplittedFile.SplitFileContent byte

파일 콘텐츠를 나타내는 base 64 문자열

(파일 이름)
SplittedFile.SplitFileName string

생성된 파일 이름을 포함하는 문자열

(페이지 범위)
SplittedFile.pageNumber string

분할 작업의 페이지 번호를 포함하는 페이지 범위

GetPDFInfoResponse

Name 경로 형식 Description
어셈블리 허용
AllowAssembly boolean

페이지의 회전, 삽입 또는 삭제를 허용합니다.

성능 저하 인쇄 허용
AllowDegradedPrinting boolean

저품질 인쇄를 허용합니다.

콘텐츠 추출 허용
AllowExtractContents boolean

텍스트 및 그래픽 추출을 허용합니다.

접근성을 위해 추출 허용
AllowExtractForAccessibility boolean

접근성을 지원하기 위해 텍스트 및 그래픽 추출을 허용합니다.

양식 채우기 허용
AllowFillInForm boolean

양식 필드 채우기를 허용합니다.

주석 수정 허용
AllowModifyAnnotations boolean

주석 수정을 허용합니다.

내용 수정 허용
AllowModifyContents boolean

콘텐츠 수정을 허용합니다.

인쇄 허용
AllowPrinting boolean

고품질 인쇄를 허용합니다.

작성자
Author string

문서를 만든 사람입니다.

만든 날짜
CreationDate string

PDF를 만든 날짜와 시간입니다.

작성자
Creator string

원래 애플리케이션 또는 라이브러리입니다.

오류 메시지
ErrorMessage string

Is Successful 값이 false이면 오류 메시지가 반환됩니다.

파일 크기(바이트)
FileSize number

파일 크기(바이트)

숨겨진 텍스트가 있습니다.
HasHiddenText boolean

PDF 파일에 OCR 계층이 있는 경우 true가 반환됩니다.

암호화됨
IsEncrypted boolean

이 문서가 암호화되었는지 여부에 따라 true가 반환됩니다.

검색 가능
IsSearchable boolean

PDF 파일을 검색할 수 있는 경우 true가 반환됩니다.

성공
IsSuccessful boolean

작업이 성공하면 true를 반환합니다.

키워드
Keywords string

키워드는 쉼표로 구분할 수 있습니다.

라이선스 정보
LicenceInfo string

구독 할당량의 Json 요약입니다.

수정된 날짜
ModifiedDate string

이 속성은 PDF가 마지막으로 수정된 날짜와 시간을 나타냅니다.

페이지 수
NumberofPages integer

PDF 파일의 페이지 수입니다.

PDF 버전
PDFversion number

문서가 빌드된 PDF 사양의 버전입니다.

Producer
Producer string

PDF를 만든 제품입니다. PDF 초기에는 Microsoft Word와 같은 Creator 응용 프로그램을 사용하여 문서를 작성하고, PostScript 파일에 인쇄한 다음, 생산자는 PostScript 파일을 PDF로 변환한 응용 프로그램인 Acrobat 증류소가 됩니다. 요즘 작성자와 생산자는 동일하거나 하나의 필드가 비어 있는 경우가 많습니다.

주제
Subject string

문서에 대한 내용입니다.

제목
Title string

문서의 제목입니다.

갇혀
Trapped string

이 속성은 문서가 트래핑되었는지 여부를 나타내는 부울 값입니다. 트래핑은 잠재적인 레지스터 오류를 모호하게 하기 위해 색 영역을 색 구분에 도입하는 사전 누르기 프로세스입니다.

XMP 메타데이터
XmpMetadata string

XMP(Extensible Metadata Platform)는 디지털 문서 및 데이터 집합에 대한 표준화된 사용자 지정 메타데이터의 생성, 처리 및 교환을 위해 원래 Adobe Systems Inc.에서 만든 ISO 표준입니다.

ocr_response

OCR 작업에 대한 응답 데이터

Name 경로 형식 Description
오류 메시지
ErrorMessage string

Is Successful 값이 false이면 오류 메시지가 반환됩니다.

성공
IsSuccessful boolean

OCR이 성공하면 true를 반환합니다.

라이선스 정보
LicenceInfo string

API 구독 키에 대한 정보

로그 파일 콘텐츠
LogFileContent byte

작업의 로그 내용

처리된 파일 콘텐츠
OutputFileContent byte

Aquaforest PDF 변환기에서 생성된 파일입니다.